Оскільки зростає попит на навчання та вдосконалення моделей ШІ, Deccan AI — стартап, який надає послуги з пост-тренувального постачання даних та оцінювання, — залучив 25 мільйонів доларів у своєму першому великому раунді фінансування, причому значна частина цієї роботи виконується експертами на основі робочої сили в Індії.
Раунд серії А на основі акцій очолила компанія A91 Partners, за участі Susquehanna International Group та Prosus Ventures.
У той час як передові ШІ-лабораторії, включаючи OpenAI та Anthropic, створюють основні моделі власними силами, значна частина пост-тренувальної роботи — від генерації даних до оцінювання та навчання з підкріпленням — дедалі частіше передається на аутсорсинг, оскільки компанії прагнуть зробити системи надійними в реальному використанні. Deccan стає одним із нової групи стартапів, що обслуговують цей попит.
Заснований у жовтні 2024 року, Deccan надає послуги, що варіюються від допомоги моделям у покращенні можливостей кодування та агентів до навчання систем взаємодії із зовнішніми інструментами, такими як інтерфейси прикладного програмування (API), які підключають моделі ШІ до програмних систем.
Стартап працює з передовими лабораторіями над такими завданнями, як генерування експертних відгуків, проведення оцінювання та створення середовищ для навчання з підкріпленням, а також обслуговує підприємства через свої продукти, включаючи пакет оцінювання Helix та платформу автоматизації операцій. Робота також еволюціонує в міру того, як моделі виходять за межі тексту в так звані «світові моделі», які краще розуміють фізичне середовище, включаючи робототехніку та системи зору.
За словами компанії, до клієнтів Deccan входять Google DeepMind та Snowflake. Засновник Рукеш Редді (зображений вище) в інтерв’ю зазначив, що стартап має близько 10 клієнтів і в будь-який час веде кілька десятків активних проєктів.
Стартап зі штаб-квартирою в районі затоки Сан-Франциско та великою операційною командою в Хайдарабаді налічує близько 125 співробітників і покладається на мережу з понад 1 мільйона учасників, включаючи студентів, експертів у певних галузях та докторів наук. Редді повідомив TechCrunch, що в типовому місяці активними є від 5000 до 10 000 учасників.
Редді зазначив, що близько 10% бази учасників Deccan мають вищі наукові ступені, такі як магістри та доктори філософії, хоча їхня частка серед активних учасників вища і залежить від вимог проєкту.
Ринок послуг з навчання ШІ стрімко розширився разом із появою великих мовних моделей, причому такі компанії, як Scale AI (належить Meta) та її конкурент Surge AI, а також стартапи Turing і Mercor конкурують за надання послуг з маркування даних, оцінювання та навчання з підкріпленням.
«Якість залишається невирішеною проблемою», — сказав Редді, додавши, що толерантність до помилок у пост-тренуванні «близька до нуля», оскільки помилки можуть безпосередньо вплинути на продуктивність моделі у виробництві. Це робить пост-тренування складнішим, ніж попередні етапи, вимагаючи високоточних, специфічних для предметної області даних, які важче масштабувати.
Він також зазначив, що робота є дуже чутливою до часу: ШІ-лабораторії іноді потребують великих обсягів високоякісних даних протягом кількох днів, що ускладнює баланс між швидкістю та точністю.
Сектор стикався з критикою щодо умов праці та оплати, причому для генерації тренувальних даних часто використовуються великі пули працівників на фрілансі. Редді зазначив, що заробіток на платформі Deccan коливається від 10 до 700 доларів за годину, а найкращі учасники заробляють до 7000 доларів на місяць.
Хоча її клієнти переважно є американськими ШІ-лабораторіями, більшість учасників Deccan базуються в Індії. Конкуренти, такі як Turing та Mercor, також залучають підрядників з цієї країни, але діють на ширшому наборі ринків, що розвиваються.
Редді сказав, що Deccan вирішив зосередити значну частину своєї робочої сили в Індії, щоб краще керувати якістю. «Багато наших конкурентів їдуть у понад 100 країн, щоб знайти експертів», — сказав він. «Якщо у вас є операції лише в одній країні, підтримувати якість стає набагато легше».
Такий підхід підкреслює поточне становище Індії в глобальному ланцюжку створення вартості ШІ — як постачальника талантів і тренувальних даних, а не розробника передових моделей, які залишаються зосередженими серед жменьки американських компаній і кількох гравців у Китаї.
Однак Редді сказав, що Deccan почав залучати таланти з кількох інших ринків, включаючи США, для вузькоспеціалізованих знань у галузі геопросторових даних та дизайну напівпровідників.
Редді зазначив, що Deccan був створений як «народжений GenAI» стартап, на відміну від традиційних фірм з маркування даних, які розпочинали із завдань комп’ютерного зору. Це означає, що він з самого початку зосередився на висококваліфікованій роботі.
Редді сказав, що Deccan зріс у 10 разів за останній рік і зараз має річний темп доходу в десятки мільйонів доларів, відмовившись надати конкретні цифри. Він додав, що близько 80% доходу припадає на п’ять найбільших клієнтів, що відображає концентрований характер ринку передового ШІ.

Залишити відповідь