Більшість корпоративних ШІ-проєктів зазнають невдачі не тому, що компаніям бракує технологій, а тому, що використовувані моделі не розуміють їхнього бізнесу. Моделі часто навчаються на даних з інтернету, а не на десятиліттях внутрішніх документів, робочих процесів та інституційних знань.
Саме в цій прогалині французький ШІ-стартап Mistral бачить можливість. У вівторок компанія анонсувала Mistral Forge — платформу, яка дозволяє підприємствам створювати індивідуальні моделі, навчені на їхніх власних даних. Mistral оголосила про платформу на Nvidia GTC, щорічній технологічній конференції Nvidia, яка цього року значною мірою зосереджена на ШІ та агентних моделях для підприємств.
Це цілеспрямований крок для Mistral — компанії, яка побудувала свій бізнес на корпоративних клієнтах, тоді як конкуренти OpenAI та Anthropic значно випередили її у споживчому впровадженні. Генеральний директор Артур Менш стверджує, що зосередженість Mistral на підприємствах працює: цього року компанія має намір перевищити $1 мільярд щорічного повторюваного доходу.
Великою частиною стратегії посилення позицій у корпоративному секторі є надання компаніям більшого контролю над їхніми даними та системами ШІ, стверджує Mistral.
«Forge дозволяє підприємствам і урядам налаштовувати моделі ШІ відповідно до їхніх специфічних потреб», — розповіла TechCrunch Еліза Саламанка, керівниця продуктів Mistral.
Кілька компаній у сфері корпоративного ШІ вже заявляють, що пропонують подібні можливості, але більшість з них зосереджуються на донавчанні існуючих моделей або нашаруванні пропрієтарних даних за допомогою таких технік, як доповнений пошук (RAG). Ці підходи не переучують моделі фундаментально; натомість вони адаптують їх або надсилають запити до них під час виконання з використанням даних компанії.
Mistral, навпаки, заявляє, що дозволяє компаніям навчати моделі з нуля. Теоретично це може вирішити деякі обмеження більш поширених підходів — наприклад, краще опрацювання неанглійських або вузькоспеціалізованих даних і більший контроль над поведінкою моделі. Це також може дозволити компаніям навчати агентні системи з використанням навчання з підкріпленням і зменшити залежність від сторонніх постачальників моделей, уникаючи таких ризиків, як зміни моделі або її припинення.
Клієнти Forge можуть створювати свої індивідуальні моделі, використовуючи велику бібліотеку ШІ-моделей з відкритою вагою від Mistral, яка включає невеликі моделі, такі як нещодавно представлена Mistral Small 4. За словами співзасновника та технічного директора Mistral Тімоте Лакруа, Forge може допомогти отримати більше цінності від існуючих моделей.
«Компроміси, на які ми йдемо, коли створюємо менші моделі, полягають у тому, що вони просто не можуть бути настільки ж хорошими в кожній темі, як їхні більші аналоги, тому можливість їх налаштовувати дозволяє нам обирати, на чому робити акцент, а що опускати», — сказав Лакруа.
Mistral надає консультації щодо того, які моделі та інфраструктуру використовувати, але обидва рішення залишаються за клієнтом, зазначив Лакруа. І для команд, яким потрібно більше, ніж просто консультації, Forge пропонує команду інженерів попереднього розгортання (forward-deployed engineers) від Mistral, які безпосередньо інтегруються з клієнтами, щоб виявити відповідні дані та адаптуватися до їхніх потреб — модель, запозичена у таких компаній, як IBM і Palantir.
«Як продукт, Forge вже постачається з усіма інструментами та інфраструктурою, щоб ви могли генерувати синтетичні конвеєри даних», — сказала Саламанка. «Але розуміння того, як створювати правильні оцінки та забезпечувати наявність потрібної кількості даних, — це те, в чому підприємства зазвичай не мають достатньої експертизи, і саме це забезпечують інженери попереднього розгортання».
Mistral вже надала доступ до Forge партнерам, зокрема Ericsson, Європейському космічному агентству, італійській консалтинговій компанії Reply, а також сингапурським DSO і HTX. Серед ранніх користувачів також ASML — нідерландський виробник чіпів, який очолив раунд серії C Mistral минулого вересня за оцінки в €11.7 мільярда (приблизно $13.8 мільярда на той час).
Ці партнерства є показовими для того, якими, на думку Mistral, будуть основні випадки використання Forge. За словами комерційного директора Mistral Марджорі Яневич, до них належать: уряди, яким потрібно адаптувати моделі до своєї мови та культури; фінансові гравці з високими вимогами відповідності; виробники з потребами кастомізації; та технологічні компанії, яким потрібно налаштовувати моделі під свою базу коду.

Залишити відповідь