Оскільки рівень дефолтів приватних компаній перевищує 9,2% — найвищий показник за роки — венчурна фірма Lux Capital нещодавно порадила компаніям, які покладаються на ШІ, отримати письмове підтвердження своїх зобов’язань щодо обчислювальних потужностей. Зважаючи на фінансову нестабільність, що поширюється по всьому ланцюгу постачання ШІ, попередили в Lux Capital, простої домовленості за рукостискання недостатньо.
Але є й зовсім інший варіант — повністю припинити покладатися на зовнішню обчислювальну інфраструктуру. Менші ШІ-моделі, які працюють безпосередньо на пристрої користувача — без центру обробки даних, без хмарного провайдера, без ризику контрагента — стають достатньо добрими, щоб їх варто було розглянути. І Multiverse Computing заявляє про себе.
Іспанський стартап донедавна тримався в тіні порівняно з деякими своїми конкурентами, але зі зростанням попиту на ефективність ШІ це змінюється. Після стиснення моделей від провідних ШІ-лабораторій, включаючи OpenAI, Meta, DeepSeek та Mistral AI, компанія запустила як додаток, що демонструє можливості її стиснутих моделей, так і API-портал — шлюз, який дає розробникам доступ до цих моделей та можливість створювати на їх основі, що робить їх більш широкодоступними.
Додаток CompactifAI, який має спільну назву з квантово-надиханою технологією стиснення Multiverse, є ШІ-інструментом для чату в дусі ChatGPT або Le Chat від Mistral. Ви ставите запитання, модель відповідає. Різниця в тому, що Multiverse вбудувала Gilda — модель, настільки малу, що вона може працювати локально та в режимі офлайн, за словами компанії.
Для кінцевих користувачів це знайомство з периферійним ШІ, де дані не залишають їхні пристрої та не потребують підключення. Але є застереження: їхні мобільні пристрої повинні мати достатньо оперативної пам’яті та сховища. Якщо ні — а багато старіших iPhone не мають — додаток перемикається назад на хмарні моделі через API. Маршрутизація між локальною та хмарною обробкою автоматично керується системою, яку Multiverse назвала Ash Nazg, — назва, яка напевно видасться знайомою шанувальникам Толкіна, оскільки відсилає до напису на Єдиному Персні у “Володарі Перснів”. Але коли додаток перемикається на хмару, він втрачає свою головну перевагу в приватності.
Ці обмеження означають, що CompactifAI ще не зовсім готова до масового впровадження серед споживачів, хоча це, можливо, ніколи і не було метою. Згідно з даними Sensor Tower, за останній місяць додаток завантажили менш ніж 5000 разів.
Справжньою цільовою аудиторією є бізнес. Сьогодні Multiverse запускає самодостатній API-портал, який надає розробникам та підприємствам прямий доступ до її стиснутих моделей — без потреби в AWS Marketplace.
“API-портал CompactifAI [тепер] дає розробникам прямий доступ до стиснутих моделей із прозорістю та контролем, необхідними для їх використання в робочих середовищах”, — заявив у коментарі генеральний директор Енріке Лісасо.
Моніторинг використання в реальному часі є однією з ключових функцій API, і це не випадково. Поруч із потенційними перевагами розгортання на периферії, нижчі витрати на обчислення є однією з головних причин, чому підприємства розглядають менші моделі як альтернативу великим мовним моделям (LLM).
Допомагає також те, що малі моделі тепер менш обмежені, ніж раніше. Раніше цього тижня Mistral оновила своє сімейство малих моделей, запустивши Mistral Small 4, яка, за її словами, одночасно оптимізована для загальних чатів, програмування, агентних завдань та міркувань. Французька компанія також випустила Forge — систему, що дозволяє підприємствам створювати спеціалізовані моделі, зокрема малі моделі, для яких вони можуть обирати компроміси, які найкраще підходять для їхніх випадків використання.
Нещодавні результати Multiverse також свідчать про те, що розрив з LLM скорочується. Її остання стиснута модель, HyperNova 60B 2602, побудована на основі gpt-oss-120b — моделі OpenAI, базовий код якої є загальнодоступним. Компанія стверджує, що тепер вона забезпечує швидші відповіді за нижчої вартості, ніж оригінал, від якого вона походить, — перевага, яка має особливе значення для агентних робочих процесів програмування, де ШІ автономно виконує складні багатоетапні завдання.
Зробити моделі достатньо малими для роботи на мобільних пристроях, зберігаючи при цьому корисність, є великим викликом. Apple Intelligence обійшла цю проблему, поєднавши модель на пристрої та хмарну модель. Додаток Multiverse CompactifAI також може направляти запити до gpt-oss-120b через API, але його головна мета — продемонструвати, що локальні моделі, такі як Gilda та її майбутні заміни, мають переваги, які виходять за межі економії коштів.
Для працівників критичних галузей модель, яка може працювати локально та без підключення до хмари, пропонує більшу приватність та стійкість. Але більша цінність полягає в бізнес-випадках використання, які це може відкрити — наприклад, вбудовування ШІ в дрони, супутники та інші середовища, де на підключення не можна покладатися.
Компанія вже обслуговує понад 100 глобальних клієнтів, включаючи Bank of Canada, Bosch та Iberdrola, але розширення клієнтської бази може допомогти їй залучити додаткове фінансування. Після того, як минулого року вона залучила $215 мільйонів у рамках серії B, зараз ходять чутки, що вона збирає новий раунд фінансування на €500 мільйонів за оцінки понад €1,5 мільярда.

Залишити відповідь