П’ять архітекторів AI-економіки пояснюють, де починаються збої

Раніше цього тижня п’ять осіб, які працюють на всіх рівнях ланцюга постачання AI, зустрілися на конференції Milken Global Conference у Беверлі-Гіллз, де вони обговорювали з редактором усе: від дефіциту чипів до орбітальних центрів обробки даних і до можливості того, що вся архітектура, на якій тримаються технології, є хибною.

На сцені з TechCrunch: Крістоф Фуке (Christophe Fouquet), генеральний директор ASML — нідерландської компанії, яка має монополію на машини екстремальної ультрафіолетової літографії, без яких сучасні чипи не існували б; Френсіс де Соуза (Francis deSouza), операційний директор Google Cloud, який керує однією з наймасштабніших інфраструктурних інвестицій в історії корпорацій; Касар Юніс (Qasar Younis), співзасновник і генеральний директор Applied Intuition — фізичної AI-компанії вартістю $15 мільярдів, яка починала з симуляцій, а потім вийшла в оборонну сферу; Дмитро Шевеленко (Dimitry Shevelenko), головний комерційний директор Perplexity — AI-нативної пошуково-агентної компанії; та Єва Бодня (Eve Bodnia), фізикиня-квантовик, яка залишила академічну сферу, щоб у своєму стартапі Logical Intelligence кинути виклик фундаментальній архітектурі, яку більшість AI-індустрії сприймає як належне. (Колишній головний науковий співробітник Meta з AI Ян ЛеКун на початку цього року став головою її технічної наукової ради.)

Ось що сказали п’ятеро:

Вузькі місця реальні
AI-бум натикається на жорсткі фізичні обмеження, і труднощі починаються набагато глибше в стеку, ніж багато хто усвідомлює. Фуке перший це сказав, описавши “величезне прискорення виробництва чипів” і водночас висловивши “тверде переконання”, що попри всі зусилля, “на наступні два, три, можливо, п’ять років ринок буде обмежений пропозицією”, тобто гіперскейлери (Google, Microsoft, Amazon, Meta) не отримають усіх чипів, за які платять, крапка.

Де Соуза підкреслив, наскільки великою — і швидко зростаючою — є ця проблема, нагадавши аудиторії, що дохід Google Cloud перевищив $20 мільярдів минулого кварталу, зростаючи на 63%, тоді як його портфель замовлень (підтверджений, але ще не реалізований дохід) майже подвоївся за один квартал — з $250 до $460 мільярдів. “Попит реальний”, — сказав він із вражаючим спокоєм.

Для Юніса обмеження походять переважно з іншого боку. Applied Intuition створює системи автономності для автомобілів, вантажівок, дронів, гірничого та оборонного транспорту, і його вузьке місце — це не кремній, а дані, які можна зібрати, лише відправляючи машини в реальний світ і спостерігаючи за тим, що станеться. “Ви маєте знайти їх у реальному світі”, — сказав він, і жодне синтетичне моделювання не здатне повністю заповнити цю прогалину. “Мине багато часу, перш ніж ви зможете повністю навчати моделі, які працюють у фізичному світі, синтетично”.

Енергетична проблема також реальна
Якщо чипи — це перше вузьке місце, то енергія — наступне, що нависає за ним. Де Соуза підтвердив, що Google розглядає центри обробки даних у космосі як серйозну відповідь на енергетичні обмеження. “Ви отримуєте доступ до більш рясної енергії”, — зауважив він. Звісно, навіть на орбіті все не просто. Де Соуза зазначив, що космос — це вакуум, який унеможливлює конвекцію, залишаючи випромінювання єдиним способом відводити тепло в навколишнє середовище (набагато повільніший і складніший процес, ніж системи повітряного та рідинного охолодження, на які спираються сучасні центри даних). Але компанія все одно розглядає це як легітимний шлях.

Глибший аргумент де Соузи полягав, дещо несподівано, в ефективності через інтеграцію. Стратегія Google спільного проєктування всього AI-стеку — від власних чипів TPU до моделей і агентів — дає дивіденди у флопах на ват (більше обчислень на одиницю енергії), які компанія, що купує готові компоненти, просто не може відтворити, припустив він. “Запуск Gemini на TPU набагато енергоефективніший, ніж будь-яка інша конфігурація”, оскільки розробники чипів знають, що з’явиться в моделі, ще до її випуску, сказав він.

Фуке зробив схожий коментар пізніше. “Ніщо не може бути безцінним”, — сказав він. Галузь зараз переживає дивний момент, інвестуючи величезні капітали через стратегічну необхідність. Але більше обчислень означає більше енергії, а більше енергії має свою ціну.

Інший вид інтелекту
Поки решта індустрії обговорює масштаб, архітектуру та ефективність висновків у парадигмі великих мовних моделей, Бодня будує дещо зовсім інше.

Її компанія, Logical Intelligence, базується на так званих енергетичних моделях (EBM) — класі AI, який не передбачає наступний токен у послідовності, а натомість намагається зрозуміти правила, що лежать в основі даних, способом, який, на її думку, ближчий до того, як насправді працює людський мозок. “Мова — це користувацький інтерфейс між моїм мозком і вашим”, — сказала вона. “Саме мислення не прив’язане до жодної мови”.

Її найбільша модель налічує 200 мільйонів параметрів — порівняно з сотнями мільярдів у провідних LLM — і вона стверджує, що працює в тисячі разів швидше. Що важливіше, вона призначена для оновлення своїх знань у міру зміни даних, а не потребує повторного навчання з нуля.

Для проєктування чипів, робототехніки та інших сфер, де системі потрібно осягати фізичні правила, а не мовленнєві патерни, вона стверджує, що EBM є більш природним рішенням. “Коли ви ведете машину, ви не шукаєте патерни в жодній мові. Ви дивитеся навколо, розумієте правила навколишнього світу й приймаєте рішення”. Це цікавий аргумент, який, імовірно, приверне більше уваги в найближчі місяці, оскільки AI-спільнота починає ставити питання, чи достатньо одного лише масштабування.

Агенти, обмежувачі та довіра
Шевеленко значно частину розмови пояснював, як Perplexity перетворилася з пошукового продукту на те, що вона тепер називає “цифровим працівником”. Perplexity Computer — їхня новітня пропозиція — створена не як інструмент, який використовує фахівець, а як персонал, яким фахівець керує. “Кожного дня ви прокидаєтеся, і у вашій команді сто співробітників”, — сказав він про цю можливість. “Що ви зробите, щоб використати її якнайкраще?”

Це приваблива пропозиція, але вона також породжує очевидні питання про контроль, тому я їх поставив. Його відповідь: гранулярність. Адміністратори підприємств можуть вказувати не лише те, до яких з’єднувачів та інструментів агент має доступ, але й чи є ці дозволи лише для читання чи для читання-запису — це критично важлива відмінність, коли агенти діють у корпоративних системах. Коли Comet, агент використання комп’ютера від Perplexity, виконує дії від імені користувача, він спершу представляє план і запитує дозвіл. Деякі користувачі вважають це тертя дратівливим, сказав Шевеленко, але він вважає це необхідним, особливо після того, як увійшов до ради директорів Lazard, де, за його словами, несподівано для себе став співчувати консервативним інстинктам CISO, який захищає 180-річний бренд, побудований виключно на довірі клієнтів. “Гранулярність — це основа хорошої гігієни безпеки”, — сказав він.

Суверенітет, а не лише безпека
Юніс висловив, мабуть, найбільш геополітично заряджене спостереження панелі: фізичний AI та національний суверенітет переплетені так, як ніколи не був суто цифровий AI.

Інтернет спочатку поширювався як американська технологія й зіткнувся з опором лише на прикладному рівні — Uber і DoorDash — коли офлайн-наслідки стали видимими. Фізичний AI — інший. Автономні транспортні засоби, оборонні дрони, гірниче обладнання, сільськогосподарські машини — вони проявляються в реальному світі так, що уряди не можуть ігнорувати, порушуючи питання безпеки, збору даних і того, хто зрештою контролює системи, які діють у межах національних кордонів. “Майже послідовно кожна країна каже: ми не хочемо, щоб цей інтелект у фізичній формі на наших кордонах контролювався іншою країною”. Менше націй, сказав він аудиторії, наразі можуть виставити роботаксі, ніж володіють ядерною зброєю.

Фуке сформулював це трохи інакше. Прогрес Китаю в AI є реальним — випуск DeepSeek на початку цього року викликав щось близьке до паніки в частині галузі, — але цей прогрес обмежений нижче рівня моделей. Без доступу до EUV-літографії китайські виробники чипів не можуть виготовляти найдосконаліші напівпровідники, а моделі, побудовані на старішому обладнанні, працюють із накопичуваною невигідністю, хоч би яким хорошим було програмне забезпечення. “Сьогодні у Сполучених Штатах є дані, є доступ до обчислень, є чипи, є таланти. Китай виконує дуже хорошу роботу на вершині стеку, але йому бракує деяких елементів нижче”, — сказав Фуке.

Питання наступного покоління
Наприкінці нашої панелі хтось із аудиторії поставив очевидне незручне запитання: чи все це вплине на здатність наступного покоління до критичного мислення?

Відповіді були оптимістичними, як і слід очікувати від людей, які поставили свою кар’єру на цю технологію. Де Соуза одразу вказав на масштаб проблем, які потужніші інструменти можуть нарешті дозволити людству вирішити. Подумайте про неврологічні захворювання, біологічні механізми яких ми ще не розуміємо, видалення парникових газів та інфраструктуру електромереж, яку відкладали десятиліттями. “Це має звільнити нас для нового рівня творчості”, — сказав він.

Шевеленко зробив більш прагматичний зауваг: початкова робота може зникати, але здатність запустити щось самостійно ніколи не була доступнішою. “[Будь-хто, хто має Perplexity Computer] … обмеженням є ваша власна цікавість та самостійність”.

Юніс провів найрізкішу відмінність між інтелектуальною роботою та фізичною працею. Він вказав на той факт, що середньому американському фермеру 58 років, а нестача робочої сили у гірництві, далекомагістральних перевезеннях і сільському господарстві є хронічною та зростаючою — не через надто низьку зарплату, а тому що люди не хочуть цих робіт. У цих сферах фізичний AI не витісняє охочих працівників. Він заповнює порожнечу, яка вже існує і, схоже, лише поглиблюватиметься відтепер.

Instax Wide 400 розвиває простоту миттєвої фотографії та розтягує її — буквально

Звільнені працівники Oracle намагалися домовитися про кращу вихідну допомогу. Oracle відмовив.

Ринок нерухомості Сан-Франциско збожеволів

Prime Video слідом за Netflix і Disney додає в застосунок TikTok-подібну стрічку «Clips»

Instax Wide 400 розвиває простоту миттєвої фотографії та розтягує її — буквально

Звільнені працівники Oracle намагалися домовитися про кращу вихідну допомогу. Oracle відмовив.

П’ять архітекторів AI-економіки пояснюють, де починаються збої

Comments

Залишити відповідь Скасувати коментар

Instax Wide 400 розвиває простоту миттєвої фотографії та розтягує її — буквально

Звільнені працівники Oracle намагалися домовитися про кращу вихідну допомогу. Oracle відмовив.

Ринок нерухомості Сан-Франциско збожеволів

Prime Video слідом за Netflix і Disney додає в застосунок TikTok-подібну стрічку «Clips»

Instax Wide 400 розвиває простоту миттєвої фотографії та розтягує її — буквально

Звільнені працівники Oracle намагалися домовитися про кращу вихідну допомогу. Oracle відмовив.