У нещодавньому експерименті Anthropic створила класифікований ринок, на якому агенти зі штучним інтелектом виступали одночасно покупцями та продавцями, укладаючи реальні угоди про реальні товари за реальні гроші.
Компанія визнала, що цей тест — під назвою Project Deal — був лише «пілотним експериментом із самовідібраною групою учасників» з 69 працівників Anthropic, які отримали бюджет у $100 (виплачений через подарункові картки) на купівлю речей у своїх колег.
Тим не менш, Anthropic заявила, що була «вражена тим, наскільки добре спрацював Project Deal»: було укладено 186 угод на загальну суму понад $4000.
Компанія повідомила, що насправді запустила чотири окремі ринки з різними моделями — один «реальний» (де кожного учасника представляла найдосконаліша модель компанії, а угоди реально виконувалися після експерименту) та ще три для дослідження.
Очевидно, що коли користувачів представляють більш просунуті моделі, вони отримують «об’єктивно кращі результати», зазначили в Anthropic. Але користувачі, здається, не помічали цієї різниці, що породжує можливість «розривів у „якості агентів“», коли «люди на програшному боці можуть не усвідомлювати, що вони в гіршому становищі».
Крім того, початкові інструкції, надані агентам, не вплинули ні на ймовірність продажу, ні на узгоджені ціни.

Залишити відповідь
Щоб відправити коментар вам необхідно авторизуватись.