Anthropic надає Claude Code більше контролю, але тримає на повідку

Фото для новини: Anthropic надає Claude Code більше контролю, але тримає на повідку

Anthropic hands Claude Code more control, but keeps it on a leash

Для розробників, які використовують ШІ, «вайб-кодинг» (vibe coding) зараз зводиться до контролю кожної дії або ризику дозволити моделі діяти безконтрольно. Anthropic заявляє, що її останнє оновлення для Claude має на меті усунути необхідність вибору, дозволяючи ШІ самостійно визначати, які дії безпечно виконувати — з певними обмеженнями.

Цей крок відображає ширший зсув у галузі, оскільки інструменти ШІ дедалі частіше розробляються для дії без очікування схвалення людиною. Виклик полягає в балансуванні швидкості та контролю: надто багато обмежень сповільнює роботу, а надто мало — робить системи ризикованими та непередбачуваними. Новий «автоматичний режим» (auto mode) Anthropic, який зараз доступний у попередньому перегляді для дослідників (тобто доступний для тестування, але ще не є готовим продуктом), є останньою спробою знайти цей баланс.

Автоматичний режим використовує захисні механізми ШІ для перевірки кожної дії перед її виконанням, виявляючи ризиковану поведінку, яку користувач не запитував, та ознаки ін’єкції підказок (prompt injection) — типу атаки, коли зловмисні інструкції приховані в контенті, який обробляє ШІ, змушуючи його виконувати непередбачувані дії. Будь-які безпечні дії виконуватимуться автоматично, тоді як ризиковані блокуватимуться.

По суті, це розширення існуючої команди Claude Code «dangerously-skip-permissions», яка передає все прийняття рішень ШІ, але з доданим шаром безпеки.

Ця функція базується на хвилі автономних інструментів кодування від таких компаній, як GitHub та OpenAI, які можуть виконувати завдання від імені розробника. Але вона робить крок далі, передаючи рішення про те, коли запитувати дозвіл, від користувача самому ШІ.

Anthropic не деталізувала конкретні критерії, які її захисний шар використовує для розрізнення безпечних та ризикованих дій — те, що розробники, ймовірно, захочуть краще зрозуміти, перш ніж широко впроваджувати цю функцію. (TechCrunch звернувся до компанії за додатковою інформацією з цього питання.)

Автоматичний режим з’явився після запуску Anthropic Claude Code Review — автоматичного рецензента коду, розробленого для виявлення помилок до того, як вони потраплять у кодову базу, та Dispatch for Cowork, який дозволяє користувачам надсилати завдання ШІ-агентам для виконання роботи від їхнього імені.

Автоматичний режим буде доступний корпоративним користувачам та користувачам API протягом найближчих днів. Компанія заявляє, що наразі він працює лише з Claude Sonnet 4.6 та Opus 4.6, і рекомендує використовувати нову функцію в «ізольованих середовищах» — пісочницях, які відокремлені від виробничих систем, що обмежує потенційну шкоду в разі помилки.

Comments

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *