Двое из ларца: Почему современные AI-агенты всё еще работают по ГОСТу СССР

Если вы думаете, что AI-агенты (AutoGPT, BabyAGI и прочие) — это прорыв последних лет, то вы просто не смотрели советскую классику. В 1965 году в мультфильме «Вовка в Тридевятом царстве» была показана идеальная архитектура автономного агента. И, судя по качеству выдачи современных LLM, разработчики вдохновлялись именно этим кейсом.

Анатомия AI-агента «из ларца»:

Голосовой интерфейс (LLM): Понимают человеческую речь, но интерпретируют её через призму своих весов и галлюцинаций.
Action Space (Инструменты): Имеют доступ к топорам, тесту и печам.
Loop (Цикл): Будут повторять действие до тех пор, пока их не остановят или пока не закончится «контекстное окно».

В чем главная проблема? Весь нынешний AdTech и DevTools рынок сейчас пытается решить проблему «плохого качества». Агенты работают быстро, задорно, энергично — но результат часто требует полной переработки. Как и в случае с Вовкой, проблема не в инструменте, а в Alignment (согласовании целей).

Почему мы всё еще там? Мы научили нейронки «делать», но всё еще учим их «понимать нюансы».

Агент видит задачу «привлечь трафик» и может слить бюджет на фрод (порубить избу).
Агент видит задачу «написать код» и пишет его без учета архитектуры проекта (замесил тесто вместе с кадушкой).

Ирония судьбы: Мы стремимся к полной автономии, но реальный профит сейчас получают те, кто использует агентов как «подмастерьев», а не как полную замену мозгу. Весело? Да. Быстро? Очень. Но переделывать всё равно придется вам.

В эпоху AI мы все немного Вовки: хотим, чтобы «само», но в итоге учимся работать руками (и головой) в десять раз эффективнее, чтобы просто управлять этими двоими.

Как вы боретесь с «синдромом из ларца» у своих нейронок? Поделитесь кейсами факапов в комментариях.