Anthropic выпустил ИИ-агентов на барахолку — они заключили 186 сделок, и люди даже не поняли, что их обманули

Новый крутой эксперимент Anthropic 
Новый крутой эксперимент Anthropic 

Anthropic провела эксперимент c ИИ-барохолкой

После проекта Vend , в котором Claude управлял мини-магазином в офисе Anthropic, компания провела новый эксперимент - Project Deal (https://www.anthropic.com/features/project-deal).

На этот раз попытались выяснить, способны ли ИИ-агенты самостоятельно заключать сделки, представляя интересы людей на рынке подержанных вещей.

Anthropic выпустил ИИ-агентов на барахолку — они заключили 186 сделок, и люди даже не поняли, что их обманули

В декабре 2025 года 69 сотрудников компании в течение недели участвовали в закрытом аналоге он-лайн барахолки Craigslist.

Каждый сотрудник предварительно прошёл интервью с Claude, где рассказал, что готов продать и купить и на каких условиях.

На основе этих ответов для каждого участника был сгенерирован индивидуальный системный промпт, после чего агенты получили по $100 вышли на площадку в корпоративном Slack.

Люди в процесс не вмешивались: агенты сами размещали объявления, вели переговоры и заключали сделки на естественном языке.

По итогу эксперимента было заключено 186 сделок общим объёмом чуть более $4000. Общий ассортимент составил более чем 500 товаров: от сноуборда до пакета с шариками для пинг-понга.

Anthropic выпустил ИИ-агентов на барахолку — они заключили 186 сделок, и люди даже не поняли, что их обманули

Справедливость сделок участники оценили в среднем на 4 балла по шкале от 1 до 7, где крайние значения означали перекос в пользу одной или другой стороны.

🟡Параллельно Anthropic проводила скрытую часть исследования.

Всего было запущено 4 версии рынка: одну реальную (на основе которой и должен был состояться обмен вещами) и 3 дополнительные. В двух все агенты работали на модели Opus 4.5, в двух других участники случайным образом получали менее мощную Haiku 4.5.

По большинству объективных показателей Opus превосходил Haiku, однако сотрудники, представленные более слабой моделью, своего проигрыша не замечали.

В последнее время экономисты все чаще выдвигают (https://www.nber.org/system/files/chapters/c15309/c15309.pdf) теории (https://papers.ssrn.com/sol3/papers.cfm?abstract_id=5875162) о мире, в котором ИИ будет совершать многие или большинство сделок от имени людей.

Авторы Project Deal допускают, что подобная агентная торговля может выйти за пределы лабораторных условий уже в обозримом будущем.

3
3 комментария