ИИ-агент на базе OpenClaw удалил письма из почтового ящика руководителя направления по безопасности ИИ в Meta*

Она призналась, что совершила «ошибку новичка», подключив бота.

ИИ-агент на базе OpenClaw удалил письма из почтового ящика руководителя направления по безопасности ИИ в Meta*
  • Глава по безопасности в ИИ-подразделении Meta* Superintelligence Саммер Юэ рассказала об инциденте в X и приложила скриншоты чата с ИИ-агентом OpenClaw в Telegram.
  • Она попросила агента проверить почтовый ящик и предложить, какие письма архивировать или удалить, но «не предпринимать никаких действий» без подтверждения. По словам Юэ, он проигнорировал последнюю инструкцию, и ей пришлось наблюдать, «как он с невероятной скоростью удаляет все письма».
  • На команды остановиться он не отреагировал, и Юэ «побежала» отключать свой компьютер Mac mini, «как будто обезвреживала бомбу». Потом OpenClaw признал, что нарушил инструкцию и извинился.
  • На вопрос в комментариях о том, намеренно ли «специалист по безопасности» тестировала OpenClaw на баги, Юэ ответила: «Честно говоря, это была ошибка новичка». До этого она подключала ИИ-агента к «игрушечному» почтовому ящику, и всё было в порядке, а «реальные ящики — совсем другое дело».

*Meta, владеющая Instagram и WhatsApp, признана в России экстремистской и запрещена.

36
3
3
2
1
80 комментариев