Anthropic представили Claude Mythos Preview и ограничили доступ к модели

Anthropic вчера тихо показали Claude Mythos Preview и тут же сказали, что никому его не дадут.

Anthropic выложили PDF на 240 страниц с бенчмарками и отчётом о безопасности. Если коротко: на SWE-bench Verified — 93.9% (у Opus 4.6 — 80.8%). На SWE-bench Pro — 77.8% против 53.4% у Opus 4.6 и 57.7% у GPT-5.4. На Humanity's Last Exam — 64.7% с инструментами. На Terminal-Bench 2.0 — 82%.

Но самое интересное не в цифрах.

Anthropic решили, что модель слишком хороша в кибербезопасности, чтобы выпускать её в открытый доступ. Mythos автономно находит zero-day уязвимости в операционных системах и браузерах и сам пишет эксплойты. Opus 4.6 из сотен попыток смог написать рабочий эксплойт для Firefox дважды. Mythos — 181 раз.

Николас Карлини из Anthropic (исследователь безопасности AI): “Я нашёл больше багов за последние пару недель, чем за всю жизнь до этого”. Команда откопала 27-летнюю уязвимость в OpenBSD (баг в TCP SACK валидации), лежавший с 1999 года. Нашли дыры в каждой крупной ОС и каждом крупном браузере. Некоторым из этих уязвимостей по 10-20 лет.

Вместо релиза Anthropic запустили “Project Glasswing” — оборонительный проект: модель дают только тем, кто защищает критическую инфраструктуру. В проект вошли AWS, Apple, Microsoft, Google, Nvidia, CrowdStrike, Cisco, JPMorgan, Linux Foundation и ещё 40+ организаций.

Грег Кроа-Хартман, второй человек после Линуса Торвальдса в разработке Linux, говорит, что ещё пару месяцев назад от AI приходили мусорные отчёты об уязвимостях, а потом в какой-то момент модели подросли, и пошли действительно настоящие баги. И много!

Когда Mythos появится для обычных пользователей неизвестно. Anthropic говорят, что сначала нужны новые защитные механизмы. В общем, по ощущениям не скоро.

Подписывайтесь на Telegram ИИволюция 👾.