Anthropic рассказала, что её модель Claude Mythos обнаружила «тысячи» уязвимостей нулевого дня — в том числе во всех основных ОС и браузерах
Модель будет закрытой, её смогут протестировать только участники анонсированного Project Glasswing — в задачах по кибербезопасности.
Сравнение результатов Mythos Preview и Opus 4.6 по бенчмарку CyberGym для оценки возможностей ИИ-агентов в сфере кибербезопасности. Источник: Anthropic
- Компания анонсировала Project Glasswing — проект с участием Amazon Web Services, Anthropic, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, Nvidia и Palo Alto Networks для обеспечения безопасности «наиболее важного ПО в мире».
- На его создание натолкнули результаты публично невыпущенной модели общего назначения Claude Mythos от Anthropic. По словам компании, в течение нескольких недель её превью-версия выявила «тысячи» уязвимостей нулевого дня, в том числе «во всех основных ОС и веб-браузерах». Разработчики отметили, что модель смогла выявить «почти все» из них и разработать множество эксплойтов без какого-либо участия человека.
- Claude Mythos Preview не была специально обучена для задач по кибербезопасности, отмечает The Verge. По словам компании, это результат «сильных навыков агентного программирования и навыков рассуждения».
Сравнение результатов Mythos Preview и Opus 4.6 по некоторым бенчмаркам для оценки agentic coding. Источник: Anthropic
- Anthropic не планирует открывать всем доступ к Claude Mythos Preview. Участники проекта Glasswing будут использовать её для задач по кибербезопасности, ещё более 40 организаций, которые работают с критически важной инфраструктурой, — для защиты своих и open-source систем.
- Компания выделит до $100 млн в виде кредитов на использование модели в рамках этих проектов. После тестового периода цена Claude Mythos Preview для участников составит $25 за 1 млн входных и $125 за 1 млн выходных токенов. Ещё $4 млн Anthropic перечислила организациям, которые занимаются безопасностью открытого ПО: Alpha-Omega, OpenSSF и Apache Software Foundation.
- В будущем Anthropic планирует делиться информацией об исправленных уязвимостях и улучшениях, о которых можно рассказать публично, а также разработать рекомендации по улучшению безопасности «в эпоху ИИ». Кроме того, компания находится в диалоге с правительством США по поводу возможностей Claude Mythos Preview.
62 комментария