Anthropic рассказала, что её модель Claude Mythos обнаружила «тысячи» уязвимостей нулевого дня — в том числе во всех основных ОС и браузерах

Модель будет закрытой, её смогут протестировать только участники анонсированного Project Glasswing — в задачах по кибербезопасности.

Сравнение результатов Mythos Preview и Opus 4.6 по бенчмарку <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fwww.cybergym.io%2F&amp%3BpostId=2856643&postId=2856643" rel="nofollow noreferrer noopener" target="_blank">CyberGym </a>для оценки возможностей ИИ-агентов в сфере кибербезопасности. Источник: Anthropic

Компания анонсировала Project Glasswing — проект с участием Amazon Web Services, Anthropic, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, Nvidia и Palo Alto Networks для обеспечения безопасности «наиболее важного ПО в мире».
На его создание натолкнули результаты публично невыпущенной модели общего назначения Claude Mythos от Anthropic. По словам компании, в течение нескольких недель её превью-версия выявила «тысячи» уязвимостей нулевого дня, в том числе «во всех основных ОС и веб-браузерах». Разработчики отметили, что модель смогла выявить «почти все» из них и разработать множество эксплойтов без какого-либо участия человека.
Claude Mythos Preview не была специально обучена для задач по кибербезопасности, отмечает The Verge. По словам компании, это результат «сильных навыков агентного программирования и навыков рассуждения».

Сравнение результатов Mythos Preview и Opus 4.6 по некоторым бенчмаркам для оценки agentic coding. Источник: Anthropic

Anthropic не планирует открывать всем доступ к Claude Mythos Preview. Участники проекта Glasswing будут использовать её для задач по кибербезопасности, ещё более 40 организаций, которые работают с критически важной инфраструктурой, — для защиты своих и open-source систем.
Компания выделит до $100 млн в виде кредитов на использование модели в рамках этих проектов. После тестового периода цена Claude Mythos Preview для участников составит $25 за 1 млн входных и $125 за 1 млн выходных токенов. Ещё $4 млн Anthropic перечислила организациям, которые занимаются безопасностью открытого ПО: Alpha-Omega, OpenSSF и Apache Software Foundation.
В будущем Anthropic планирует делиться информацией об исправленных уязвимостях и улучшениях, о которых можно рассказать публично, а также разработать рекомендации по улучшению безопасности «в эпоху ИИ». Кроме того, компания находится в диалоге с правительством США по поводу возможностей Claude Mythos Preview.

Ася Карпова

8 апр

Claude Mythos «сбежала» из изолированной среды и опубликовала об этом несколько статей, пока исследователь ел сэндвич

Anthropic рассказала о случаях несогласованного поведения последней модели в тестах.

#новости #anthropic