OpenAI выкатили GPT-5.5. Модель перешла на глубокие рассуждения и уделала Claude

OpenAI дропнули GPT-5.5. Фокус окончательно сместился с простого предсказания текста на архитектуру системного планирования. Теперь это полноценный автономный агент, который во всех тестах уже обходит тяжелую Claude Opus 4.7.

Агент, который работает за тебя

В апку Codex завезли мощный бафф для автоматизации рутины:

  • Нативная работа с таблицами. Агенту можно скормить тяжелый датасет, и он сам пропишет логику, раскидает VLOOKUP и многоуровневые IF-условия для анализа, пока ты занимаешься другими делами.
  • Контроль системы. Модель научилась управлять браузером, терминалом и десктопными приложухами вроде Slack. Сама устанавливает софт и проверяет свои действия.
  • Новые форматы. Подвезли глубокую работу с PDF, презентациями, диктовку на уровне всей операционной системы и плагин для работы с .tex файлами.

Под капотом

  • Огромная память. Окно контекста расширили до 256 тысяч токенов. Идеально переваривает длинные видео и тяжелые репозитории, можно спокойно закинуть всю HTML/CSS структуру большого проекта, чтобы провести глубокий технический SEO-аудит за один проход.
  • Меньше бреда. Галлюцинации срезали на 40% за счет того, что модель теперь делает внутреннюю проверку каждого своего шага.
  • Цифры. На Terminal-Bench выбивает 82.7% (у свежей Claude только 69%), а на математическом тесте MATH улетает в 92.4%. На SWE-bench Verified щелкает почти половину (48.7%) реальных задач с GitHub.
OpenAI выкатили GPT-5.5. Модель перешла на глубокие рассуждения и уделала Claude

Прайс за API ожидаемо подрос. ~$5 на вход и $30 на выход за миллион токенов. Да, квота в том же Codex будет расходоваться быстрее, но разработчики жестко оптимизировали результативность. Модели теперь тупо нужно значительно меньше токенов, чтобы с первого раза выдать готовое решение. В самом API добавили тумблер, можно выбирать между быстрым ответом и долгим глубоким размышлением для архитектурных задач.

Сейчас GPT-5.5 уже доступна в ChatGPT и Codex на платных тарифах (Plus, Pro, Business, Enterprise), а в ближайшее время её раскатают вообще на всех.

Не отставайте от технологий! Подписывайтесь на Telegram-канал, чтобы быть в курсе последних трендов и лайфхаков.

1
1
Начать дискуссию