Обзор GPT-5.5 от Every: новые возможности и преимущества модели
Они тестировали её три недели: кодинг, написание текстов, работа со знаниями.
Вот что им понравилось:
• Скачок в кодинге и при этом с моделью приятно работать. Быстрая, дружелюбная, сразу стала основной. Но при этом мощная в коде — редкое сочетание
• 62 из 100 на их бенчмарке Senior Engineer. Opus 4.7 набрал 33 из 100 (но 5.5 лучше всего работает по плану, составленному Opus 4.7). При тестировании использовали более 900 миллионов токенов и это позволило шипить продакшн-фичи с высокой скоростью и качеством
• Серьёзная концептуальная ясность — держит сложный план в голове часами, не отвлекаясь на существующий код. Первая модель, которая справляется со сложными рефакторами, где нужно удалить и переосмыслить большую часть кодбейса
• Хорошо пишет тексты. Первая модель OpenAI за год, из-за которой писатели Every перешли с Claude. Текст ощущается органичнее, лучше копирует стиль не перебарщивая
• Отличная для агентской работы — первая модель OpenAI, которая одновременно и сильный инженер, и умеет всё от таблиц до ресерча.
Безумно быстрая, потрясающе работает в десктопном Codex — часть команды пересела с Claude Code и Cowork на время тестирования
В целом GPT-5.5 — огромное достижение OpenAI и заслуживает серьёзного рассмотрения как основная модель.
Из минусов:
• Opus 4.7 всё ещё лучше составляет планы — планы 5.5 очень читаемые, но у Opus внимательнее к деталям и острее инсайты
• Opus чуть лучше во фронтенде и фулстек-продуктовой работе, когда нужно фулстек-мышление и дизайн и не очень хорошо пишет на Ruby
• 5.5 отличный вайб-кодер, но без плана хуже Opus — Opus лучше читает между строк в недоспецифицированных задачах
Подписывайтесь на Telegram Tips AI | IT & AI.