Обзор GPT-5.5 от Every: новые возможности и преимущества модели

Ребята из Every сделали крутую оценку новой GPT-5.5, я посмотрел обзор и вам его перевел.

Они тестировали её три недели: кодинг, написание текстов, работа со знаниями.

Вот что им понравилось:

• Скачок в кодинге и при этом с моделью приятно работать. Быстрая, дружелюбная, сразу стала основной. Но при этом мощная в коде — редкое сочетание

• 62 из 100 на их бенчмарке Senior Engineer. Opus 4.7 набрал 33 из 100 (но 5.5 лучше всего работает по плану, составленному Opus 4.7). При тестировании использовали более 900 миллионов токенов и это позволило шипить продакшн-фичи с высокой скоростью и качеством

• Серьёзная концептуальная ясность — держит сложный план в голове часами, не отвлекаясь на существующий код. Первая модель, которая справляется со сложными рефакторами, где нужно удалить и переосмыслить большую часть кодбейса

• Хорошо пишет тексты. Первая модель OpenAI за год, из-за которой писатели Every перешли с Claude. Текст ощущается органичнее, лучше копирует стиль не перебарщивая

• Отличная для агентской работы — первая модель OpenAI, которая одновременно и сильный инженер, и умеет всё от таблиц до ресерча.

Безумно быстрая, потрясающе работает в десктопном Codex — часть команды пересела с Claude Code и Cowork на время тестирования

В целом GPT-5.5 — огромное достижение OpenAI и заслуживает серьёзного рассмотрения как основная модель.

Из минусов:

• Opus 4.7 всё ещё лучше составляет планы — планы 5.5 очень читаемые, но у Opus внимательнее к деталям и острее инсайты

• Opus чуть лучше во фронтенде и фулстек-продуктовой работе, когда нужно фулстек-мышление и дизайн и не очень хорошо пишет на Ruby

• 5.5 отличный вайб-кодер, но без плана хуже Opus — Opus лучше читает между строк в недоспецифицированных задачах

Смотреть видео в Telegram

Подписывайтесь на Telegram Tips AI | IT & AI.