DeepSeek представила модели V4-Pro с 1,6 трлн параметров и V4-Flash c 248 млрд параметров

Превью-версии доступны в чат-боте DeepSeek в режиме «Эксперт».

Источник: DeepSeek
Источник: DeepSeek
  • Контекстное окно обеих моделей составляет 1 млн токенов, рассказали в DeepSeek. Они также могут работать в режиме «рассуждений» и без него.
  • V4-Pro всего включает 1,6 трлн параметров, при этом каждая генерация задействует 49 млрд параметров. V4-Flash общим числом параметров в 248 млрд использует 13 млрд параметров на каждую генерацию.
  • По собственным данным DeepSeek, V4-Pro превосходит существующие открытые модели в тестах по математике, программированию и естественным наукам. А по объёму «общих знаний о мире» она уступает только Gemini-3.1-Pro.
  • Компания также называет V4-Pro «лидером в бенчмарках по агентному программированию». Модель поддерживает «бесшовную» интеграцию с Claude Code, OpenClaw и OpenCode.
  • Модель V4-Flash в простых задачах демонстрирует результаты на уровне V4-Pro, отмечают в DeepSeek. При этом меньшее число параметров уменьшает время отклика и снижает стоимость использования.
  • Превью-версии V4-Pro и V4-Flash доступны в чат-боте DeepSeek в режиме «Эксперт». Веса моделей опубликованы на Hugging Face. Доступ через API в компании обещают открыть 24 апреля 2026 года, цены не уточнили.
  • В середине апреля 2026-го The Information со ссылкой на источники рассказало, что DeepSeek ведёт переговоры о привлечении как минимум $300 млн при оценке в $10 млрд. Через несколько дней издание сообщило, что на фоне высокого интереса инвесторов оценка компании может вырасти до $20 млрд. По словам собеседников, принять участие в рануде могут китайские Tencent и Alibaba.
12
8
42 комментария