DeepSeek представила модели V4-Pro с 1,6 трлн параметров и V4-Flash c 248 млрд параметров

Превью-версии доступны в чат-боте DeepSeek в режиме «Эксперт».

Контекстное окно обеих моделей составляет 1 млн токенов, рассказали в DeepSeek. Они также могут работать в режиме «рассуждений» и без него.
V4-Pro всего включает 1,6 трлн параметров, при этом каждая генерация задействует 49 млрд параметров. V4-Flash общим числом параметров в 248 млрд использует 13 млрд параметров на каждую генерацию.
По собственным данным DeepSeek, V4-Pro превосходит существующие открытые модели в тестах по математике, программированию и естественным наукам. А по объёму «общих знаний о мире» она уступает только Gemini-3.1-Pro.
Компания также называет V4-Pro «лидером в бенчмарках по агентному программированию». Модель поддерживает «бесшовную» интеграцию с Claude Code, OpenClaw и OpenCode.
Модель V4-Flash в простых задачах демонстрирует результаты на уровне V4-Pro, отмечают в DeepSeek. При этом меньшее число параметров уменьшает время отклика и снижает стоимость использования.
Превью-версии V4-Pro и V4-Flash доступны в чат-боте DeepSeek в режиме «Эксперт». Веса моделей опубликованы на Hugging Face. Доступ через API в компании обещают открыть 24 апреля 2026 года, цены не уточнили.
В середине апреля 2026-го The Information со ссылкой на источники рассказало, что DeepSeek ведёт переговоры о привлечении как минимум $300 млн при оценке в $10 млрд. Через несколько дней издание сообщило, что на фоне высокого интереса инвесторов оценка компании может вырасти до $20 млрд. По словам собеседников, принять участие в рануде могут китайские Tencent и Alibaba.

Ася Карпова

19 мар

Xiaomi выпустила флагманскую ИИ-модель — ещё до анонса она возглавила топ OpenRouter и породила слухи о DeepSeek V4

Модель разработана для агентных задач.

#новости #deepseek