DeepSeek представила модели V4-Pro с 1,6 трлн параметров и V4-Flash c 248 млрд параметров
Превью-версии доступны в чат-боте DeepSeek в режиме «Эксперт».
Источник: DeepSeek
- Контекстное окно обеих моделей составляет 1 млн токенов, рассказали в DeepSeek. Они также могут работать в режиме «рассуждений» и без него.
- V4-Pro всего включает 1,6 трлн параметров, при этом каждая генерация задействует 49 млрд параметров. V4-Flash общим числом параметров в 248 млрд использует 13 млрд параметров на каждую генерацию.
- По собственным данным DeepSeek, V4-Pro превосходит существующие открытые модели в тестах по математике, программированию и естественным наукам. А по объёму «общих знаний о мире» она уступает только Gemini-3.1-Pro.
- Компания также называет V4-Pro «лидером в бенчмарках по агентному программированию». Модель поддерживает «бесшовную» интеграцию с Claude Code, OpenClaw и OpenCode.
- Модель V4-Flash в простых задачах демонстрирует результаты на уровне V4-Pro, отмечают в DeepSeek. При этом меньшее число параметров уменьшает время отклика и снижает стоимость использования.
- Превью-версии V4-Pro и V4-Flash доступны в чат-боте DeepSeek в режиме «Эксперт». Веса моделей опубликованы на Hugging Face. Доступ через API в компании обещают открыть 24 апреля 2026 года, цены не уточнили.
- В середине апреля 2026-го The Information со ссылкой на источники рассказало, что DeepSeek ведёт переговоры о привлечении как минимум $300 млн при оценке в $10 млрд. Через несколько дней издание сообщило, что на фоне высокого интереса инвесторов оценка компании может вырасти до $20 млрд. По словам собеседников, принять участие в рануде могут китайские Tencent и Alibaba.
42 комментария