DeepSeek V4 Preview リリース — 1Mコンテキストを「標準」にしたOSSフラッグシップ
DeepSeek が V4 Preview を OSS 公開。フラッグシップ V4-Pro (1.6T総 / 49Bアクティブ MoE) と高速・省コスト V4-Flash (284B / 13B) の2モデル構成で、全公式サービスで1Mトークンコンテキストを標準化した。Token-wise圧縮 + DSA(Sparse Attention)で長コンテキストの計算/メモリコストを大幅に削減し、APIは即日更新、旧モデルは3ヶ月でサンセット。
キーポイント
- V4-Pro: 1.6T総 / 49Bアクティブ。Agentic Codingでオープン界SOTA、世界知識はGemini-3.1-Proに次ぐ2位
- V4-Flash: 284B総 / 13Bアクティブ。V4-Pro並みの推論力で爆速・激安API
- 全公式サービスで1Mコンテキストがデフォルト化
- Token-wise圧縮 + DSA、Muon optimizer、On-Policy Distillation、FP4 QAT
- APIは更新済み、旧モデルは3ヶ月でサンセット
- Zhihu解析: もはやベンチ競争でなく『効率的long-context推論』という新戦場