DeepSeek V4 Flashは、2026年4月24日にリリースされたV4シリーズの小型・低遅延バリアントで、総パラメータ284B(アクティブ13B)と、長文コンテキスト推論を犠牲にすることなくコスト効率の高い推論を実現するよう設計されています。V4 Proと同じ圧縮スパースアテンション(CSA)と高圧縮アテンション(HCA)の構造を共有し、100万トークンのコンテキストウィンドウ全体で「Thinking」「Non-Thinking」のデュアルモードに対応します。サイズは大幅に小さいものの、V4 Flashベースモデルはほとんどのベンチマーク、特に長文コンテキストタスクで遥かに大型のV3.2ベースを上回ります。入力100万トークンあたり$0.14、出力$0.28という、フロンティアクラスで最安水準の価格設定により、高スループットなエージェントタスクや文書処理ワークロードに最適です。
DeepSeek V4 Flashは、2026年4月24日にリリースされたV4シリーズの小型・低遅延バリアントで、総パラメータ284B(アクティブ13B)と、長文コンテキスト推論を犠牲にすることなくコスト効率の高い推論を実現するよう設計されています。V4 Proと同じ圧縮スパースアテンション(CSA)と高圧縮アテンション(HCA)の構造を共有し、100万トークンのコンテキストウィンドウ全体で「Thinking」「Non-Thinking」のデュアルモードに対応します。サイズは大幅に小さいものの、V4 Flashベースモデルはほとんどのベンチマーク、特に長文コンテキストタスクで遥かに大型のV3.2ベースを上回ります。入力100万トークンあたり$0.14、出力$0.28という、フロンティアクラスで最安水準の価格設定により、高スループットなエージェントタスクや文書処理ワークロードに最適です。