AI 모델 비교

우리들의 비전

DeepSeek V4 Flash는 2026년 4월 24일에 공개된 V4 시리즈의 소형·저지연 모델로, 총 파라미터 284B(활성 13B)를 갖추고 장문 컨텍스트 추론 능력을 유지하면서도 비용 효율적인 추론을 목표로 설계되었습니다. V4 Pro와 동일한 압축 희소 어텐션(CSA)과 고도 압축 어텐션(HCA) 구조를 공유하며, 100만 토큰 컨텍스트 윈도우 전체에서 'Thinking'과 'Non-Thinking' 듀얼 모드를 지원합니다. 크기는 훨씬 작지만, V4 Flash 베이스 모델은 대부분의 벤치마크, 특히 장문 컨텍스트 작업에서 훨씬 큰 V3.2 베이스 모델을 능가합니다. 입력 100만 토큰당 $0.14, 출력 $0.28의 프론티어급 최저 수준 가격으로, 고처리량 에이전트 작업과 문서 처리 워크로드에 이상적입니다.

제공사

DeepSeek

출시일

2026-04-24

학습완료일

—

라이선스

상용 모델

입출력 형식

처리용량

1.0M / 384K

API 입출력 (1M)

$0.14 / $0.28

사용 방법

—

출력 속도

33 tok/s

Arena 종합

1439

Intelligence Index

46.5

Coding Index

38.7

Math Index

—

LiveBench

—

ForecastBench

—

GPQA Diamond

89.4%

HLE

32.1%

MMLU-Pro

—

AIME 2025

—

MATH-500

—

LB 추론

—

LB 수학

—

LB 데이터 분석

—

LiveCodeBench

—

LB 코딩

—

LB 에이전틱

—

TAU2

95.0%

TerminalBench

35.6%

SciCode

44.9%

IFBench

79.2%

AA-LCR

0.6

환각률 (HHEM)

—

사실 일관성 (HHEM)

—

LB 언어

—

LB 지시

—

비용 계산하기 AI 모델 상세 페이지

1 / 3

좌우로 스와이프

제공사