DeepSeek
DeepSeek

DeepSeek V4 Flash

2026-04-24

DeepSeek V4 Flash는 2026년 4월 24일에 공개된 V4 시리즈의 소형·저지연 모델로, 총 파라미터 284B(활성 13B)를 갖추고 장문 컨텍스트 추론 능력을 유지하면서도 비용 효율적인 추론을 목표로 설계되었습니다. V4 Pro와 동일한 압축 희소 어텐션(CSA)과 고도 압축 어텐션(HCA) 구조를 공유하며, 100만 토큰 컨텍스트 윈도우 전체에서 'Thinking'과 'Non-Thinking' 듀얼 모드를 지원합니다. 크기는 훨씬 작지만, V4 Flash 베이스 모델은 대부분의 벤치마크, 특히 장문 컨텍스트 작업에서 훨씬 큰 V3.2 베이스 모델을 능가합니다. 입력 100만 토큰당 $0.14, 출력 $0.28의 프론티어급 최저 수준 가격으로, 고처리량 에이전트 작업과 문서 처리 워크로드에 이상적입니다.

심층 사고|상용 모델
학습 완료일
비공개
입력 형식 → 출력 형식
처리용량
1.0MIN384KOUT
개별 비용(백만 글자)
$0.14IN$0.28OUT
비용 계산하기

AI 성능 평가

Arena 종합 점수
1439
±9
집계일 2026-04-23
종합 순위
47위
3,607 투표수
Arena 능력별 점수
복잡한 질문
1463±1244위
전문 지식
1456±2948위
지시 이행
1428±1648위
대화 기억
1440±2352위
창의력
1404±2354위
코딩 실력
1479±1952위
수학 능력
1437±3545위
Arena 직군별 점수
문학·창작
1421±1945위
생활·사회과학
1460±2245위
엔터·미디어
1404±2152위
경영·금융
1430±2157위
의학·보건
1468±3539위
법률·행정
1464±3230위
소프트웨어·IT
1476±1547위
수학·통계
1449±4039위
종합
AA Intelligence Index
47%↑8%
추론·수학
GPQA Diamond
89%↑8%
HLE
32%↑15%
코딩
AA Coding Index
39%↑5%
TAU2
95%↑22%
TerminalBench
36%↑5%
SciCode
45%↑4%
언어·지시
IFBench
79%↑22%
AA-LCR
63%↑1%
출력 속도
일반 모드
33tok/s↓49
출력 시작 1.97s