DeepSeek V4 Pro는 2026년 4월 24일에 공개된 DeepSeek의 플래그십 오픈소스 프론티어 모델로, 총 파라미터 1.6조(활성 49B)를 갖춘 현존 최대 규모의 오픈웨이트 모델입니다. 압축 희소 어텐션(CSA)과 고도 압축 어텐션(HCA)을 결합한 하이브리드 어텐션 구조를 도입해, 100만 토큰 컨텍스트 기준 V3.2 대비 단일 토큰 FLOPs를 27%, KV 캐시를 10% 수준으로 절감했습니다. FP4/FP8 혼합 정밀도와 매니폴드 제약 하이퍼커넥션으로 학습되었으며, 100만 토큰 컨텍스트 전체에서 'Thinking'과 'Non-Thinking' 듀얼 모드를 지원합니다. 출시 시점 SWE-bench Verified 80.6%(Claude Opus 4.6과 동률), LiveCodeBench 93.5%, Codeforces 레이팅 3206을 기록하면서도 동급 프론티어 모델 대비 약 1/7 수준의 가격을 제공합니다.
DeepSeek V4 Pro는 2026년 4월 24일에 공개된 DeepSeek의 플래그십 오픈소스 프론티어 모델로, 총 파라미터 1.6조(활성 49B)를 갖춘 현존 최대 규모의 오픈웨이트 모델입니다. 압축 희소 어텐션(CSA)과 고도 압축 어텐션(HCA)을 결합한 하이브리드 어텐션 구조를 도입해, 100만 토큰 컨텍스트 기준 V3.2 대비 단일 토큰 FLOPs를 27%, KV 캐시를 10% 수준으로 절감했습니다. FP4/FP8 혼합 정밀도와 매니폴드 제약 하이퍼커넥션으로 학습되었으며, 100만 토큰 컨텍스트 전체에서 'Thinking'과 'Non-Thinking' 듀얼 모드를 지원합니다. 출시 시점 SWE-bench Verified 80.6%(Claude Opus 4.6과 동률), LiveCodeBench 93.5%, Codeforces 레이팅 3206을 기록하면서도 동급 프론티어 모델 대비 약 1/7 수준의 가격을 제공합니다.