StepFun, 110억 파라미터 활성 모델 Step 3.5 Flash 공개
HuggingFace
2026년 2월 13일 (금)
- •StepFun이 최첨단 지능을 갖춘 110억 개의 활성 파라미터 모델인 Step 3.5 Flash를 출시했다.
- •혼합 전문가 모델 (MoE) 구조를 통해 MathArena 등 수학 및 코딩 벤치마크에서 최고 점수를 기록했다.
- •최적화된 Multi-Token Prediction과 어텐션 메커니즘을 적용해 AI 에이전트의 지연 시간과 비용을 획기적으로 낮췄다.
StepFun이 고도의 추론 능력과 실무에 필요한 속도를 동시에 잡은 신규 모델 'Step 3.5 Flash'를 전격 공개했다. 이 모델은 총 1,960억 개의 파라미터 중 특정 작업에 단 110억 개만 활성화하는 혼합 전문가 모델 (MoE) 구조를 채택했다. 이에 따라 연산 효율성을 극대화하면서도 업계 최고 수준의 성능을 유지하는 데 성공했다.
특히 에이전트 도구로서의 성능을 강화하기 위해 다양한 구조적 최적화가 이루어졌다. 슬라이딩 윈도우와 풀 어텐션 비율을 3:1로 구성하여 메모리 부담 없이 방대한 문맥을 처리할 수 있도록 설계한 것이 특징이다. 또한, Multi-Token Prediction(MTP-3) 기술을 도입해 한 번에 여러 단어를 예측함으로써 생성 속도를 높였으며, 그 결과 복잡한 상호작용에 소요되는 비용도 크게 절감했다.
무엇보다 높은 추론 역량을 확보하기 위해 연구진은 확장 가능한 강화 학습 프레임워크를 적용했다. 수학 문제의 정답과 같은 검증 가능한 신호에 사용자 선호도 피드백을 결합하여 모델이 스스로 성능을 개선하도록 유도한 것이다. 실제로 Step 3.5 Flash는 현재 MathArena에서 1위를 차지하고 있으며, 코딩과 수학 벤치마크에서 Gemini 3.0 Pro 및 GPT-5.2 xHigh와 같은 선두 모델들과 대등하게 경쟁하고 있다.