1. 사용 시나리오

입력 토큰보내는 텍스트 양
출력 토큰AI가 생성하는 응답 양
추론 토큰
AI가 생각하는 과정 (일부 모델만 지원)
API 횟수총 요청 횟수
프롬프트 캐시반복 요청 시 입력의 80%를 재사용하여 비용 절감
속도 표시

프롬프트 직접 입력 (선택사항)

2. 비용 시뮬레이션

모델총 최소~총 최대
Llama 4 Scout
$1.32~2.76
GPT OSS 120B
$1.37~2.28
DeepSeek V4 Flash
$2.27~3.61
Llama 4 Maverick
$2.61~5.49
GPT-5 Nano
$2.79~4.71
Gemma 4 31B
$2.90~4.72
Gemini 2.5 Flash Lite
$2.94~4.86
Nemotron 3 Super
$3.24~5.40
DeepSeek V3.2
$3.25~5.07
Longcat Flash Chat
$3.48~7.32
Grok 4.1 Fast
$3.90~6.30
Grok 4.1 Fast (Reasoning)
$3.90~6.30
Mistral Small 4
$4.41~7.29
ERNIE 4.5 300B A47B
$4.80~10.08
MiniMax M2.7
$5.22~10.98
K-EXAONE
$5.88~9.72
Trinity Large Thinking
$6.27~10.35
MiniMax M2.5
$8.04~13.56
GPT-5.4 Nano
$8.85~14.85
Gemini 3.1 Flash Lite
$10.65~17.85
Qwen3.6 Plus
$13.84~23.20
GPT-5 Mini
$13.95~23.55
Kimi K2.5
$14.52~24.12
GLM-5
$15.53~25.51
Qwen3.5 397B A17B
$16.61~27.85
Gemini 2.5 Flash
$17.40~29.40
Nova 2 Lite
$17.40~29.40
Gemini 3 Flash
$21.30~35.70
MiMo-V2-Pro
$22.80~37.20
GLM-5.1
$26.25~43.05
Grok 4.20
$27.60~56.40
DeepSeek V4 Pro
$28.19~44.89
GPT-5.4 Mini
$31.95~53.55
Kimi K2.6
$32.96~55.30
GPT-4.1
$34.80~73.20
Claude Haiku 4.5
$36.00~60.00
Grok 4.20 (Reasoning)
$45.60~74.40
Gemini 2.5 Pro
$69.75~117.75
GPT-5
$69.75~117.75
Gemini 3.1 Pro
$85.20~142.80
GPT-5.4
$106.50~178.50
Claude Sonnet 4
$108.00~180.00
Claude Sonnet 4.5
$108.00~180.00
Claude Sonnet 4.6
$108.00~180.00
Claude Opus 4.5
$180.00~300.00
Claude Opus 4.6
$180.00~300.00
Claude Opus 4.7
$180.00~300.00
Claude Opus 4
$540.00~900.00
Claude Opus 4.1
$540.00~900.00
GPT-5.4 Pro
$1278.00~2142.00

4. 시뮬레이션 요약

최저 비용 모델

Llama 4 Scout

$1.32 /3,000

최고 성능 모델

Claude Opus 4.7

$180.00 /3,000

산출 기준

입력 토큰: 1,000

출력 토큰: 1,200 ~ 2,800 (±40%)

추론 토큰: 1,000

사용량: 3,000

토큰 프리셋은 시나리오별 통계적 평균값입니다. 실제 토큰 수는 프롬프트 내용에 따라 달라집니다. Reasoning 토큰은 Extended Thinking을 지원하는 모델에만 적용됩니다.

단가 최종 업데이트: 2026년 4월 25일