GPT-OSS-120Bは、OpenAI初のオープンウェイト言語モデルで、総パラメータ数1,170億の混合エキスパート(MoE)アーキテクチャにおいて、1回の順伝播あたり51億パラメータのみを活性化します。ネイティブMXFP4量子化により80GB GPU1枚で動作可能で、主要な推論ベンチマークでo4-miniに迫る性能を達成します。思考深度の調整、完全な思考連鎖へのアクセス、関数呼び出しや構造化出力などのツール使用に対応しており、Apache 2.0ライセンスで公開されているため、ローカル環境で自由に活用できます。
API|深い思考|公開モデルApache 2.0
AI性能評価
Arena 総合点数
1353
±4集計日 2026-04-23
総合ランク
149位
30,674 投票数
Arena 能力別スコア
日本語能力
1319±2786位
複雑な質問
1363±6156位
専門知識
1360±17147位
指示遂行
1326±7163位
会話記憶
1328±9171位
創造力
1279±10203位
コード作成
1390±8154位
数学力
1383±14125位
Arena 職種別スコア
文学·創作
1310±8177位
生活·社会
1361±9160位
エンタメ
1287±8185位
経営·金融
1350±8154位
医学·保健
1369±15151位
法律·行政
1345±14171位
ソフト開発
1386±6153位
数学·統計
1384±15125位
総合
AA Intelligence Index
25%↓14%
LiveBench
46%↓14%
推論·数学
AA Math Index
67%↓7%
GPQA Diamond
67%↓14%
HLE
5.2%↓12%
MMLU-Pro
78%↓4%
AIME 2025
67%↓7%
LB 推論
39%↓20%
LB 数学
69%↓5%
LB データ
39%↓11%
コーディング
AA Coding Index
16%↓19%
LiveCodeBench
71%↑5%
LB コード
60%↓13%
LB エージェント
17%↓27%
TAU2
45%↓28%
TerminalBench
5.3%↓26%
SciCode
36%↓5%
言語·指示
IFBench
58%↑2%
AA-LCR
44%↓18%
幻覚率 (HHEM)
14%↑4%
事実一貫性 (HHEM)
86%↓4%
LB 言語
49%↓23%
LB 指示
50%↑4%
出力速度
標準モード
86tok/s↑4
出力開始 0.48s
推論モード
214tok/s↑126
出力開始 9.89s