Trinity Large Thinkingは、Arcee AIが開発したオープンソースの推論モデルで、総パラメータ数3,980億の疎な混合エキスパート(MoE)アーキテクチャを採用し、トークンあたり約130億パラメータのみを活性化します。拡張された思考連鎖推論とエージェント強化学習により訓練され、τ²-Bench(94.7%)やPinchBench(91.9%)などのエージェントベンチマークで最先端の性能を達成しています。Apache 2.0ライセンスで公開されており、ローカル環境またはホスティングAPIを通じて自由に利用できます。
深い思考|公開モデルApache 2.0
AI性能評価
Arena 総合点数
1375
±6集計日 2026-04-07
総合ランク
119位
12,625 投票数
Arena 能力別スコア
複雑な質問
1400±7115位
専門知識
1414±2092位
指示遂行
1372±10112位
会話記憶
1372±13121位
創造力
1357±14104位
コード作成
1443±1192位
数学力
1362±20136位
Arena 職種別スコア
文学·創作
1358±11115位
生活·社会
1402±14110位
エンタメ
1355±13100位
経営·金融
1385±13107位
医学·保健
1416±2199位
法律·行政
1401±2198位
ソフト開発
1425±9104位
数学·統計
1380±24120位
総合
AA Intelligence Index
32%↓6%
LiveBench
30%↓30%
推論·数学
GPQA Diamond
75%↓6%
HLE
15%↓2%
LB 推論
21%↓39%
LB 数学
45%↓29%
LB データ
40%↓9%
コーディング
AA Coding Index
27%↓7%
LB コード
66%↓8%
LB エージェント
3.3%↓40%
TAU2
90%↑17%
TerminalBench
23%↓8%
SciCode
36%↓5%
言語·指示
IFBench
56%↑0%
AA-LCR
33%↓29%
幻覚率 (HHEM)
6.9%↓3%
事実一貫性 (HHEM)
93%↑3%
LB 言語
42%↓30%
LB 指示
12%↓34%
出力速度
標準モード
129tok/s↑47
出力開始 16.09s