Arcee AI

Trinity Large Thinking

Name: Arcee AI Trinity Large Thinking
Author: Arcee AI

Trinity Large Thinking is an open-source reasoning model from Arcee AI, built on a 398B-parameter sparse Mixture-of-Experts architecture that activates approximately 13B parameters per token. Post-trained with extended chain-of-thought reasoning and agentic reinforcement learning, it achieves state-of-the-art results on agentic benchmarks including τ²-Bench (94.7%) and PinchBench (91.9%). Released under the Apache 2.0 license, it offers frontier-level tool use and multi-turn conversation capabilities that can be run fully locally or via hosted API.

심층 사고|공개 모델Apache 2.0

출시일

2026-04-01학습 완료일 2024

이 AI가 학습을 마친 날짜입니다. 이후 발생한 사건이나 정보는 알지 못할 수 있습니다.

입력 형식 → 출력 형식

이 AI에게 전달할 수 있는 정보 유형과, AI가 생성할 수 있는 결과물 유형을 나타냅니다.

처리용량

262KIN262KOUT

한 번의 요청에서 AI가 한꺼번에 읽고 처리할 수 있는 최대 분량입니다. 숫자가 클수록 긴 문서나 대화를 처리할 수 있습니다.

개별 비용(백만 글자)

$0.22IN$0.85OUT

이 AI를 직접 연동해 사용할 때 발생하는 비용입니다. 텍스트 100만 단위(토큰)당 달러 기준으로 표시됩니다.

비용 계산하기

사용자 실측

텍스트 비교48회 비교

사용자 선택

14회(44%)

선호도 순위

65위

생성 속도 (실측)

102 tok/s

최근 45 tok/s

첫 응답 (실측)

4.5초

최근 12.1초

토큰당 생성 시간

4.5ms

속도 흔들림

±258%

총 소요시간

9.0초

답변 스타일 (전체 답변 분포 대비)

답변 길이

상위 62%

어휘 다양성

상위 79%

문장 리듬

상위 43%

언어 혼합

상위 51%

목록 사용

줄의 46%

제목 사용

줄의 4%

생각 비중

토큰의 26%

목록형

거짓말 비교6회 비교

거짓말률

20%

1/5문제

정답

0문제

답변 회피

4문제

속도 비교

⚠

1회 비교

생성 속도 (실측)

111 tok/s

첫 응답 (실측)

4.1초

토큰당 생성 시간

4.8ms

속도 흔들림

±698%

총 소요시간

8.9초

AI 성능 평가

Arena 종합 점수

1369

±5

집계일 2026-07-27

종합 순위

No.168

28,834 투표수

Arena 능력별 점수

복잡한 질문

1386±6No.167

전문 지식

1402±13No.144

지시 이행

1358±7No.168

대화 기억

1349±9No.179

창의력

1335±10No.171

코딩 실력

1415±8No.168

수학 능력

1385±15No.153

Arena 직군별 점수

문학·창작

1345±8No.171

생활·사회과학

1394±9No.159

엔터·미디어

1328±9No.169

경영·금융

1369±9No.162

의학·보건

1397±14No.158

법률·행정

1374±13No.174

소프트웨어·IT

1407±7No.166

수학·통계

1379±16No.158

출처:Arena Intelligence

종합

AA Intelligence Index

18%↓17%

LiveBench

30%↓38%

추론·수학

GPQA Diamond

75%↓10%

HLE

15%↓9%

LB 추론

21%↓54%

LB 수학

45%↓39%

LB 데이터 분석

40%↓23%

코딩

AA Coding Index

26%↓18%

LB 코딩

66%↓9%

LB 에이전틱

3.3%↓42%

TAU2

90%↑3%

TerminalBench

23%↓12%

SciCode

36%↓7%

언어·지시

IFBench

56%↓8%

AA-LCR

33%↓31%

환각률 (HHEM)

6.9%↓3%

사실 일관성 (HHEM)

93%↑3%

LB 언어

42%↓33%

LB 지시

12%↓50%

출력 속도

일반 모드

163tok/s↑75

출력 시작 12.79s

출처:Artificial Analysis LiveBench Vectara HHEM

관련 정보

PrivateAI Native

Arcee AI

🇺🇸 US2023$240M~100

사용자 실측

텍스트 비교48회 비교

사용자 선택

14회(44%)

선호도 순위

65위

생성 속도 (실측)

102 tok/s

최근 45 tok/s

첫 응답 (실측)

4.5초

최근 12.1초

토큰당 생성 시간

4.5ms

속도 흔들림

±258%

총 소요시간

9.0초

답변 스타일 (전체 답변 분포 대비)

답변 길이

상위 62%

어휘 다양성

상위 79%

문장 리듬

상위 43%

언어 혼합

상위 51%

목록 사용

줄의 46%

제목 사용

줄의 4%

생각 비중

토큰의 26%

목록형

거짓말 비교6회 비교

거짓말률

20%

1/5문제

정답

0문제

답변 회피

4문제

속도 비교

⚠

1회 비교

생성 속도 (실측)

111 tok/s

첫 응답 (실측)

4.1초

토큰당 생성 시간

4.8ms

속도 흔들림

±698%

총 소요시간

8.9초

AI 성능 평가

Arena 종합 점수

1369

±5

집계일 2026-07-27

종합 순위

No.168

28,834 투표수

Arena 능력별 점수

복잡한 질문

1386±6No.167

전문 지식

1402±13No.144

지시 이행

1358±7No.168

대화 기억

1349±9No.179

창의력

1335±10No.171

코딩 실력

1415±8No.168

수학 능력

1385±15No.153

Arena 직군별 점수

문학·창작

1345±8No.171

생활·사회과학

1394±9No.159

엔터·미디어

1328±9No.169

경영·금융

1369±9No.162

의학·보건

1397±14No.158

법률·행정

1374±13No.174

소프트웨어·IT

1407±7No.166

수학·통계

1379±16No.158

종합

AA Intelligence Index

18%↓17%

LiveBench

30%↓38%

추론·수학

GPQA Diamond

75%↓10%

HLE

15%↓9%

LB 추론

21%↓54%

LB 수학

45%↓39%

LB 데이터 분석

40%↓23%

코딩

AA Coding Index

26%↓18%

LB 코딩

66%↓9%

LB 에이전틱

3.3%↓42%

TAU2

90%↑3%

TerminalBench

23%↓12%

SciCode

36%↓7%

언어·지시

IFBench

56%↓8%

AA-LCR

33%↓31%

환각률 (HHEM)

6.9%↓3%

사실 일관성 (HHEM)

93%↑3%

LB 언어

42%↓33%

LB 지시

12%↓50%

출력 속도

일반 모드

163tok/s↑75

출력 시작 12.79s