AI 비교하기AI 사용하기AI 최신정보AI 커뮤니티
私たちのビジョン利用規約プライバシーお問い合わせ
Baidu
Baidu

ERNIE 4.5 VL 424B A47B

비교
2025-07-01
비교

ERNIE 4.5 VL 424B A47Bは、Baiduが開発したマルチモーダルなビジョン・言語MoEモデルです。テキストと画像の入力に対応してテキストを出力し、総パラメータ424Bのうちトークンあたり47Bを活性化し、131Kトークンのコンテキストウィンドウを備えています。テキストとビジョンを共同で事前学習した異種(heterogeneous)MoE構造にモダリティ分離ルーティング(modality-isolated routing)を採用し、一方のモダリティが他方の学習を妨げないよう設計されています。thinkingとnon-thinkingの2つのモードに対応しており、non-thinkingモードでは視覚認識・文書/チャート理解・視覚知識に強みを発揮し、thinkingモードではその認識能力を維持しつつ、MathVista・MMMU・VisualPuzzleといった推論中心のベンチマークでより高度なマルチモーダル推論能力を示し、OpenAI-o1との差を縮め、場合によっては上回ります。SFT・DPO・UPO・RLVRでポストトレーニングされ、英語と中国語に対応し、Apache 2.0ライセンスで公開されています。

비전|공개 모델Apache 2.0
학습 완료일
비공개

이 AI가 학습을 마친 날짜입니다. 이후 발생한 사건이나 정보는 알지 못할 수 있습니다.

입력 형식 → 출력 형식

이 AI에게 전달할 수 있는 정보 유형과, AI가 생성할 수 있는 결과물 유형을 나타냅니다.

처리용량
131K

한 번의 요청에서 AI가 한꺼번에 읽고 처리할 수 있는 최대 분량입니다. 숫자가 클수록 긴 문서나 대화를 처리할 수 있습니다.

개별 비용(백만 글자)
—

이 AI를 직접 연동해 사용할 때 발생하는 비용입니다. 텍스트 100만 단위(토큰)당 달러 기준으로 표시됩니다.

비용 계산하기
BaiduBaidu