JetBrains、120億パラメータのMoEモデル「Mellum2」を発表
- •JetBrainsは2026年6月1日、120億パラメータを持つ混合エキスパートモデル「Mellum2」を公開した。
- •同モデルはトークンごとに25億パラメータのみをアクティブ化し、推論速度を2倍以上に高速化した。
- •コーディングやルーティング、検索拡張生成(RAG)、セルフホスト環境での利用に最適化されている。
JetBrainsは2026年6月1日、自然言語処理およびコード生成向けに設計された120億パラメータの混合エキスパートモデル(MoE)である「Mellum2」をリリースした。トークンあたり25億パラメータのみを稼働させる疎な(スパースな)アーキテクチャを採用しており、同規模のモデルと比較して2倍以上の推論速度を実現した。テキストとコードに特化することでモデルを軽量化し、低遅延が求められる本番環境への導入を最適化している。Apache 2.0ライセンスで提供され、公開利用や外部に依存しないセルフホスト展開が可能だ。
本モデルは、複雑なAIシステムにおいて複数の処理ステップを担うコンポーネントとして機能する。JetBrainsはMellum2を、マルチモデルフレームワークにおけるプロンプト分類やツール選択など、ルーティングおよびオーケストレーションの要として位置づけている。また、検索拡張生成(RAG)パイプラインにおけるコンテキスト圧縮や要約、検索後のデータ処理にも適している。さらに、計画立案や検証、データ変換といったエージェントのサブタスクを実行するコントローラーとしても機能し、中間処理のために大規模で高コストなモデルを呼び出す必要性を削減する。
2026年5月に公開された報告書に基づく技術評価では、コード生成、推論、数学、科学などのカテゴリーでベンチマークを実施した。Mellum2の設計目標は、汎用的なフロンティアモデルの代替ではなく、高スループットなソフトウェア開発タスク向けに、より高速で低コストかつ制御可能な選択肢を提供することにある。開発者は、IDE(統合開発環境)やセキュアな内部データ処理が必要なインフラに本モデルを組み込める。技術仕様や学習手法、詳細なベンチマーク結果は同社のレポートおよびHugging Face上で公開されている。