MiniMax M2.5は、数十万の複雑な実世界環境で強化学習により訓練されたフロンティア言語モデルで、SWE-Bench Verified 80.2%、Multi-SWE-Bench 51.3%、BrowseComp 76.3%の最高水準のスコアを達成しています。M2.1のコーディング専門性を基盤に一般的なオフィス生産性まで拡張し、Word、Excel、PowerPointファイルの作成・操作、多様なソフトウェア環境間の切り替え、エージェントと人間のチーム間での協働が可能です。M2.1と比べて37%高速に評価を完了し、1時間あたり1ドルで連続実行できるほどコスト効率に優れています。
MiniMax M2.5は、数十万の複雑な実世界環境で強化学習により訓練されたフロンティア言語モデルで、SWE-Bench Verified 80.2%、Multi-SWE-Bench 51.3%、BrowseComp 76.3%の最高水準のスコアを達成しています。M2.1のコーディング専門性を基盤に一般的なオフィス生産性まで拡張し、Word、Excel、PowerPointファイルの作成・操作、多様なソフトウェア環境間の切り替え、エージェントと人間のチーム間での協働が可能です。M2.1と比べて37%高速に評価を完了し、1時間あたり1ドルで連続実行できるほどコスト効率に優れています。