AI 비교하기AI 사용하기AI 최신정보AI 커뮤니티
私たちのビジョン利用規約プライバシーお問い合わせ

大規模言語モデルがビデオゲームで苦戦する理由

大規模言語モデルがビデオゲームで苦戦する理由

spectrum.ieee.org
2026年6月2日 (火)
  • •大規模言語モデルは人間レベルのビデオゲームプレイにおいて依然として苦戦を強いられている。
  • •モデルのコーディング能力は構造化されたタスクに依存しており、多様なゲームメカニクスへの適応とは性質が異なる。
  • •ビデオゲーム環境の極めて高い多様性が、現在のAI学習における大きな障壁となっている。
  • •大規模言語モデルは人間レベルのビデオゲームプレイにおいて依然として苦戦を強いられている。
  • •モデルのコーディング能力は構造化されたタスクに依存しており、多様なゲームメカニクスへの適応とは性質が異なる。
  • •ビデオゲーム環境の極めて高い多様性が、現在のAI学習における大きな障壁となっている。

大規模言語モデルは、コーディングや言語処理といった分野で高度な能力を発揮する一方で、ビデオゲームのプレイにおいては顕著な限界を示している。2025年5月に「ポケットモンスター 赤」をクリアしたGemini 2.5 Proのような事例もあるが、これらはカスタムソフトウェアを用いた例外的なケースであり、人間よりも遥かに遅い速度で動作している。ニューヨーク大学ゲーム・イノベーション・ラボのディレクターであるジュリアン・トゲリウスは、現在のモデルは特殊なゲームベンチマークにおいて単純な探索アルゴリズムにすら及ばず、特に空間認識能力やゲーム固有のメカニクスの理解に苦慮していると指摘している。

LLMのコーディングにおける成功とゲームにおける失敗の差は、環境構造の根本的な違いに起因している。コーディングは報酬が即時的かつ粒度の細かいタスク指向のゲームとして機能し、モデルは既存の学習データを利用して実用的なソフトウェアを作成できる。対照的に、ビデオゲームは多様な課題と独自の入出力空間、メカニクスを提示する。標準化された学術的タスクとは異なり、ゲームにはLLMが習熟するために必要な大規模かつ一貫性のあるデータセットが存在せず、現在のモデルが実行不可能な反復的な学習プロセスを各タイトルが要求する。

専門家は、グーグルやエヌビディアがAI学習ループにゲームのようなシミュレーションを組み込んでいる現状でも、AIのゲームプレイ能力を過大評価しないよう警告している。ビデオゲームは物理法則が一貫している現実世界よりも多様であり、現実世界ではウェイモのような自動運転向けの世界モデルが安定した物理法則の恩恵を受けている。その結果、LLMは定型的なゲームコードを生成できても、斬新で質の高いゲーム体験を生み出すために不可欠な、反復的なプレイテストや調整を行う能力は欠如している。

大規模言語モデルは、コーディングや言語処理といった分野で高度な能力を発揮する一方で、ビデオゲームのプレイにおいては顕著な限界を示している。2025年5月に「ポケットモンスター 赤」をクリアしたGemini 2.5 Proのような事例もあるが、これらはカスタムソフトウェアを用いた例外的なケースであり、人間よりも遥かに遅い速度で動作している。ニューヨーク大学ゲーム・イノベーション・ラボのディレクターであるジュリアン・トゲリウスは、現在のモデルは特殊なゲームベンチマークにおいて単純な探索アルゴリズムにすら及ばず、特に空間認識能力やゲーム固有のメカニクスの理解に苦慮していると指摘している。

LLMのコーディングにおける成功とゲームにおける失敗の差は、環境構造の根本的な違いに起因している。コーディングは報酬が即時的かつ粒度の細かいタスク指向のゲームとして機能し、モデルは既存の学習データを利用して実用的なソフトウェアを作成できる。対照的に、ビデオゲームは多様な課題と独自の入出力空間、メカニクスを提示する。標準化された学術的タスクとは異なり、ゲームにはLLMが習熟するために必要な大規模かつ一貫性のあるデータセットが存在せず、現在のモデルが実行不可能な反復的な学習プロセスを各タイトルが要求する。

専門家は、グーグルやエヌビディアがAI学習ループにゲームのようなシミュレーションを組み込んでいる現状でも、AIのゲームプレイ能力を過大評価しないよう警告している。ビデオゲームは物理法則が一貫している現実世界よりも多様であり、現実世界ではウェイモのような自動運転向けの世界モデルが安定した物理法則の恩恵を受けている。その結果、LLMは定型的なゲームコードを生成できても、斬新で質の高いゲーム体験を生み出すために不可欠な、反復的なプレイテストや調整を行う能力は欠如している。

原文(英語)を読む·2026年3月29日
#llm#video games#spatial reasoning#benchmark#game innovation lab