空間基盤モデル評価用「SpatialBench」公開
HuggingFace
2026年5月28日 (木)
- •19のデータセットと546のシーンを用いて空間基盤モデルを総合的に評価する「SpatialBench」が登場した。
- •41のモデルを5つの空間ドメイン、6つのパラダイム、4つの入力密度設定で評価する枠組みとなっている。
- •空間表現学習を強化するため、新たなデータセット「DA-Next-5M」およびベースラインモデル「DA-Next」が発表された。
空間基盤モデルの汎用性を評価するための新たなベンチマーク「SpatialBench」が公開された。これまでのモデルは限定的な評価パラダイムや特定の学習領域に依存しており、任意の視点や環境、ハードウェア制約下での堅牢性に課題があった。これに対し、本ベンチマークは19のデータセットと546のシーンを網羅し、5つの異なる空間ドメインを対象としている。評価フレームワークは、6つのパラダイムと5つのタスク群、4つの異なる入力密度設定の下で41種類のモデルをテストする構成である。
調査結果によると、現在の空間モデルは万能選手としては機能しておらず、全方位的な能力には限界がある。精度を最大化するには「フルコンテキスト・アテンション(入力シーケンス全体を考慮して文脈を把握する仕組み)」が不可欠であり、一方で長いシーケンスに対する拡張性にはメモリ消費を抑える戦略が必要である。また、具現化AIや「エゴセントリックタスク(ユーザーが装着したカメラからの視点に基づくタスク)」での検証では、単なるデータセットの規模拡大よりも、データの品質とドメインの一致が性能に直結することが明らかになった。データ不足を補うため、研究チームは大規模データセット「DA-Next-5M」と、空間表現学習を改善するためのベースラインモデル「DA-Next」を新たに導入している。