MIT、ロボット向けの新しい空間記憶技術を開発
- •MITの研究チームが、ロボットに言語ベースの長期的な時空間記憶を提供するDAAAMを開発した。
- •同システムは計算速度を10倍に向上させ、クエリ精度を21%から53%引き上げた。
- •DAAAMは、ロボットが平易な言葉で環境の詳細を検索し、複雑なタスクを遂行することを可能にする。
MITの研究チームは、ロボットが詳細な環境を記憶し、人間とより直感的に対話するための長期記憶フレームワークを発表した。「Describe Anything, Anywhere, Anytime, at Any Moment (DAAAM)」と名付けられたこのシステムは、3Dロボットマッピングとセマンティック検索を組み合わせ、言語でアクセス可能な環境のメンタルモデルを構築する。従来の単一の注釈を処理する方法とは異なり、DAAAMはロボットの走行中に周囲の物体を集約し、最適化手法を用いて並列注釈のための明確なキーフレームを選択する。このプロセスにより、計算速度は10倍に向上し、大規模な環境でのリアルタイム運用が可能となった。
蓄積されたデータを効果的に管理するため、同フレームワークは物体を3Dマップ内の空間的にクラスター化された領域に分類する。ユーザーがロボットにアイテムの場所や周囲の状況を問い合わせると、システムはLLMを活用し、データベースから情報を正確に取得する。このアーキテクチャにより、ハルシネーション(誤ったモデル出力)が最小限に抑えられ、数秒以内での正確な回答が可能となった。性能評価において、DAAAMは様々な質問タイプで既存の最先端手法を21%から53%上回る精度を記録した。
ルカ・カルローネ(Luca Carlone)准教授と大学院生のニコラス・ゴルロ(Nicolas Gorlo)らが率いる研究チームは、本成果をCVPR(コンピュータビジョンとパターン認識に関する国際会議)で発表した。このフレームワークは、ロボット工学以外にも、メンテナンス支援や経路案内を行う拡張現実(AR)分野での応用が期待されている。チームは今後、重要なイベントを追跡する機能や、ロボットの回答に信頼度スコアを導入することで、システムの改良を進める予定だ。本研究は、米国陸軍研究所および海軍研究局の資金提供を受け、複雑な人間からの要求を実行可能な汎用エージェントの構築を目指している。