AI 비교하기AI 사용하기AI 조합하기AI 최신정보
私たちのビジョン利用規約プライバシーお問い合わせ
  1. 本日のAI情報
  2. AIエージェントのインフラをコードで定義する新フレームワーク

AIエージェントのインフラをコードで定義する新フレームワーク

AIエージェントのインフラをコードで定義する新フレームワーク

HuggingFace
2026年5月20日 (水)
  • •AIエージェントのインフラ管理に向けた統一フレームワーク「Code as Agent Harness」が発表された。
  • •本フレームワークはシステムをインターフェース、メカニズム、スケーリングの3層に分類し、信頼性を向上させる。
  • •エージェント間の一貫した状態維持や、安全性が求められる環境での人間による監督といった課題が示された。
  • •AIエージェントのインフラ管理に向けた統一フレームワーク「Code as Agent Harness」が発表された。
  • •本フレームワークはシステムをインターフェース、メカニズム、スケーリングの3層に分類し、信頼性を向上させる。
  • •エージェント間の一貫した状態維持や、安全性が求められる環境での人間による監督といった課題が示された。

2026年5月20日に公開された調査論文『Code as Agent Harness』は、AIシステムにおけるコードの役割の変化を考察している。従来、大規模言語モデル(LLM)は主にソフトウェアの生成に使用されてきたが、本稿ではコードが、目標達成に向けて自律的に動作するAIエージェントの実行基盤として機能していると主張する。「エージェント・ハーネス」と呼ばれるこのフレームワークは、インフラをインターフェース、メカニズム、スケーリングの3つの層に体系化した。

インターフェース層はエージェントを推論、行動、環境モデリングに接続する。メカニズム層は計画、記憶、ツール利用を統合し、長期間の実行やフィードバック駆動型の制御を支えて信頼性と適応性を高める。スケーリング層では単体からマルチエージェント環境への移行を扱い、共有コードを通じた調整、レビュー、検証を可能にする。本研究はGUIやOSの自動化、科学的発見、パーソナライゼーション、企業ワークフローなど幅広い分野への適用事例を記録している。

著者らはハーネス工学における今後の課題として、最終的な成功以外の評価指標の策定、不完全なフィードバック下での検証、回帰(退行)のない改善手法を挙げた。また、複数エージェント間での一貫した状態共有や、安全性に関わる操作における人間による監督の必要性も指摘している。本フレームワークは、実行可能で検証可能な、状態を保持できるAIシステム構築に向けた統一的な指針の提供を目指している。

2026年5月20日に公開された調査論文『Code as Agent Harness』は、AIシステムにおけるコードの役割の変化を考察している。従来、大規模言語モデル(LLM)は主にソフトウェアの生成に使用されてきたが、本稿ではコードが、目標達成に向けて自律的に動作するAIエージェントの実行基盤として機能していると主張する。「エージェント・ハーネス」と呼ばれるこのフレームワークは、インフラをインターフェース、メカニズム、スケーリングの3つの層に体系化した。

インターフェース層はエージェントを推論、行動、環境モデリングに接続する。メカニズム層は計画、記憶、ツール利用を統合し、長期間の実行やフィードバック駆動型の制御を支えて信頼性と適応性を高める。スケーリング層では単体からマルチエージェント環境への移行を扱い、共有コードを通じた調整、レビュー、検証を可能にする。本研究はGUIやOSの自動化、科学的発見、パーソナライゼーション、企業ワークフローなど幅広い分野への適用事例を記録している。

著者らはハーネス工学における今後の課題として、最終的な成功以外の評価指標の策定、不完全なフィードバック下での検証、回帰(退行)のない改善手法を挙げた。また、複数エージェント間での一貫した状態共有や、安全性に関わる操作における人間による監督の必要性も指摘している。本フレームワークは、実行可能で検証可能な、状態を保持できるAIシステム構築に向けた統一的な指針の提供を目指している。

原文(英語)を読む·2026年5月20日
#agentic ai#harness engineering#multi agent#software engineering#llm infrastructure