AI 비교하기AI 사용하기AI 최신정보AI 커뮤니티
私たちのビジョン利用規約個人情報保護方針FAQお問い合わせ

Anthropicの新モデル、サードパーティ製ツールで動作不良

Anthropicの新モデル、サードパーティ製ツールで動作不良

Simon Willison
2026年7月5日 (日)
  • •Anthropicの最新モデルOpus 4.8とSonnet 5で、ツール呼び出しスキーマへの適合性が低下した。
  • •モデルがネストされたedits[]配列内に許可されていないフィールドを捏造し、コーディングツール「Pi」が呼び出しを拒否する事態が発生している。
  • •Claude Code用ツールへの最適化が、外部のサードパーティ製コーディング環境との互換性を損なっている可能性がある。
  • •Anthropicの最新モデルOpus 4.8とSonnet 5で、ツール呼び出しスキーマへの適合性が低下した。
  • •モデルがネストされたedits[]配列内に許可されていないフィールドを捏造し、コーディングツール「Pi」が呼び出しを拒否する事態が発生している。
  • •Claude Code用ツールへの最適化が、外部のサードパーティ製コーディング環境との互換性を損なっている可能性がある。

2026年7月4日、サイモン・ウィリソン(Simon Willison、テックブロガー)は、Anthropicの最新モデルOpus 4.8およびSonnet 5において、コーディングエージェントツール「Pi」と連携する際に不正なツール呼び出しが生成される技術的な問題を報告した。モデルが出力するコード編集自体は概ね正確であるものの、頻繁にネストされたedits[]配列内に未定義のフィールドを挿入するという挙動が確認されている。このためPi側がツール呼び出しを拒否し、再試行を要求する事態が多発しており、同一モデルファミリーの旧モデルでは発生しなかった回帰的な不具合となっている。

この問題を特定したアーミン・ロナッチャー(Armin Ronacher、ソフトウェアエンジニア)は、強化学習を含む最近のトレーニングプロセスが影響していると分析した。これらのモデルはClaude独自の「検索と置換(search and replace)」編集ツールに高度に最適化されており、その結果サードパーティ製ツールが要求するスキーマへの適合が困難になっている可能性がある。このようなツール利用の乖離は、開発者にとって大きな課題となっており、異なるモデルバージョン間での互換性を維持するために、冗長な編集ツールを複数実装する必要性に直面している。比較対象として、OpenAIのCodexはapply_patch機構を採用しており、特定のツールに対する重点的なトレーニングがいかにエージェントワークフローにおけるモデル性能を左右するかを如実に示している。

2026年7月4日、サイモン・ウィリソン(Simon Willison、テックブロガー)は、Anthropicの最新モデルOpus 4.8およびSonnet 5において、コーディングエージェントツール「Pi」と連携する際に不正なツール呼び出しが生成される技術的な問題を報告した。モデルが出力するコード編集自体は概ね正確であるものの、頻繁にネストされたedits[]配列内に未定義のフィールドを挿入するという挙動が確認されている。このためPi側がツール呼び出しを拒否し、再試行を要求する事態が多発しており、同一モデルファミリーの旧モデルでは発生しなかった回帰的な不具合となっている。

この問題を特定したアーミン・ロナッチャー(Armin Ronacher、ソフトウェアエンジニア)は、強化学習を含む最近のトレーニングプロセスが影響していると分析した。これらのモデルはClaude独自の「検索と置換(search and replace)」編集ツールに高度に最適化されており、その結果サードパーティ製ツールが要求するスキーマへの適合が困難になっている可能性がある。このようなツール利用の乖離は、開発者にとって大きな課題となっており、異なるモデルバージョン間での互換性を維持するために、冗長な編集ツールを複数実装する必要性に直面している。比較対象として、OpenAIのCodexはapply_patch機構を採用しており、特定のツールに対する重点的なトレーニングがいかにエージェントワークフローにおけるモデル性能を左右するかを如実に示している。

原文(英語)を読む·2026年7月4日
#claude#opus 4 8#sonnet 5#tool use#coding agents#schema validation