この記事の要点は？

Q: この記事の要点は？

Anthropicの最新モデルOpus 4.8とSonnet 5で、ツール呼び出しスキーマへの適合性が低下した。 モデルがネストされたedits[]配列内に許可されていないフィールドを捏造し、コーディングツール「Pi」が呼び出しを拒否する事態が発生している。 Claude Code用ツールへの最適化が、外部のサードパーティ製コーディング環境との互換性を損なっている可能性がある。

Anthropicの最新モデルOpus 4.8とSonnet 5で、ツール呼び出しスキーマへの適合性が低下した。モデルがネストされたedits[]配列内に許可されていないフィールドを捏造し、コーディングツール「Pi」が呼び出しを拒否する事態が発生している。 Claude Code用ツールへの最適化が、外部のサードパーティ製コーディング環境との互換性を損なっている可能性がある。

Anthropicの新モデル、サードパーティ製ツールで動作不良

•Anthropicの最新モデルOpus 4.8とSonnet 5で、ツール呼び出しスキーマへの適合性が低下した。
•モデルがネストされたedits[]配列内に許可されていないフィールドを捏造し、コーディングツール「Pi」が呼び出しを拒否する事態が発生している。
•Claude Code用ツールへの最適化が、外部のサードパーティ製コーディング環境との互換性を損なっている可能性がある。

•Anthropicの最新モデルOpus 4.8とSonnet 5で、ツール呼び出しスキーマへの適合性が低下した。
•モデルがネストされたedits[]配列内に許可されていないフィールドを捏造し、コーディングツール「Pi」が呼び出しを拒否する事態が発生している。
•Claude Code用ツールへの最適化が、外部のサードパーティ製コーディング環境との互換性を損なっている可能性がある。

2026年7月4日、サイモン・ウィリソン（Simon Willison、テックブロガー）は、Anthropicの最新モデルOpus 4.8およびSonnet 5において、コーディングエージェントツール「Pi」と連携する際に不正なツール呼び出しが生成される技術的な問題を報告した。モデルが出力するコード編集自体は概ね正確であるものの、頻繁にネストされたedits[]配列内に未定義のフィールドを挿入するという挙動が確認されている。このためPi側がツール呼び出しを拒否し、再試行を要求する事態が多発しており、同一モデルファミリーの旧モデルでは発生しなかった回帰的な不具合となっている。

この問題を特定したアーミン・ロナッチャー（Armin Ronacher、ソフトウェアエンジニア）は、強化学習を含む最近のトレーニングプロセスが影響していると分析した。これらのモデルはClaude独自の「検索と置換（search and replace）」編集ツールに高度に最適化されており、その結果サードパーティ製ツールが要求するスキーマへの適合が困難になっている可能性がある。このようなツール利用の乖離は、開発者にとって大きな課題となっており、異なるモデルバージョン間での互換性を維持するために、冗長な編集ツールを複数実装する必要性に直面している。比較対象として、OpenAIのCodexはapply_patch機構を採用しており、特定のツールに対する重点的なトレーニングがいかにエージェントワークフローにおけるモデル性能を左右するかを如実に示している。

2026年7月4日、サイモン・ウィリソン（Simon Willison、テックブロガー）は、Anthropicの最新モデルOpus 4.8およびSonnet 5において、コーディングエージェントツール「Pi」と連携する際に不正なツール呼び出しが生成される技術的な問題を報告した。モデルが出力するコード編集自体は概ね正確であるものの、頻繁にネストされたedits[]配列内に未定義のフィールドを挿入するという挙動が確認されている。このためPi側がツール呼び出しを拒否し、再試行を要求する事態が多発しており、同一モデルファミリーの旧モデルでは発生しなかった回帰的な不具合となっている。

この問題を特定したアーミン・ロナッチャー（Armin Ronacher、ソフトウェアエンジニア）は、強化学習を含む最近のトレーニングプロセスが影響していると分析した。これらのモデルはClaude独自の「検索と置換（search and replace）」編集ツールに高度に最適化されており、その結果サードパーティ製ツールが要求するスキーマへの適合が困難になっている可能性がある。このようなツール利用の乖離は、開発者にとって大きな課題となっており、異なるモデルバージョン間での互換性を維持するために、冗長な編集ツールを複数実装する必要性に直面している。比較対象として、OpenAIのCodexはapply_patch機構を採用しており、特定のツールに対する重点的なトレーニングがいかにエージェントワークフローにおけるモデル性能を左右するかを如実に示している。