Anthropicの新モデル、サードパーティ製ツールで動作不良
Simon Willison
2026年7月5日 (日)
- •Anthropicの最新モデルOpus 4.8とSonnet 5で、ツール呼び出しスキーマへの適合性が低下した。
- •モデルがネストされたedits[]配列内に許可されていないフィールドを捏造し、コーディングツール「Pi」が呼び出しを拒否する事態が発生している。
- •Claude Code用ツールへの最適化が、外部のサードパーティ製コーディング環境との互換性を損なっている可能性がある。
2026年7月4日、サイモン・ウィリソン(Simon Willison、テックブロガー)は、Anthropicの最新モデルOpus 4.8およびSonnet 5において、コーディングエージェントツール「Pi」と連携する際に不正なツール呼び出しが生成される技術的な問題を報告した。モデルが出力するコード編集自体は概ね正確であるものの、頻繁にネストされたedits[]配列内に未定義のフィールドを挿入するという挙動が確認されている。このためPi側がツール呼び出しを拒否し、再試行を要求する事態が多発しており、同一モデルファミリーの旧モデルでは発生しなかった回帰的な不具合となっている。
この問題を特定したアーミン・ロナッチャー(Armin Ronacher、ソフトウェアエンジニア)は、強化学習を含む最近のトレーニングプロセスが影響していると分析した。これらのモデルはClaude独自の「検索と置換(search and replace)」編集ツールに高度に最適化されており、その結果サードパーティ製ツールが要求するスキーマへの適合が困難になっている可能性がある。このようなツール利用の乖離は、開発者にとって大きな課題となっており、異なるモデルバージョン間での互換性を維持するために、冗長な編集ツールを複数実装する必要性に直面している。比較対象として、OpenAIのCodexはapply_patch機構を採用しており、特定のツールに対する重点的なトレーニングがいかにエージェントワークフローにおけるモデル性能を左右するかを如実に示している。