DeepSeek V4 Proを最適化するコーディング支援ツール
- •ハワード・チェン(開発者)が開発したGo言語ベースの端末制御用ハーネス「cwcode」により、DeepSeek V4 ProがClaudeと同等の90%の品質で動作する。
- •ハッシュ固定型編集とキャッシュ最適化により、DeepSeek V4 Proの運用コストを競合モデルの5%まで削減することに成功した。
- •「プランモード」と「巻き戻し」チェックポイント機能により、数時間にわたる自律的なコーディングループを実稼働コードベースで実現している。
ハワード・チェン(開発者)は、AIモデル「DeepSeek V4 Pro」をコーディングタスク向けに最適化するGo言語ベースの端末制御用ハーネス「cwcode」の実装詳細を公開した。「ハッシュ固定型(hash-anchored)」編集を活用することで、出力トークンを30〜40%削減し再試行回数を低減させ、自律的ループにおけるV4 Proの利用障壁を引き下げている。同ハーネスは、V4 Proの計画能力や曖昧さへの許容力不足を補うため、読み取り専用ツールに制限する「プランモード」や、SHA-256ハッシュを用いてファイル状態を復元できる「巻き戻し(Rewind)」チェックポイントシステムを導入している。
DeepSeek V4 Proのコストは、Claude Sonnet 4の価格の約5%に抑えられており、入力単価は100万トークンあたり0.435ドルで、Claudeの3ドルと比較して安価である。同氏は、ツールスキーマの並び替えや送信リクエストから推論コンテンツを除外することでプロンプトをバイト単位で安定させ、セッション累計で85%以上のキャッシュヒット率を達成した。これらの最適化により、50ターンの自律タスクを0.40ドルから0.80ドルのコストで実行可能となり、放射線治療の線量予測モデルや金融調査エージェントの開発、さらにはcwcode自身のコードベース改善にも利用されている。
同氏は、エージェントの失敗はモデルよりもハーネスの不備に起因することが多いと指摘する。主要な設計原則には、ハッシュラインを使用してコードを参照編集すること、非決定的なツールシリアル化がプロンプトキャッシュを破壊しないようにすること、モデルが失敗ループに陥った際にサイレント・アボート(無言の停止)の代わりに合成されたアシスタントメッセージを表示することが含まれる。cwcodeは12,000行のGo言語で実装され、端末ユーザーインターフェースコンポーネントとしてBubbleteaを採用している。また、レンダリング環境に依存しない分離された「シンク(Sink)」インターフェースを備えており、構造化されたハーネスロジックによってモデルの弱点を補い、V4 Proを信頼性の高い日常的なコーディングツールとして機能させている。