開発者がLLMで無料のRust版RAR実装を構築
- •開発者がLLMを使用してRAR圧縮形式の無料Rust実装「rars」を公開した。
- •5万5000行のプロジェクトは、Codex 5.5とClaude Opus 4.7を使い、5週間と40ポンドのトークン費用で完了した。
- •自律型LLMエージェントと広範なテストにより、WinRARに対して5-10%の性能差を達成した。
ある開発者が5週間をかけ、AIモデルを活用してバイナリの逆コンパイルや仕様のドキュメント化を行うことで、RAR圧縮形式の完全なRust版実装を成功させた。このプロジェクトは「rars」と題され、伝統的にプロプライエタリ(私有)であったRAR形式のフリーソフトウェア実装として提供される。開発者は約40ポンドのトークン費用を投じ、OpenAIのCodex 5.5とClaude Opus 4.7を活用して約5万5000行のコードを生成した。この実装は、これまでアクセスが困難だった1.3や1.4を含む様々なRARバージョンをカバーしている。
開発プロセスでは、unar、libarchive、UNRARLIBといった無料の解凍ツールから情報を集約し、GhidraやDOSBox-xを用いた逆コンパイル作業で補完することで、仕様を一から作成した。Claudeをアーキテクチャやドキュメントの戦略立案者として、Codexをタスク実行者として機能させる構造的なワークフローを採用している。AI特有の「ハルシネーション(AIが生成する誤情報)」を防ぐため、ユニットテスト、16進ダンプ、およびコンテキストのリセットをまたいでAIの出力をガイドするギャップドキュメント化を徹底した。また、手動レビューフィルターを用いてフィードバックを整理し、AI生成コードが制御不能になる事態を回避した。
OpenAIモデルの「/goal」機能の統合により、16時間のセッションで暗号化や復旧記録、マルチボリュームサポートといった複雑なタスクをこなす自律的な「Ralphループ」を実現した。圧縮性能はWinRARと5-10%の範囲に収まり、場合によっては上回ることもあるが、安全性を重視したRustコードの性質と、手作業によるC言語開発で一般的な低レイヤーのパフォーマンス最適化が欠けているため、本家より動作は低速である。本プロジェクトは現在、crates.ioから「cargo install rars-cli」で利用可能だ。
このプロジェクトは、LLM支援開発の可能性と限界の両方を浮き彫りにした。AIモデルはRustコードの生成や自律的な調査において非常に高い能力を示したが、ユーザーエクスペリエンスや複雑なアーキテクチャの機微については継続的な弱点を見せた。開発者は、人間による構造の強制や「改善作業」がなければコードの品質が低下すると指摘し、自律的なコーディングプロセスにおいて開発者がアーキテクチャの監督を維持する必要性を強調している。