Thousand Token Wood v2、異種モデルによる金融シミュレーション公開
- •Thousand Token Wood v2は、4つの異なる小規模言語モデルを使用して市場経済をシミュレートする。
- •エンジニアは堅牢なJSON解析層と厳格なファイアウォールを構築し、エージェント情報を管理している。
- •プロンプトの肥大化を防ぎエージェントの挙動を維持するため、システムメモリは整数値に基づく要約に制限される。
2026年6月6日、開発者のレスター・リョン(Lester Leong)は、マルチエージェント金融シミュレーションゲームの第2版「Thousand Token Wood」を公開した。プレイヤーは「パトロン」として、市場のクリーチャーたちを操作する。単一の0.5Bモデルで5体のクリーチャーを動かしていた前版とは異なり、v2ではgpt-oss-20b、MiniCPM3-4B、Nemotron-Mini-4B、カスタム調整されたQwen 0.5Bという、4つの異なる研究室による異種モデルの評議会を採用している。この多様な構成により、各モデルが蓄財や投機といった異なる行動特性を示すことで、より現実的な市場動向が創出される。
マルチモデルアーキテクチャの実装では、モデリング層以上にサービング層での課題が浮き彫りとなった。vLLMバージョン0.22.1の使用時に発生したカーネルコンパイルエラーは、CUDA開発ベースイメージへの切り替えにより解消された。各モデルには、それぞれ異なる量子化形式やトークナイザーの特性に応じた固有の設定が必要となった。安定性を維持するため、システムはモデルの出力形式の癖にかかわらずフィルタリングを行う、一元化された堅牢なJSON解析・修復層を導入している。これにより、大規模なリファクタリングなしでシンプルな設定変更による統合が可能となった。
ゲームの核心的なメカニズムは、プレイヤーがエージェントに「内部情報」を提供する情報非対称性システムにある。情報の真実性を隠蔽するため、システムには厳格なセキュリティファイアウォールが実装されている。情報が真か偽かを示す隠しフラグは、モデルのプロンプトの外にあるプレイヤー台帳に完全に隔離して保存される。自動化されたスイートが各ターンごとにクリーチャーのプロンプト全体をスキャンし、秘密フラグを含む禁止トークンがエージェントのコンテキストに漏洩していないか検証する。
v2のメモリ管理は、小規模モデルでパフォーマンスを低下させる原因となるプロンプトの肥大化を防ぐため、履歴を制限することで行われる。クリーチャーは生の履歴を受け取る代わりに、整数値の感情スコアから導き出された1行の要約を受け取る。この制限された手法により、モデルは敵対関係やカルテル行動といった現在の状態に基づいて応答するよう強制され、シミュレーションのパフォーマンスが維持される。代表的なシミュレーション実行では、0.5Bモデルが100%の有効オファーを達成し、自己購入率は0%であった。また、セキュリティファイアウォールは隠しフラグの漏洩をすべて防止しつつ、プレイヤーが戦略的な情報提供を通じて市場を操作することを可能にした。