Anthropicが新モデル「Mythos」公開を準備か
- •Anthropicの内部コードから、AIモデル「Mythos 1」の公開が間近に迫っている可能性が浮上した。
- •同モデルは4月以降、重要ソフトウェアにおいて1万件以上の深刻な脆弱性を特定した。
- •Anthropicは、履歴チャートや詳細な脆弱性トリアージ結果を表示する新しいセキュリティダッシュボードを試験している。
AnthropicがAIモデル「Mythos」の一般公開に向けた準備を進めていることが、同社の内部ソースコードおよびセキュリティインターフェースの流出情報から明らかになった。Testing Catalogの報告によると、Anthropicのシステム内や「Claude Security」ダッシュボードで「claude-mythos-1-preview」というモデル名が発見された。さらに、脆弱性発見プログラムを通じて、Google CloudおよびAWSのプラットフォーム上でもこのモデルの痕跡が確認されている。一部のユーザーからは、Claudeのエコシステム内で既にMythos 1のインターフェースが目撃されたという報告もあがっている。
Claude Mythosは先月発表されたモデルであり、ソフトウェアの脆弱性を特定・悪用する能力において、大半の専門家を凌駕するとされている。Anthropicはこれまで、デュアルユース(軍事・民生両用)のリスクを懸念し、悪用を防ぐ十分な安全策がないとして一般公開を見送ってきた。しかし、同社は4月以降、重要なグローバルソフトウェアにおいて1万件以上の高リスクまたは深刻な脆弱性を既に特定したと公表している。現在は強力なサイバーセキュリティモデルの安全策構築を目指す「プロジェクト・グラスウィング(Project Glasswing)」を主導している。
流出したコードは、AnthropicがClaudeプラットフォーム向けの新しいセキュリティダッシュボードを積極的に開発していることを示唆している。この更新されたインターフェースには、特定された脆弱性に加え、過去30日間の履歴チャートや詳細なトリアージ結果が表示される見通しだ。Anthropicは、脆弱性の修正にかかる時間が現在の最大の制約であると主張しつつも、適切な安全プロトコルが確立され次第、Mythosクラスのモデルを一般公開する方針を示していた。今回発見された内部情報は、そのリリース時期が前倒しされている可能性を示している。