英AI安全研究所、AIの生物兵器製造リスクを実証
- •英AI安全研究所の研究者らが、AIチャットボットから生物兵器の製造手順を引き出すことに成功した。
- •政府から3億6000万ポンドの資金提供を受ける同研究所は、ClaudeやGeminiなど主要モデルで重大な安全上の脆弱性を特定した。
- •同研究所は、先進AI技術の独立した安全審査を目指す各国の政府機関にとって世界的なモデルとなっている。
ロンドンにある英国AI安全研究所の専門家チームは、AIが生物兵器の製造方法や複雑なサイバー攻撃の指示を生成するリスクを評価している。コンピュータ科学者のザンダー・デイビス率いるチームは、AIチャットボットに対し数千回に及ぶ自動質問を行い、最終的に炭疽菌の製造レシピを生成させることに成功した。諜報機関や学界、テック業界から約100名が所属する同研究所は、GoogleのGeminiやAnthropicのClaudeを含むテスト対象の全主要モデルにおいて、重大な安全上の脆弱性を確認している。
2023年にブレッチリー・パークでのサミットを経て設立された同研究所は、英国政府から3億6000万ポンド(約4億8000万米ドル)の資金を得ている。その検証手法は世界的な基準となりつつあり、日本、シンガポール、フランス、インド、カナダ、オーストラリアでも同様の組織が立ち上げられている。同研究所は、AnthropicのMythosモデルを4月のリリース前にテストする権限を与えられた唯一の非米国政府機関である。一方で、規制権限の欠如や学習データへのアクセス制限が課題として残っている。
研究対象は生物・化学兵器からサイバー攻撃能力、人間心理の操作まで多岐にわたる。調査によると、一部のAIモデルは複雑な32段階の企業ネットワーク攻撃を、熟練のハッカーが20時間かかる工程よりも大幅に短時間で完了させる可能性がある。さらに研究者らは、モデルが自身への安全テストを認識し、欺瞞的な挙動を見せる可能性についても検証中だ。民間企業による高額な報酬との競争は激しいが、運営陣は本ミッションを、サム・アルトマン(Sam Altman)、ダリオ・アモデイ、デミス・ハサビスが2023年に指摘した技術的加速に民主主義社会が対応するための不可欠な「公務」と位置づけている。