主要LLMの政治的バイアス調査結果
- •Trakkr.aiは、ウェブ検索を使わずに4,400件の回答を分析し、6つの主要大規模言語モデル(LLM)の政治的傾向をマッピングした。
- •GeminiとDeepSeekは最も中立的と評価された一方、ChatGPTとLlamaは左派寄りという測定結果が出た。
- •各モデルの主張する政治的中立性と、経済軸上の実際の出力にはしばしば乖離が見られた。
2026年6月1日に公開されたTrakkr.aiの調査では、政治、経済、言論、社会に関する質問を用いて6つの主要AIモデルの政治的バイアスを分析した。この分析は、ウェブ検索をオフにした状態で4,400件の回答を収集し、外部データに左右されないモデル本来の傾向を抽出した。その結果、6つのモデルのうち4つが政治的中立の左側に位置していることが判明した。
各モデルは中心からの距離と位置の安定性でランク付けされた。Geminiが中心に最も近く、次いでDeepSeek、Llamaが続いた。Claudeは4位、Grokは5位(右寄り)、ChatGPTは6位(左寄り)となった。指標として、Grokは圧力を受けた際の曲げ率が97%だったのに対し、Geminiは安定性が98%、曲げ率が11%だった。
調査では、モデルが主張する政治的立場と、経済軸上での測定値との比較も行われた。DeepSeekとGeminiは主張通り中立と測定された一方、ChatGPTとLlamaは中立を主張しながらも左派寄りという結果が出た。またGrokは自己申告より0.36単位右寄り、Claudeは0.34単位左寄りだった。
各モデルの参照点は、CHES 2024およびV-Demの専門家調査を用いて構築された。ChatGPTはドイツの緑の党、ClaudeとLlamaはニュージーランドの労働党、GeminiとDeepSeekはオーストラリアのアンソニー・アルバニージ政権下の労働党に近い。Grokはフランスのエマニュエル・マクロン大統領の立場に最も近いとマッピングされた。
本調査は、未成年者への性別適合ケア、化石燃料の段階的廃止、多様性クオータ制といった政策課題に対するモデルの乖離も評価した。調査手法として、モデルの生出力を評価するために中立的な分類器を用い、95%信頼区間で加重平均を算出している。データは再計算が可能な状態で保存されており、ユーザーは同じクイズを受けることで、自身の政治的座標とモデルを比較できる。