この記事の要点は？

Q: この記事の要点は？

2023年に発表されたAIの80%の職務に対する影響予測が、現在の世界的な政策や法案策定に多大な影響を及ぼしている。 研究者は、2023年モデルと最新のAIシステムの間には26ポイントの能力差が存在すると指摘する。 最新の動的調査手法では、暴露スコアと実証的な雇用データを結びつけることで政策予測の精度向上を図っている。

2023年に発表されたAIの80%の職務に対する影響予測が、現在の世界的な政策や法案策定に多大な影響を及ぼしている。研究者は、2023年モデルと最新のAIシステムの間には26ポイントの能力差が存在すると指摘する。最新の動的調査手法では、暴露スコアと実証的な雇用データを結びつけることで政策予測の精度向上を図っている。

AIの雇用影響評価に課題浮上

•2023年に発表されたAIの80%の職務に対する影響予測が、現在の世界的な政策や法案策定に多大な影響を及ぼしている。
•研究者は、2023年モデルと最新のAIシステムの間には26ポイントの能力差が存在すると指摘する。
•最新の動的調査手法では、暴露スコアと実証的な雇用データを結びつけることで政策予測の精度向上を図っている。

•2023年に発表されたAIの80%の職務に対する影響予測が、現在の世界的な政策や法案策定に多大な影響を及ぼしている。
•研究者は、2023年モデルと最新のAIシステムの間には26ポイントの能力差が存在すると指摘する。
•最新の動的調査手法では、暴露スコアと実証的な雇用データを結びつけることで政策予測の精度向上を図っている。

2023年に発表された論文「GPTs are GPTs」（Eloundouら著）は、米国の労働者の80%が大規模言語モデル（LLM）の影響を受ける職務に従事しており、そのうち19%は業務の50%以上が影響を受けると推定した。これらの数値は、国際通貨基金（IMF）、経済協力開発機構（OECD）、米国上院の様々な提案など、世界的な政策論議に広く組み込まれている。しかし、Cohere（カナダのAI企業）の研究者らは、2023年時点の技術的能力に基づき個別の業務タスクの遂行可能性を測るこうした静的な暴露スコアを、現在の労働市場の意思決定に適用することには重大な根拠の欠如があると主張する。

これらのスコアの限界は複数の要因に起因する。第一に、2023年モデルに基づいているため、現在のAI能力とは推定で26ポイントの開きがある。第二に、この指標は米国の職業分類体系（ONET）を使用しており、他国の労働市場には必ずしも適合しない。最後に、業務を項目化された個別のタスクとして扱うため、専門的な判断、職場の人間関係、状況的コンテキストといった不可欠な人間的要素を考慮できていない。研究者は、これらの制約が政策立案者が2026年以降を見据えたデータ活用を行う際に深刻な懸念となると指摘する。

これらの欠点を克服するため、より動的で代表性のある測定ツールの開発が進められている。新たなアプローチとして、AI能力評価と実労働市場データを結びつける動的指標が挙げられ、ある研究では暴露スコアが10ポイント上昇すると雇用が5.6から8.5ポイント減少するという結果が示された。また、アンサンブル手法やタスクフレームワークの拡張により、複数の枠組みを重み付けしタスクの順序を分析することで、より精緻な推計を行う手法も導入されている。

研究チームは、暴露スコアを決定的な予測としてではなく、数ある指標の一つとして扱うべきだと強調する。政策立案者に対しては、労働者保護の強化とリスキリングインフラへの投資を行うとともに、従業員をパートナーとして関与させるよう推奨している。さらに、AIの進化に合わせて常に変化し、労働者が自動化を望まない業務を評価するなど、人間中心の指標を組み込むことで労働市場の脆弱性の全体像を捉える測定ツールの優先的な開発を求めている。

2023年に発表された論文「GPTs are GPTs」（Eloundouら著）は、米国の労働者の80%が大規模言語モデル（LLM）の影響を受ける職務に従事しており、そのうち19%は業務の50%以上が影響を受けると推定した。これらの数値は、国際通貨基金（IMF）、経済協力開発機構（OECD）、米国上院の様々な提案など、世界的な政策論議に広く組み込まれている。しかし、Cohere（カナダのAI企業）の研究者らは、2023年時点の技術的能力に基づき個別の業務タスクの遂行可能性を測るこうした静的な暴露スコアを、現在の労働市場の意思決定に適用することには重大な根拠の欠如があると主張する。

これらのスコアの限界は複数の要因に起因する。第一に、2023年モデルに基づいているため、現在のAI能力とは推定で26ポイントの開きがある。第二に、この指標は米国の職業分類体系（ONET）を使用しており、他国の労働市場には必ずしも適合しない。最後に、業務を項目化された個別のタスクとして扱うため、専門的な判断、職場の人間関係、状況的コンテキストといった不可欠な人間的要素を考慮できていない。研究者は、これらの制約が政策立案者が2026年以降を見据えたデータ活用を行う際に深刻な懸念となると指摘する。

これらの欠点を克服するため、より動的で代表性のある測定ツールの開発が進められている。新たなアプローチとして、AI能力評価と実労働市場データを結びつける動的指標が挙げられ、ある研究では暴露スコアが10ポイント上昇すると雇用が5.6から8.5ポイント減少するという結果が示された。また、アンサンブル手法やタスクフレームワークの拡張により、複数の枠組みを重み付けしタスクの順序を分析することで、より精緻な推計を行う手法も導入されている。

研究チームは、暴露スコアを決定的な予測としてではなく、数ある指標の一つとして扱うべきだと強調する。政策立案者に対しては、労働者保護の強化とリスキリングインフラへの投資を行うとともに、従業員をパートナーとして関与させるよう推奨している。さらに、AIの進化に合わせて常に変化し、労働者が自動化を望まない業務を評価するなど、人間中心の指標を組み込むことで労働市場の脆弱性の全体像を捉える測定ツールの優先的な開発を求めている。