論文の概要: The AI Skills Shift: Mapping Skill Obsolescence, Emergence, and Transition Pathways in the LLM Era
- arxiv url: http://arxiv.org/abs/2604.06906v1
- Date: Wed, 08 Apr 2026 10:05:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.47256
- Title: The AI Skills Shift: Mapping Skill Obsolescence, Emergence, and Transition Pathways in the LLM Era
- Title(参考訳): AIスキルシフト:LLM時代のスキルの陳腐化、創発、遷移経路のマッピング
- Authors: Rudra Jadhav, Janhavi Danve,
- Abstract要約: Skill Automation Feasibility Index (SAFI)について紹介する。
SAFIは、完全な作業実行ではなく、テキストベースのスキル表現のパフォーマンスを測定する。
データ、コード、モデル応答はすべてオープンソースである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As Large Language Models reshape the global labor market, policymakers and workers need empirical data on which occupational skills may be most susceptible to automation. We present the Skill Automation Feasibility Index (SAFI), benchmarking four frontier LLMs -- LLaMA 3.3 70B, Mistral Large, Qwen 2.5 72B, and Gemini 2.5 Flash -- across 263 text-based tasks spanning all 35 skills in the U.S. Department of Labor's O*NET taxonomy (1,052 total model calls, 0% failure rate). Cross-referencing with real-world AI adoption data from the Anthropic Economic Index (756 occupations, 17,998 tasks), we propose an AI Impact Matrix -- an interpretive framework that positions skills along four quadrants: High Displacement Risk, Upskilling Required, AI-Augmented, and Lower Displacement Risk. Key findings: (1) Mathematics (SAFI: 73.2) and Programming (71.8) receive the highest automation feasibility scores; Active Listening (42.2) and Reading Comprehension (45.5) receive the lowest; (2) a "capability-demand inversion" where skills most demanded in AI-exposed jobs are those LLMs perform least well at in our benchmark; (3) 78.7% of observed AI interactions are augmentation, not automation; (4) all four models converge to similar skill profiles (3.6-point spread), suggesting that text-based automation feasibility may be more skill-dependent than model-dependent. SAFI measures LLM performance on text-based representations of skills, not full occupational execution. All data, code, and model responses are open-sourced.
- Abstract(参考訳): 大規模言語モデルが世界の労働市場を再構築するにつれ、政策立案者や労働者は、職業スキルが自動化に最も影響を受けやすい経験的なデータを必要としている。
LLaMA 3.3 70B、Mistral Large、Qwen 2.5 72B、Gemini 2.5 Flashの4つのフロンティアLCMを、米国労働省のO*NET分類(1,052の総モデルコール、0%の失敗率)の全35のスキルにまたがる263のテキストベースのタスクでベンチマークするスキル自動化フィージビリティ指標(SAFI)を提示する。
Anthropic Economic Index(756の職業、17,998のタスク)の現実のAI採用データと交差して、AI Impact Matrixを提案する。このフレームワークは、4つの四分儀(High Displacement Risk, Upskilling Required, AI-Augmented, Lower Displacement Risk)に沿ってスキルを配置する。
主な発見:(1)数学 (SAFI: 73.2) とプログラミング (71.8) は、最も高い自動化可能性スコアを受け取っている; アクティブリスニング (42.2) とリーディング・コングリジョン (45.5) は、最低値を受け取っている; (2) AIによって露呈された仕事において最も要求されるスキルが、我々のベンチマークで最低限に高い性能のLLMである; (3) 78.7%のAIインタラクションは、自動化ではなく増大している; (4) 4つのモデル全てが、類似したスキルプロファイル(3.6ポイントの展開)に収束し、テキストベースの自動化能力は、モデルに依存しているよりも、よりスキルに依存している可能性があることを示唆する。
SAFIは、フル作業実行ではなく、テキストベースのスキル表現に基づいてLLMのパフォーマンスを測定する。
データ、コード、モデル応答はすべてオープンソースである。
関連論文リスト
- Agentic AI and Occupational Displacement: A Multi-Regional Task Exposure Analysis of Emerging Labor Market Disruption [1.066082625513843]
Acemoglu-Restrepoタスク露光フレームワークを拡張し、エージェント人工知能システムの労働市場効果に対処する。
個々のサブタスクを代用する従来の自動化技術とは異なり、エージェントAIシステムはマルチステップ推論を使用してエンドツーエンドを実行する。
O*NETタスクデータからアルゴリズムで計算した複合尺度であるAgentic Exposureスコアを紹介する。
論文 参考訳(メタデータ) (2026-03-31T19:36:36Z) - How AI Forecasts AI Jobs: Benchmarking LLM Predictions of Labor Market Changes [5.848712585343904]
本稿では,大規模言語モデル(LLM)が仕事需要の変化をどの程度予測できるかを評価するためのベンチマークを紹介する。
当社のベンチマークでは、米国におけるセクターレベルの求職率の高頻度指標と、AIの採用による職業変化のグローバルデータセットの2つのデータセットを組み合わせています。
その結果、構造化タスクは予測安定性を継続的に改善し、ペルソナプロンプトは短期的な傾向に有利であることがわかった。
論文 参考訳(メタデータ) (2025-10-27T14:08:27Z) - OmniEAR: Benchmarking Agent Reasoning in Embodied Tasks [52.87238755666243]
OmniEARは,言語モデルが身体的相互作用やツールの使用,マルチエージェントの協調にどう影響するかを評価するためのフレームワークである。
我々は、家庭と工業領域にまたがる1500のシナリオにおける連続的な物理的特性と複雑な空間的関係をモデル化する。
我々の体系的な評価は、モデルが制約から推論しなければならない場合、厳しい性能劣化を示す。
論文 参考訳(メタデータ) (2025-08-07T17:54:15Z) - AutoMind: Adaptive Knowledgeable Agent for Automated Data Science [70.33796196103499]
LLM(Large Language Model)エージェントは、現実世界のデータサイエンス問題に対処する大きな可能性を示している。
既存のフレームワークは、厳格で、事前定義された、柔軟性のないコーディング戦略に依存している。
適応的で知識のあるLLMエージェントフレームワークであるAutoMindを紹介する。
論文 参考訳(メタデータ) (2025-06-12T17:59:32Z) - Small Language Models are the Future of Agentic AI [42.62162575221445]
スモールランゲージモデル(SLM)は十分に強力であり、本質的にはより適しており、エージェントシステムにおける多くの呼び出しに対して経済的である。
本稿では,エージェントシステムにおけるSLM導入の潜在的な障壁について論じ,汎用LLM-to-SLMエージェント変換アルゴリズムの概要を述べる。
論文 参考訳(メタデータ) (2025-06-02T18:35:16Z) - TheAgentCompany: Benchmarking LLM Agents on Consequential Real World Tasks [55.03911355902567]
我々は、デジタルワーカーと同じような方法で世界と対話するAIエージェントを評価するためのベンチマークであるTheAgentCompanyを紹介する。
最も競争力のあるエージェントは、タスクの30%を自律的に完了させることができる。
これは、実際の職場の設定でLMエージェントをシミュレートすることで、タスク自動化に関する微妙な絵を描く。
論文 参考訳(メタデータ) (2024-12-18T18:55:40Z) - Towards the Terminator Economy: Assessing Job Exposure to AI through LLMs [10.844598404826355]
米国の雇用の3分の1はAIに強く依存しており、主に大学院または大学院の教育を必要とする高度な職業で行われている。
高度な職業であっても、AIはタスク置換において高い多様性を示し、AIと人間は同じ職業の中で相互に補完することを示唆している。
すべての結果、モデル、コードはオンラインで公開されており、コミュニティが結果を再現し、結果を比較し、私たちの仕事をベンチマークとして使用して、時間とともにAIの進捗を監視します。
論文 参考訳(メタデータ) (2024-07-27T08:14:18Z) - WorkArena++: Towards Compositional Planning and Reasoning-based Common Knowledge Work Tasks [85.95607119635102]
大型言語モデル(LLM)は人間のような知性を模倣することができる。
WorkArena++は、Webエージェントの計画、問題解決、論理的/論理的推論、検索、コンテキスト的理解能力を評価するように設計されている。
論文 参考訳(メタデータ) (2024-07-07T07:15:49Z) - Skill-Mix: a Flexible and Expandable Family of Evaluations for AI models [50.11814354654953]
AIエージェントの主な能力は、必要に応じて、学習した基本的なスキルを柔軟に組み合わせることである。
この研究は、スキルを組み合わせる能力を測定するための新しい評価であるSkill-Mixを導入している。
論文 参考訳(メタデータ) (2023-10-26T16:55:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。