論文の概要: AI Exposure Scores: what they measure, what they miss, and what comes next
- arxiv url: http://arxiv.org/abs/2606.23633v1
- Date: Mon, 22 Jun 2026 17:23:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 17:37:22.016107
- Title: AI Exposure Scores: what they measure, what they miss, and what comes next
- Title(参考訳): AI Exposure Scores:計測するもの、見逃したもの、次に来るもの
- Authors: Campbell Lund, Thomas Euyang, Zanele Munyikwa, Marzieh Fadaee,
- Abstract要約: 2023年に計算された一連の露光スコアは、仕事の議論の将来への中心的な経験的入力となっている。
政策対応分析において, 時間的, 地理的, 存在論的制限がいかに複雑かを示す。
第2のギャップは、研究者と政策立案者の調整という、私たちがより注意が必要であると主張するものなのです。
- 参考スコア(独自算出の注目度): 7.835777818044015
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A set of exposure scores calculated in 2023 has become a central empirical input to the future of work debate. Produced by Eloundou et al. (2023) and referred to here as the GPTs are GPTs scores, they define exposure as the share of occupational tasks a large language model can assist with. This work is a genuine methodological contribution, but as the scores travel from the time and place they were produced, the limitations the authors named do not always travel with them. Two gaps have widened as a result. The first is structural, between what static exposure scores measure and what policy questions actually require. Taking the diffusion of these scores as a case study, we show how their temporal, geographic, and ontological limitations compound in policy-facing analyses, and we survey five families of research responding to these limits: dynamic and benchmark-based measures, ensemble methods, task-framework extensions, worker-centered metrics, and adoption and usage data. The second gap is the one we argue needs more attention: the coordination between researchers and policymakers. The policy-relevant work which ask who is harmed, who benefits, how, and when, continues to reference the static GPTs are GPTs scores without engagement with the methodological updates that would let these questions be answered more reliably. We then ask what additional steps towards navigating uncertainty remain: ex-post frameworks and the deliberate, political work of reimagining what futures are worthy of building towards are. Closing the research-policy gap is a shared task: policymakers must widen their evidence base, engage workers as epistemic partners, and shift from prediction to preparedness; researchers must build data infrastructure, adopt participatory methods, and write with policymakers in mind. Better measurement matters, but it will not close the second gap alone.
- Abstract(参考訳): 2023年に計算された一連の露光スコアは、仕事の議論の将来への中心的な経験的入力となっている。
Eloundou et al (2023) によって生産され、ここで GPT は GPT スコアとして言及されている。
この作品は真に方法論的な貢献であるが、スコアが生成した時間と場所から移動しているため、著者が名付けた制限は常にそれらと共に移動しているわけではない。
その結果、2つのギャップが拡大した。
ひとつは構造的であり、静的露光スコアと、ポリシーの問題が実際に必要とするものの間にある。
本研究は,これらのスコアの拡散を事例として,政策対応分析において時間的・地理的・存在論的制限がいかに複雑であるかを考察し,動的およびベンチマークに基づく測定,アンサンブル手法,タスクフレーム拡張,労働者中心のメトリクス,採用と利用データといった,これらの制限に対応する5つの研究ファミリを調査する。
第2のギャップは、研究者と政策立案者の調整という、私たちがより注意が必要であると主張するものなのです。
誰が害を受けたか、誰が恩恵を受け、いつ、いつ、いつ、静的GPTを参照するかを問う政策関連の仕事は、これらの質問をより確実に答えられるような方法論的な更新に関わらず、GPTのスコアである。
そして、我々は、不確実性をナビゲートするための追加のステップを尋ねる: ポストフレームワークと、目的に向かって構築する価値のある未来を再想像する意図的な政治的作業。
政策立案者はエビデンス基盤を広げ、労働者をエピステマティックパートナーとして関与させ、予測から準備へとシフトさせ、研究者はデータ基盤を構築し、参加的手法を採用し、政策立案者と念頭において書く必要がある。
測定精度は向上するが、第2のギャップを埋めることはできない。
関連論文リスト
- Prediction-Powered Inference Across Many Tasks for AI Evaluation & Social Science Research [6.716363754264257]
多くのアプリケーションは、多くの関連するタスクにまたがって統計的に妥当な推論を必要とするが、仮説当たりの高品質なラベルはわずかである。
本稿では,タスク固有の推論を保存しながら,関連タスクのラベル付きデータを用いてパワーを向上させる予測型推論フレームワークを提案する。
本研究では,ラベルが不足している場合の信頼区間幅を大幅に削減できることを示す。
論文 参考訳(メタデータ) (2026-05-28T02:09:38Z) - Jobs' AI Exposure Should Be Measured from Evidence, Not Model Priors [2.4724375110574304]
AIへの仕事の露出は、根拠に基づく根拠に基づく方法で測定されるべきである。
現在の理論的露出測定では、ゼロショットプロンプトを使用してタスクレベルのAI露出を分類している。
我々はO*NET 30.2における18,796の職業-タスク対にAI露出ラベルを割り当てる検索拡張フレームワークを提案する。
論文 参考訳(メタデータ) (2026-05-14T23:29:42Z) - BPP: Long-Context Robot Imitation Learning by Focusing on Key History Frames [27.70479413079641]
最高のパフォーマンスのロボットポリシーは、通常、現在の観察にのみ条件を定め、それらのタスクの適用性を制限する。
我々は、なぜポリシーが急激な相関関係にひっかかるのかを分析し、この問題はトレーニング中に起こりうる歴史の空間を限定的にカバーすることに起因することを見出した。
これらの知見に触発され,視覚言語モデルによって検出される意味の最小セットを条件付けるアプローチとして,Big Picture Policies (BPP)を提案する。
論文 参考訳(メタデータ) (2026-02-16T18:49:56Z) - Toward Generalizable Evaluation in the LLM Era: A Survey Beyond Benchmarks [229.73714829399802]
この調査は、大規模言語モデルの台頭が評価に役立っている中核的な課題を調査する。
i) タスク固有のものから能力に基づく評価へと、知識、推論、指示に従うこと、マルチモーダル理解、安全性といったコア能力に関するベンチマークを再編成する。
この問題と、上記の2つのトランジションの中核的な課題を、メソッド、データセット、評価器、メトリクスの観点から検討する。
論文 参考訳(メタデータ) (2025-04-26T07:48:52Z) - Privacy Issues in Large Language Models: A Survey [2.707979363409351]
これは、大規模言語モデル(LLM)におけるプライバシー問題に焦点を当てたAI研究の活発な領域に関する最初の調査である。
私たちは、プライバシのリスクを強調し、トレーニングや推論プロセスにプライバシを構築しようと試み、著作権の問題を軽減するために、レッドチームでモデルを設計する作業に重点を置いています。
論文 参考訳(メタデータ) (2023-12-11T01:26:53Z) - Bias and Fairness in Large Language Models: A Survey [73.87651986156006]
本稿では,大規模言語モデル(LLM)のバイアス評価と緩和手法に関する総合的な調査を行う。
まず、自然言語処理における社会的偏見と公平性の概念を統合し、形式化し、拡張する。
次に,3つの直感的な2つのバイアス評価法と1つの緩和法を提案し,文献を統一する。
論文 参考訳(メタデータ) (2023-09-02T00:32:55Z) - SoK: Privacy-Preserving Data Synthesis [72.92263073534899]
本稿では,プライバシ保護データ合成(PPDS)に注目し,その分野の総合的な概要,分析,議論を行う。
PPDSでは,統計的手法と深層学習(DL)に基づく手法の2つの顕著な研究を統一するマスターレシピを作成した。
論文 参考訳(メタデータ) (2023-07-05T08:29:31Z) - Off-policy Evaluation in Infinite-Horizon Reinforcement Learning with
Latent Confounders [62.54431888432302]
無限水平エルゴードマルコフ決定過程におけるOPE問題について考察する。
我々は、状態と行動の潜在変数モデルのみを考慮すれば、政策値が政治外のデータから特定できることを示す。
論文 参考訳(メタデータ) (2020-07-27T22:19:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。