論文の概要: Informing AI Policy Assessment using Large-Scale Simulation of Interventions
- arxiv url: http://arxiv.org/abs/2605.27395v1
- Date: Mon, 20 Apr 2026 18:47:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 07:09:36.526114
- Title: Informing AI Policy Assessment using Large-Scale Simulation of Interventions
- Title(参考訳): 大規模介入シミュレーションを用いたAI政策評価
- Authors: Julia Barnett, Kimon Kieslich, Natali Helberger, Nicholas Diakopoulos,
- Abstract要約: 我々は、特定のAI害を軽減するための実行可能なポリシーオプションを特定する方法論を導入する。
我々は、遺伝的アルゴリズムに基づくシミュレーション研究を利用して、潜在的ポリシーの組み合わせの広大な解空間を探索する。
- 参考スコア(独自算出の注目度): 3.8949315211880005
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As the rapid proliferation of AI systems and harms spurs efforts in AI governance around the world, prioritizing among competing policy options has become increasingly challenging for policymakers and researchers. We introduce a methodology for identifying viable policy options to mitigate specified AI harms, helping policymakers and researchers target areas that warrant greater time and resource investment. This method combines participatory evaluation of policies, expert assessment of implementation costs, and an LLM-based assessment of perceived harm mitigation under each policy option. We leverage a genetic algorithm-based simulation study to explore a vast solution space of potential policy combinations, and examine how outcomes change under different weightings of cost, participatory input, and harm mitigation. We find that this method enables exploration of different balances between participatory and expert components, allowing policymakers and researchers to assess how much weight to assign to each. We argue that the diversity of viable policy combinations found by the genetic algorithm could be a useful starting point for deliberation. This method operationalizes existing work on participatory AI by integrating it directly into practical policy development pipelines.
- Abstract(参考訳): AIシステムと害が急速に普及し、世界中のAIガバナンスの取り組みが加速するにつれ、競合する政策オプションの優先順位付けは、政策立案者や研究者にとってますます困難になっている。
我々は、特定のAI害を軽減するための実行可能なポリシーオプションを特定するための方法論を導入し、政策立案者や研究者がより大きな時間とリソース投資を保証できる領域をターゲットにするのに役立つ。
本手法は、政策の参加的評価、実施コストのエキスパート評価、および各政策オプションの下での認識された害軽減のLLMに基づく評価を組み合わせる。
我々は、遺伝的アルゴリズムに基づくシミュレーション研究を利用して、潜在的ポリシーの組み合わせの広大な解空間を探索し、コスト、参加入力、害軽減の異なる重み付けの下で結果がどのように変化するかを調べる。
本手法により,参加型コンポーネントと専門家のバランスの異なるコンポーネントの探索が可能であり,政策立案者や研究者が各コンポーネントにどの程度の重量を割り当てるかを評価することができる。
遺伝的アルゴリズムによって見いだされるポリシーの組み合わせの多様性は、熟考の出発点として有用かもしれないと我々は主張する。
この方法は、参加型AIに関する既存の作業を実践的なポリシー開発パイプラインに直接組み込むことで運用する。
関連論文リスト
- Rethinking Policy Diversity in Ensemble Policy Gradient in Large-Scale Reinforcement Learning [38.79118914746284]
政治間の多様性が政策アンサンブルの学習効率に与える影響を理論的に分析する。
我々は、政策間のKL制約を通じて多様性を規制する結合政策最適化を提案する。
この結果から, 適切な規制下での多様な探索が, 安定した, サンプル効率の学習に欠かせないことが示唆された。
論文 参考訳(メタデータ) (2026-03-02T11:06:40Z) - Advancing Science- and Evidence-based AI Policy [163.43609502905707]
本稿では,AIの機会と課題に対処するために,エビデンスと政策の関係を最適化する方法の課題に取り組む。
i)AIのリスクとその効果的な緩和に関する研究、または(ii)これらのリスクに対処するための政策を提唱することで、この問題に対処する努力が増えている。
論文 参考訳(メタデータ) (2025-08-02T23:20:58Z) - Reinforcement Learning with Continuous Actions Under Unmeasured Confounding [14.510042451844766]
本稿では,連続行動空間を用いた強化学習におけるオフライン政策学習の課題に対処する。
我々は,ミニマックス推定器を開発し,クラス内最適ポリシーを特定するためのポリシー勾配に基づくアルゴリズムを提案する。
得られた最適方針の整合性、有限サンプル誤差境界、後悔境界に関する理論的結果を提供する。
論文 参考訳(メタデータ) (2025-05-01T04:55:29Z) - Envisioning Stakeholder-Action Pairs to Mitigate Negative Impacts of AI: A Participatory Approach to Inform Policy Making [2.981139602986498]
AIによるネガティブな影響の可能性は、世界中で急速に広まりつつある。
これにより、責任あるAIガバナンスの必要性が強まりました。
AIポリシが民主的な期待に沿うようにするためには、影響のある人たちの声やニーズを優先する方法が必要です。
論文 参考訳(メタデータ) (2025-01-24T22:57:18Z) - Reinforcement Learning with Heterogeneous Data: Estimation and Inference [84.72174994749305]
人口の不均一性に関する逐次的決定問題に対処するために,K-ヘテロ・マルコフ決定過程(K-ヘテロ・MDP)を導入する。
本稿では、ある政策の価値を推定するための自己クラスタ化政策評価(ACPE)と、ある政策クラスにおける最適な政策を推定するための自己クラスタ化政策イテレーション(ACPI)を提案する。
理論的な知見を裏付けるシミュレーションを行い,MIMIC-III標準データセットの実証的研究を行った。
論文 参考訳(メタデータ) (2022-01-31T20:58:47Z) - TOPS: Transition-based VOlatility-controlled Policy Search and its
Global Convergence [9.607937067646617]
本稿では,遷移型ボラティリティ制御ポリシサーチ(TOPS)を提案する。
このアルゴリズムは、連続した軌道ではなく(おそらく非連続的な)遷移から学習することで、リスク-逆問題の解法である。
理論的解析と実験結果の両方が、リスク・逆ポリシー探索手法の最先端レベルを示している。
論文 参考訳(メタデータ) (2022-01-24T18:29:23Z) - Building a Foundation for Data-Driven, Interpretable, and Robust Policy
Design using the AI Economist [67.08543240320756]
AIエコノミストフレームワークは,2段階強化学習とデータ駆動型シミュレーションを用いて,効果的な,柔軟な,解釈可能なポリシー設計を可能にする。
RLを用いて訓練されたログリニア政策は、過去の結果と比較して、公衆衛生と経済の両面から社会福祉を著しく改善することがわかった。
論文 参考訳(メタデータ) (2021-08-06T01:30:41Z) - Policy Information Capacity: Information-Theoretic Measure for Task
Complexity in Deep Reinforcement Learning [83.66080019570461]
課題の難易度について,環境にとらわれない,アルゴリズムにとらわれない2つの定量的指標を提案する。
これらの指標は、様々な代替案よりも、正規化タスク可解性スコアとの相関が高いことを示す。
これらのメトリクスは、鍵設計パラメータの高速かつ計算効率の良い最適化にも使用できる。
論文 参考訳(メタデータ) (2021-03-23T17:49:50Z) - Learning Adaptive Exploration Strategies in Dynamic Environments Through
Informed Policy Regularization [100.72335252255989]
本研究では,動的環境に効果的に適応する探索探索探索戦略の課題について検討する。
本稿では,各タスクにおける報酬を最大化するために訓練された情報ポリシを用いて,RNNベースのポリシーのトレーニングを規則化する新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-06T16:14:48Z) - Variational Policy Propagation for Multi-agent Reinforcement Learning [68.26579560607597]
本稿では,エージェント間の相互作用を通じて,共役ポリシーを学習するために,変動ポリシー伝搬 (VPP) という,共役型多エージェント強化学習アルゴリズムを提案する。
共同政策がマルコフランダム場(Markov Random Field)であることは、いくつかの穏やかな条件下で証明し、それによって政策空間を効果的に減少させる。
我々は、マルコフ確率場から効率的に行動をサンプリングでき、全体的な政策が微分可能であるようなポリシーにおいて、変動推論を特別な微分可能な層として統合する。
論文 参考訳(メタデータ) (2020-04-19T15:42:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。