論文の概要: Incentives for Responsiveness, Instrumental Control and Impact
- arxiv url: http://arxiv.org/abs/2001.07118v3
- Date: Mon, 23 Jun 2025 03:26:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-26 14:36:54.473733
- Title: Incentives for Responsiveness, Instrumental Control and Impact
- Title(参考訳): 応答性・機器制御・衝撃のインセンティブ
- Authors: Ryan Carey, Eric Langlois, Chris van Merwijk, Shane Legg, Tom Everitt,
- Abstract要約: 本稿ではエージェントのインセンティブを記述する3つの概念を紹介する。
応答インセンティブは、センシティブな人口統計情報などの環境における変数が最適な政策の下で決定に影響を及ぼすことを示す。
統合制御インセンティブは、エージェントのポリシーが、ユーザの好みや指示など、環境の一部を操作するために選択されるかどうかを示す。
インパクトインセンティブは、エージェントが意図的に、あるいは他の目的で、どの変数に影響を及ぼすかを示す。
- 参考スコア(独自算出の注目度): 16.402874379606462
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce three concepts that describe an agent's incentives: response incentives indicate which variables in the environment, such as sensitive demographic information, affect the decision under the optimal policy. Instrumental control incentives indicate whether an agent's policy is chosen to manipulate part of its environment, such as the preferences or instructions of a user. Impact incentives indicate which variables an agent will affect, intentionally or otherwise. For each concept, we establish sound and complete graphical criteria, and discuss general classes of techniques that may be used to produce incentives for safe and fair agent behaviour. Finally, we outline how these notions may be generalised to multi-decision settings. This journal-length paper extends our conference publications "Incentives for Responsiveness, Instrumental Control and Impact" and "Agent Incentives: A Causal Perspective": the material on response incentives and instrumental control incentives is updated, while the work on impact incentives and multi-decision settings is entirely new.
- Abstract(参考訳): 反応インセンティブは、センシティブな人口統計情報などの環境内の変数が最適な政策の下で決定に影響を及ぼすことを示す。
機器制御インセンティブは、エージェントのポリシーが、ユーザの好みや指示など、環境の一部を操作するために選択されるかどうかを示す。
インパクトインセンティブは、エージェントが意図的に、あるいは他の目的で、どの変数に影響を及ぼすかを示す。
それぞれの概念に対して、健全で完全なグラフィカルな基準を確立し、安全で公正なエージェント行動のためのインセンティブを生み出すために使用されるテクニックの一般的なクラスについて論じる。
最後に、これらの概念をマルチ決定設定に一般化する方法について概説する。
本論文は, インセンティブ・インセンティブ・インセンティブ・インセンティブ・インセンティブ・インセンティブ・インセンティブ・インセンティブ・インセンティブ・インセンティブ・インセンティブ・インセンティブ・インセンティブ・インセンティブ・インセンティブ・インセンティブ・インセンティブ・インセンティブ・インセンティブ・インセンティブ・インセンティブ・インセンティブ・インセンティブ・インセンティブ・インセンティブ・インセンティブ・インセンティブ(Incentives for Responsiveness, Instrumental Control and Impact)と, "Agent Incentive Incentives: A Causal Perspective"を拡張した。
関連論文リスト
- Model Editing as a Double-Edged Sword: Steering Agent Ethical Behavior Toward Beneficence or Harm [57.00627691433355]
我々は、モデル編集タスクとしてエージェントの行動ステアリングをフレーム化し、振舞い編集という。
心理学的道徳理論に基づくベンチマークであるBehaviorBenchを紹介する。
行動編集は倫理的・好意的な行動を促進するためにも、逆に有害な行動や悪意のある行動を引き起こすためにも利用できることを実証する。
論文 参考訳(メタデータ) (2025-06-25T16:51:51Z) - Feature Responsiveness Scores: Model-Agnostic Explanations for Recourse [7.730963708373791]
消費者保護規則では、企業は意思決定対象に予測を説明する必要がある。
これらのプラクティスが、改善に繋がらない機能を強調して、消費者を弱める方法を示します。
応答性スコアに基づいて特徴を強調することにより,これらの課題に対処することを提案する。
論文 参考訳(メタデータ) (2024-10-29T23:37:49Z) - Counterfactual Effect Decomposition in Multi-Agent Sequential Decision Making [9.469649321687928]
本稿では,各エージェントに寄与し,各エージェントに寄与し,各要因に寄与するスコアを変動させることにより,その効果を分解する新たな因果的説明式を提案する。
エージェントの作用の総合的反事実効果は, エージェントの作用を伝播する効果を計測する要素と, 状態遷移を伝播する効果に関連する要素の2つに分解できることを示す。
論文 参考訳(メタデータ) (2024-10-16T13:20:35Z) - Causal Influence in Federated Edge Inference [34.487472866247586]
本稿では、未ラベルのストリーミングデータを用いて、接続性のある異種エージェントが推論を行う環境について考察する。
不確実性を克服するために、エージェントは、融合センターを通じてローカルな推論を交換することで互いに協力する。
エージェントの関与パターンや核融合センターの方針を反映した様々なシナリオを考察した。
論文 参考訳(メタデータ) (2024-05-02T13:06:50Z) - Nonparametric Partial Disentanglement via Mechanism Sparsity: Sparse
Actions, Interventions and Sparse Temporal Dependencies [58.179981892921056]
この研究は、メカニズムのスパーシティ正則化(英語版)と呼ばれる、アンタングルメントの新たな原理を導入する。
本稿では,潜在要因を同時に学習することで,絡み合いを誘発する表現学習手法を提案する。
学習した因果グラフをスパースに規則化することにより、潜伏因子を復元できることを示す。
論文 参考訳(メタデータ) (2024-01-10T02:38:21Z) - Interpretable Imitation Learning with Dynamic Causal Relations [65.18456572421702]
得られた知識を有向非巡回因果グラフの形で公開することを提案する。
また、この因果発見プロセスを状態依存的に設計し、潜在因果グラフのダイナミクスをモデル化する。
提案するフレームワークは,動的因果探索モジュール,因果符号化モジュール,予測モジュールの3つの部分から構成され,エンドツーエンドで訓練される。
論文 参考訳(メタデータ) (2023-09-30T20:59:42Z) - Learning Causally Disentangled Representations via the Principle of Independent Causal Mechanisms [17.074858228123706]
本稿では、因果関係の観測ラベルによって教師される因果関係の非絡み合い表現を学習するための枠組みを提案する。
この枠組みは, 極めて不整合な因果関係を生じさせ, 介入の堅牢性を向上し, 反事実発生と相容れないことを示す。
論文 参考訳(メタデータ) (2023-06-02T00:28:48Z) - Disentanglement of Latent Representations via Causal Interventions [11.238098505498165]
因果力学に着想を得た新しい解離法を提案する。
我々のモデルは、量子化されたベクトルを因果変数とみなし、因果グラフでそれらをリンクする。
グラフの因果的介入を行い、画像の変動のユニークな要因に影響を与える原子遷移を生成する。
論文 参考訳(メタデータ) (2023-02-02T04:37:29Z) - Information is Power: Intrinsic Control via Information Capture [110.3143711650806]
我々は,潜時状態空間モデルを用いて推定したエージェントの状態訪問のエントロピーを最小化する,コンパクトで汎用的な学習目的を論じる。
この目的は、不確実性の低減に対応する環境情報収集と、将来の世界状態の予測不可能性の低減に対応する環境制御の両方をエージェントに誘導する。
論文 参考訳(メタデータ) (2021-12-07T18:50:42Z) - Towards Robust and Adaptive Motion Forecasting: A Causal Representation
Perspective [72.55093886515824]
本稿では,3つの潜伏変数群からなる動的過程として,運動予測の因果的形式化を導入する。
我々は、因果グラフを近似するために、不変なメカニズムやスタイルの共創者の表現を分解するモジュラーアーキテクチャを考案する。
合成および実データを用いた実験結果から,提案した3つの成分は,学習した動き表現の頑健性と再利用性を大幅に向上することが示された。
論文 参考訳(メタデータ) (2021-11-29T18:59:09Z) - Systematic Evaluation of Causal Discovery in Visual Model Based
Reinforcement Learning [76.00395335702572]
AIと因果関係の中心的な目標は、抽象表現と因果構造を共同で発見することである。
因果誘導を研究するための既存の環境は、複雑なタスク固有の因果グラフを持つため、この目的には適していない。
本研究の目的は,高次変数の学習表現と因果構造の研究を促進することである。
論文 参考訳(メタデータ) (2021-07-02T05:44:56Z) - Agent Incentives: A Causal Perspective [14.8838654900972]
本稿では,因果影響図を用いたエージェントインセンティブの分析フレームワークを提案する。
本稿では,制御値に対する新しいグラフィカルな基準を提案し,その健全性と完全性を確立する。
これらの結果は,AIシステムの安全性と公平性を評価する上で有効であることを示す。
論文 参考訳(メタデータ) (2021-02-02T18:52:41Z) - Fairness, Welfare, and Equity in Personalized Pricing [88.9134799076718]
顧客特性に基づくパーソナライズ価格における公平性、福祉、株式の配慮の相互作用について検討する。
選択ワクチンの価格補助金と、マイクロクレジットの下流結果に対するパーソナライズされた利率の影響の2つの設定において、パーソナライズされた価格の潜在的利点を示す。
論文 参考訳(メタデータ) (2020-12-21T01:01:56Z) - Learning "What-if" Explanations for Sequential Decision-Making [92.8311073739295]
実世界の意思決定の解釈可能なパラメータ化を実証行動に基づいて構築することが不可欠である。
そこで我々は,「何」の結果に対する嗜好の観点から,報酬関数をモデル化し,専門家による意思決定の学習的説明を提案する。
本研究は,行動の正確かつ解釈可能な記述を回復する上で,実効的逆強化学習手法であるバッチの有効性を強調した。
論文 参考訳(メタデータ) (2020-07-02T14:24:17Z) - Inverse Active Sensing: Modeling and Understanding Timely
Decision-Making [111.07204912245841]
我々は,内因性,文脈依存型時間圧下でのエビデンスに基づく意思決定の一般的な設定のための枠組みを開発する。
意思決定戦略において、サプライズ、サスペンス、最適性の直感的な概念をモデル化する方法を実証する。
論文 参考訳(メタデータ) (2020-06-25T02:30:45Z) - On the Relationship Between Active Inference and Control as Inference [62.997667081978825]
アクティブ推論(英: Active Inference、AIF)は、生物学的エージェントがモデルエビデンスに束縛された変動を最小限に抑えることを示唆する脳科学の新たな枠組みである。
制御・アズ・推論(英: Control-as-Inference, CAI)は、意思決定を変分推論問題とみなす強化学習の枠組みである。
論文 参考訳(メタデータ) (2020-06-23T13:03:58Z) - Self-Attention Attribution: Interpreting Information Interactions Inside
Transformer [89.21584915290319]
本稿では,トランスフォーマー内の情報相互作用を解釈する自己帰属属性法を提案する。
本研究は,BERT に対する非目標攻撃の実装において,その属性を敵対パターンとして用いることができることを示す。
論文 参考訳(メタデータ) (2020-04-23T14:58:22Z) - CausalVAE: Structured Causal Disentanglement in Variational Autoencoder [52.139696854386976]
変分オートエンコーダ(VAE)の枠組みは、観測から独立した因子をアンタングルするために一般的に用いられる。
本稿では, 因果内因性因子を因果内因性因子に変換する因果層を含むVOEベースの新しいフレームワークCausalVAEを提案する。
その結果、CausalVAEが学習した因果表現は意味論的に解釈可能であり、DAG(Directed Acyclic Graph)としての因果関係は精度良く同定された。
論文 参考訳(メタデータ) (2020-04-18T20:09:34Z) - Resolving Spurious Correlations in Causal Models of Environments via
Interventions [2.836066255205732]
本稿では,強化学習環境の因果モデル推定の問題について考察する。
提案手法は,因果モデルにおける誤り発見のための介入を行うエージェントにインセンティブを与える報酬関数を設計する。
グリッドワールド環境における実験結果から,本手法はベースラインよりも因果モデルが優れていることが示された。
論文 参考訳(メタデータ) (2020-02-12T20:20:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。