論文の概要: The Incentives that Shape Behaviour
- arxiv url: http://arxiv.org/abs/2001.07118v2
- Date: Mon, 15 Mar 2021 20:02:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-08 05:04:43.127622
- Title: The Incentives that Shape Behaviour
- Title(参考訳): 行動を形成するインセンティブは
- Authors: Ryan Carey, Eric Langlois, Tom Everitt and Shane Legg
- Abstract要約: インセンティブを定式化し、任意の決定因果影響図において、インセンティブを検出するためのユニークな基準を示す。
これらのインセンティブが、公正性とAI安全アプリケーションの両方において、エージェントインセンティブを予測する方法を示す。
- 参考スコア(独自算出の注目度): 17.12590828259331
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Which variables does an agent have an incentive to control with its decision,
and which variables does it have an incentive to respond to? We formalise these
incentives, and demonstrate unique graphical criteria for detecting them in any
single decision causal influence diagram. To this end, we introduce structural
causal influence models, a hybrid of the influence diagram and structural
causal model frameworks. Finally, we illustrate how these incentives predict
agent incentives in both fairness and AI safety applications.
- Abstract(参考訳): エージェントは、その決定で制御するインセンティブを持つか、どの変数に対応するインセンティブを持つのか?
我々は、これらのインセンティブを形式化し、単一の決定因果影響図でそれらを検出するためのユニークなグラフィカルな基準を示す。
この目的のために,構造的因果影響モデル,影響図のハイブリッド化,構造的因果モデルフレームワークを提案する。
最後に、これらのインセンティブが公正性とAI安全アプリケーションの両方においてエージェントインセンティブを予測する方法について説明する。
関連論文リスト
- Nonparametric Partial Disentanglement via Mechanism Sparsity: Sparse
Actions, Interventions and Sparse Temporal Dependencies [58.179981892921056]
この研究は、メカニズムのスパーシティ正則化(英語版)と呼ばれる、アンタングルメントの新たな原理を導入する。
本稿では,潜在要因を同時に学習することで,絡み合いを誘発する表現学習手法を提案する。
学習した因果グラフをスパースに規則化することにより、潜伏因子を復元できることを示す。
論文 参考訳(メタデータ) (2024-01-10T02:38:21Z) - Interpretable Imitation Learning with Dynamic Causal Relations [65.18456572421702]
得られた知識を有向非巡回因果グラフの形で公開することを提案する。
また、この因果発見プロセスを状態依存的に設計し、潜在因果グラフのダイナミクスをモデル化する。
提案するフレームワークは,動的因果探索モジュール,因果符号化モジュール,予測モジュールの3つの部分から構成され,エンドツーエンドで訓練される。
論文 参考訳(メタデータ) (2023-09-30T20:59:42Z) - Learning Causally Disentangled Representations via the Principle of Independent Causal Mechanisms [17.074858228123706]
本稿では、因果関係の観測ラベルによって教師される因果関係の非絡み合い表現を学習するための枠組みを提案する。
この枠組みは, 極めて不整合な因果関係を生じさせ, 介入の堅牢性を向上し, 反事実発生と相容れないことを示す。
論文 参考訳(メタデータ) (2023-06-02T00:28:48Z) - Disentanglement of Latent Representations via Causal Interventions [11.238098505498165]
因果力学に着想を得た新しい解離法を提案する。
我々のモデルは、量子化されたベクトルを因果変数とみなし、因果グラフでそれらをリンクする。
グラフの因果的介入を行い、画像の変動のユニークな要因に影響を与える原子遷移を生成する。
論文 参考訳(メタデータ) (2023-02-02T04:37:29Z) - Towards Robust and Adaptive Motion Forecasting: A Causal Representation
Perspective [72.55093886515824]
本稿では,3つの潜伏変数群からなる動的過程として,運動予測の因果的形式化を導入する。
我々は、因果グラフを近似するために、不変なメカニズムやスタイルの共創者の表現を分解するモジュラーアーキテクチャを考案する。
合成および実データを用いた実験結果から,提案した3つの成分は,学習した動き表現の頑健性と再利用性を大幅に向上することが示された。
論文 参考訳(メタデータ) (2021-11-29T18:59:09Z) - Systematic Evaluation of Causal Discovery in Visual Model Based
Reinforcement Learning [76.00395335702572]
AIと因果関係の中心的な目標は、抽象表現と因果構造を共同で発見することである。
因果誘導を研究するための既存の環境は、複雑なタスク固有の因果グラフを持つため、この目的には適していない。
本研究の目的は,高次変数の学習表現と因果構造の研究を促進することである。
論文 参考訳(メタデータ) (2021-07-02T05:44:56Z) - Agent Incentives: A Causal Perspective [14.8838654900972]
本稿では,因果影響図を用いたエージェントインセンティブの分析フレームワークを提案する。
本稿では,制御値に対する新しいグラフィカルな基準を提案し,その健全性と完全性を確立する。
これらの結果は,AIシステムの安全性と公平性を評価する上で有効であることを示す。
論文 参考訳(メタデータ) (2021-02-02T18:52:41Z) - On the Relationship Between Active Inference and Control as Inference [62.997667081978825]
アクティブ推論(英: Active Inference、AIF)は、生物学的エージェントがモデルエビデンスに束縛された変動を最小限に抑えることを示唆する脳科学の新たな枠組みである。
制御・アズ・推論(英: Control-as-Inference, CAI)は、意思決定を変分推論問題とみなす強化学習の枠組みである。
論文 参考訳(メタデータ) (2020-06-23T13:03:58Z) - CausalVAE: Structured Causal Disentanglement in Variational Autoencoder [52.139696854386976]
変分オートエンコーダ(VAE)の枠組みは、観測から独立した因子をアンタングルするために一般的に用いられる。
本稿では, 因果内因性因子を因果内因性因子に変換する因果層を含むVOEベースの新しいフレームワークCausalVAEを提案する。
その結果、CausalVAEが学習した因果表現は意味論的に解釈可能であり、DAG(Directed Acyclic Graph)としての因果関係は精度良く同定された。
論文 参考訳(メタデータ) (2020-04-18T20:09:34Z) - Resolving Spurious Correlations in Causal Models of Environments via
Interventions [2.836066255205732]
本稿では,強化学習環境の因果モデル推定の問題について考察する。
提案手法は,因果モデルにおける誤り発見のための介入を行うエージェントにインセンティブを与える報酬関数を設計する。
グリッドワールド環境における実験結果から,本手法はベースラインよりも因果モデルが優れていることが示された。
論文 参考訳(メタデータ) (2020-02-12T20:20:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。