論文の概要: Discovering Agents
- arxiv url: http://arxiv.org/abs/2208.08345v1
- Date: Wed, 17 Aug 2022 15:13:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-18 12:21:09.308726
- Title: Discovering Agents
- Title(参考訳): エージェントの発見
- Authors: Zachary Kenton, Ramana Kumar, Sebastian Farquhar, Jonathan Richens,
Matt MacDermott and Tom Everitt
- Abstract要約: エージェントの因果モデルは、機械学習システムの安全性の側面を分析するために使われてきた。
本稿では, エージェントの因果的定義を初めて提唱する。エージェントは, アクションが世界に影響を与える場合, エージェントが政策に適応するシステムであることを概ね示唆する。
- 参考スコア(独自算出の注目度): 10.751378433775606
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Causal models of agents have been used to analyse the safety aspects of
machine learning systems. But identifying agents is non-trivial -- often the
causal model is just assumed by the modeler without much justification -- and
modelling failures can lead to mistakes in the safety analysis. This paper
proposes the first formal causal definition of agents -- roughly that agents
are systems that would adapt their policy if their actions influenced the world
in a different way. From this we derive the first causal discovery algorithm
for discovering agents from empirical data, and give algorithms for translating
between causal models and game-theoretic influence diagrams. We demonstrate our
approach by resolving some previous confusions caused by incorrect causal
modelling of agents.
- Abstract(参考訳): エージェントの因果モデルは、機械学習システムの安全性の側面を分析するために使われてきた。
しかし、エージェントを特定することは非自明であり、多くの場合、因果モデルは、正当化のあまりないモデリング者によって仮定される。
本稿では,エージェントの因果的定義を初めて提唱する。エージェントは,アクションが異なる方法で世界に影響を与える場合,そのポリシーに適応するシステムである。
このことから,経験的データからエージェントを発見するための最初の因果探索アルゴリズムが導出され,因果モデルとゲーム理論の影響図を翻訳するアルゴリズムが提供される。
エージェントの誤った因果モデリングによる過去の混乱を解消することで,我々のアプローチを実証する。
関連論文リスト
- Generative Intervention Models for Causal Perturbation Modeling [80.72074987374141]
多くの応用において、システムのメカニズムが外部の摂動によって変更されるかは未定である。
本稿では、これらの摂動特徴を原子間干渉による分布にマッピングする方法を学習する生成的介入モデル(GIM)を提案する。
論文 参考訳(メタデータ) (2024-11-21T10:37:57Z) - Robust agents learn causal world models [7.845222238426246]
データ生成過程の因果関係を近似的に学習したと考えられる。
転帰学習や因果推論など,いくつかの研究領域において,この結果がもたらす意味について論じる。
論文 参考訳(メタデータ) (2024-02-16T18:29:19Z) - On the Fly Detection of Root Causes from Observed Data with Application to IT Systems [3.3321350585823826]
本稿では,しきい値に基づくITシステムを表現するための構造因果モデルを提案する。
このようなシステムにおける異常の根本原因を迅速に検出するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-02-09T16:10:19Z) - Limitations of Agents Simulated by Predictive Models [1.6649383443094403]
エージェントとなると予測モデルが失敗する2つの構造的理由を概説する。
いずれの障害も環境からのフィードバックループを組み込むことで修正可能であることを示す。
我々の治療は、これらの障害モードの統一的なビューを提供し、オンライン学習でオフライン学習ポリシーを微調整することで、より効果的になる理由を疑問視する。
論文 参考訳(メタデータ) (2024-02-08T17:08:08Z) - Interpretable Imitation Learning with Dynamic Causal Relations [65.18456572421702]
得られた知識を有向非巡回因果グラフの形で公開することを提案する。
また、この因果発見プロセスを状態依存的に設計し、潜在因果グラフのダイナミクスをモデル化する。
提案するフレームワークは,動的因果探索モジュール,因果符号化モジュール,予測モジュールの3つの部分から構成され,エンドツーエンドで訓練される。
論文 参考訳(メタデータ) (2023-09-30T20:59:42Z) - Nonparametric Identifiability of Causal Representations from Unknown
Interventions [63.1354734978244]
本研究では, 因果表現学習, 潜伏因果変数を推定するタスク, およびそれらの変数の混合から因果関係を考察する。
我々のゴールは、根底にある真理潜入者とその因果グラフの両方を、介入データから解決不可能なあいまいさの集合まで識別することである。
論文 参考訳(メタデータ) (2023-06-01T10:51:58Z) - Estimation of Bivariate Structural Causal Models by Variational Gaussian
Process Regression Under Likelihoods Parametrised by Normalising Flows [74.85071867225533]
因果機構は構造因果モデルによって記述できる。
最先端の人工知能の大きな欠点の1つは、説明責任の欠如である。
論文 参考訳(メタデータ) (2021-09-06T14:52:58Z) - Causal Analysis of Agent Behavior for AI Safety [16.764915383473326]
人工エージェントの行動を促す因果メカニズムを解明するための方法論を提案する。
6つのユースケースをカバーし、アナリストがエージェントについて尋ねる典型的な質問にそれぞれ対処します。
論文 参考訳(メタデータ) (2021-03-05T20:51:12Z) - A General Framework for Distributed Inference with Uncertain Models [14.8884251609335]
異種エージェントのネットワークを用いた分散分類の問題について検討する。
我々は、エージェントの不確実性を可能性に組み込む不確実性モデルの概念に基づいて構築する。
論文 参考訳(メタデータ) (2020-11-20T22:17:12Z) - Structural Causal Models Are (Solvable by) Credal Networks [70.45873402967297]
因果推論は、干潟網の更新のための標準的なアルゴリズムによって得ることができる。
この貢献は, 干潟ネットワークによる構造因果モデルを表現するための体系的なアプローチと見なされるべきである。
実験により, 実規模問題における因果推論には, クレーダルネットワークの近似アルゴリズムがすぐに利用できることがわかった。
論文 参考訳(メタデータ) (2020-08-02T11:19:36Z) - Estimating Generalization under Distribution Shifts via Domain-Invariant
Representations [75.74928159249225]
未知の真のターゲットラベルのプロキシとして、ドメイン不変の予測器のセットを使用します。
結果として生じるリスク見積の誤差は、プロキシモデルのターゲットリスクに依存する。
論文 参考訳(メタデータ) (2020-07-06T17:21:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。