論文の概要: Towards intervention-centric causal reasoning in learning agents
- arxiv url: http://arxiv.org/abs/2005.12968v1
- Date: Tue, 26 May 2020 18:53:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-28 23:39:22.721407
- Title: Towards intervention-centric causal reasoning in learning agents
- Title(参考訳): 学習エージェントの介入中心因果推論に向けて
- Authors: Benjamin Lansdell
- Abstract要約: 高次元環境下での因果学習にメタラーニングアプローチを用いる方法を示す。
メタ強化学習アルゴリズムは、観察因果学習タスクで伝達される関係を学習するために使用される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Interventions are central to causal learning and reasoning. Yet ultimately an
intervention is an abstraction: an agent embedded in a physical environment
(perhaps modeled as a Markov decision process) does not typically come equipped
with the notion of an intervention -- its action space is typically
ego-centric, without actions of the form `intervene on X'. Such a
correspondence between ego-centric actions and interventions would be
challenging to hard-code. It would instead be better if an agent learnt which
sequence of actions allow it to make targeted manipulations of the environment,
and learnt corresponding representations that permitted learning from
observation. Here we show how a meta-learning approach can be used to perform
causal learning in this challenging setting, where the action-space is not a
set of interventions and the observation space is a high-dimensional space with
a latent causal structure. A meta-reinforcement learning algorithm is used to
learn relationships that transfer on observational causal learning tasks. This
work shows how advances in deep reinforcement learning and meta-learning can
provide intervention-centric causal learning in high-dimensional environments
with a latent causal structure.
- Abstract(参考訳): 介入は因果学習と推論の中心である。
物理的環境(おそらくマルコフ決定プロセスとしてモデル化されている)に埋め込まれたエージェントは、通常、介入の概念を持っていない。
このようなエゴ中心の行動と介入の対応は、ハードコーディングが難しい。
その代わり、エージェントがどの一連のアクションが環境を標的に操作できるかを学習し、観察から学習を許容する対応する表現を学習した方がよいでしょう。
ここでは,行動空間は介入の集合ではなく,観測空間は潜伏因果構造を持つ高次元空間である,この困難な状況下での因果学習にメタラーニングアプローチをいかに活用するかを示す。
メタ強化学習アルゴリズムは、観察因果学習タスクで伝達される関係を学習するために使用される。
本研究は,深層強化学習とメタ学習の進歩が,潜在因果構造を持つ高次元環境における介入中心因果学習にどのように役立つかを示す。
関連論文リスト
- Dynamic planning in hierarchical active inference [0.0]
人間の脳が認知決定に関連する運動軌跡を推論し、導入する能力について述べる。
本研究では,アクティブ推論における動的計画の話題に焦点を当てた。
論文 参考訳(メタデータ) (2024-02-18T17:32:53Z) - Sim-to-Real Causal Transfer: A Metric Learning Approach to
Causally-Aware Interaction Representations [62.48505112245388]
エージェント相互作用の現代的表現の因果認識を詳細に検討する。
近年の表現は、非因果剤の摂動に対して部分的に耐性があることが示されている。
因果アノテーションを用いた潜在表現を正規化するための計量学習手法を提案する。
論文 参考訳(メタデータ) (2023-12-07T18:57:03Z) - When to Ask for Help: Proactive Interventions in Autonomous
Reinforcement Learning [57.53138994155612]
強化学習の長期的な目標は、世界で自律的に対話し学習できるエージェントを設計することである。
重要な課題は、ロボットアームが物体をテーブルから押し出したときなど、外部からの援助を必要とする不可逆状態の存在である。
本研究では,非可逆状態の検出と回避を効率よく学習し,エージェントが侵入した場合に積極的に支援を求めるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-10-19T17:57:24Z) - Homomorphism Autoencoder -- Learning Group Structured Representations from Observed Transitions [51.71245032890532]
本研究では,世界に作用するエージェントが,それを修飾する動作と整合した感覚情報の内部表現を学習できるようにする手法を提案する。
既存の作業とは対照的に、我々のアプローチはグループの事前の知識を必要とせず、エージェントが実行可能なアクションのセットを制限しない。
論文 参考訳(メタデータ) (2022-07-25T11:22:48Z) - Towards a Grounded Theory of Causation for Embodied AI [12.259552039796027]
既存のフレームワークは、どの行動方針や状態空間の物理的変換を介入とみなすべきかを示すものではありません。
このフレームワークは、例えばポリシーを実行するエージェントによって誘導される状態空間の変換としてアクションを記述する。
これにより、マイクロ状態空間の変換とその抽象モデルの両方を均一に記述することができる。
論文 参考訳(メタデータ) (2022-06-28T12:56:43Z) - Stochastic Coherence Over Attention Trajectory For Continuous Learning
In Video Streams [64.82800502603138]
本稿では,映像ストリーム中のピクセルワイズ表現を段階的かつ自律的に開発するための,ニューラルネットワークに基づく新しいアプローチを提案する。
提案手法は, 参加者の入場地を観察することで, エージェントが学習できる, 人間の様の注意機構に基づく。
実験では,3次元仮想環境を利用して,映像ストリームを観察することで,エージェントが物体の識別を学べることを示す。
論文 参考訳(メタデータ) (2022-04-26T09:52:31Z) - Inference of Affordances and Active Motor Control in Simulated Agents [0.5161531917413706]
本稿では,出力確率,時間的予測,モジュール型人工ニューラルネットワークアーキテクチャを提案する。
我々のアーキテクチャは、割当マップと解釈できる潜在状態が発達していることを示す。
アクティブな推論と組み合わせることで、フレキシブルでゴール指向の動作が実行可能であることを示す。
論文 参考訳(メタデータ) (2022-02-23T14:13:04Z) - Learning to reason about and to act on physical cascading events [72.90358875111883]
エージェントが物理的にシミュレートされた動的シーンのビデオを表示する, Em Cascade という新しい教師あり学習装置を導入する。
エージェントは介入してイベントのカスケードをトリガーするように要求され、システムが"偽造的"な目標に達する。
提案手法は,これまで見つからなかった複雑な場面に介入する命令を効果的に追従することを学ぶ。
論文 参考訳(メタデータ) (2022-02-02T16:17:42Z) - Shaking the foundations: delusions in sequence models for interaction
and control [45.34593341136043]
我々は、シーケンスモデルが「行動の原因と効果の理解を欠く」ことを示し、それらが自己提案的妄想によって誤った推論を引き出す結果となった。
教師付き学習では,実ミス信号と反実エラー信号とをそれぞれ学習することで,データに対する条件付けや介入をシステムに教えることができることを示す。
論文 参考訳(メタデータ) (2021-10-20T23:31:05Z) - Unsupervised Discriminative Embedding for Sub-Action Learning in Complex
Activities [54.615003524001686]
本稿では,複雑な活動における教師なしサブアクション学習の新たなアプローチを提案する。
提案手法は,視覚表現と時間表現の両方を,サブアクションを識別的に学習する潜在空間にマッピングする。
視覚-時空間埋め込みと判別的潜在概念の組み合わせにより,教師なし設定でロバストな動作表現を学習できることを示す。
論文 参考訳(メタデータ) (2021-04-30T20:07:27Z) - On the Sensory Commutativity of Action Sequences for Embodied Agents [2.320417845168326]
群論の数学的形式論に基づくエンボディエージェントの知覚について検討する。
本稿では,エージェントの自由度が環境に与える影響を計測する感覚コミュニケーション確率基準を提案する。
本研究では,SCPと行動系列の可換性を用いて環境中の物体を学習する方法を実証的に説明する。
論文 参考訳(メタデータ) (2020-02-13T16:58:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。