論文の概要: Causal World Models by Unsupervised Deconfounding of Physical Dynamics
- arxiv url: http://arxiv.org/abs/2012.14228v1
- Date: Mon, 28 Dec 2020 13:44:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-19 11:12:21.998205
- Title: Causal World Models by Unsupervised Deconfounding of Physical Dynamics
- Title(参考訳): 物理力学の教師なし分解による因果世界モデル
- Authors: Minne Li, Mengyue Yang, Furui Liu, Xu Chen, Zhitang Chen, Jun Wang
- Abstract要約: 世界の精神モデルで内部を想像する能力は、人間の認知にとって極めて重要である。
本稿では,相互関係の教師なしモデリングを可能にするCausal World Models(CWMs)を提案する。
強化学習タスクの複雑性サンプルの削減と、反実物的推論の改善を示します。
- 参考スコア(独自算出の注目度): 20.447000858907646
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The capability of imagining internally with a mental model of the world is
vitally important for human cognition. If a machine intelligent agent can learn
a world model to create a "dream" environment, it can then internally ask
what-if questions -- simulate the alternative futures that haven't been
experienced in the past yet -- and make optimal decisions accordingly. Existing
world models are established typically by learning spatio-temporal regularities
embedded from the past sensory signal without taking into account confounding
factors that influence state transition dynamics. As such, they fail to answer
the critical counterfactual questions about "what would have happened" if a
certain action policy was taken. In this paper, we propose Causal World Models
(CWMs) that allow unsupervised modeling of relationships between the intervened
observations and the alternative futures by learning an estimator of the latent
confounding factors. We empirically evaluate our method and demonstrate its
effectiveness in a variety of physical reasoning environments. Specifically, we
show reductions in sample complexity for reinforcement learning tasks and
improvements in counterfactual physical reasoning.
- Abstract(参考訳): 世界の精神モデルで内部を想像する能力は、人間の認知にとって極めて重要である。
マシンインテリジェントなエージェントが世界モデルを学び、"恐ろしい"環境を作ることができれば、内部で何の質問 -- 過去に経験されていない代替の未来をシミュレート -- を行い、それに応じて最適な決定を行うことができます。
既存の世界モデルは通常、状態遷移ダイナミクスに影響を与える要因を考慮せずに、過去の感覚信号から埋め込まれた時空間正規性を学習することによって確立される。
そのため、特定の行動方針が取られた場合、「何が起こったのか」という批判的な反事実的疑問に答えられなかった。
本稿では,潜伏要因の推定器を学習することにより,干渉観測と代替未来との関係を教師なしでモデル化できる因果世界モデル(CWMs)を提案する。
本手法を実証的に評価し,様々な物理的推論環境での有効性を実証する。
具体的には,強化学習タスクにおけるサンプル複雑性の低減と,反事実的物理的推論の改善を示す。
関連論文リスト
- The Essential Role of Causality in Foundation World Models for Embodied
AI [79.12959738166327]
身体的なAIエージェントは、さまざまな現実世界環境で新しいタスクを実行する能力を必要とします。
現在の基礎モデルは、現実世界との物理的相互作用を正確にモデル化できないため、Embodied AIには不十分である。
因果関係の研究は、可能な相互作用の結果を正確に予測するために不可欠である、バリディカル世界モデルの構築に寄与する。
論文 参考訳(メタデータ) (2024-02-06T17:15:33Z) - Visual cognition in multimodal large language models [13.768104721550321]
本稿では、直観物理学、因果推論、直観心理学の分野における視覚に基づく大規模言語モデルの現状を評価する。
その結果、これらのモデルは、視覚データの処理と解釈において顕著な熟練度を示す一方で、これらの領域における人間の能力に欠けていることが判明した。
論文 参考訳(メタデータ) (2023-11-27T18:58:34Z) - ACQUIRED: A Dataset for Answering Counterfactual Questions In Real-Life
Videos [53.92440577914417]
ACQUIREDは3.9Kの注釈付きビデオで構成され、幅広いイベントタイプを包含し、ファーストパーソンとサードパーソンの両方の視点を取り入れている。
各ビデオは、物理的、社会的、時間的な3つの異なる推論の次元にまたがる質問で注釈付けされている。
我々は,現在最先端の言語のみおよびマルチモーダルモデルに対して,我々のデータセットをベンチマークし,実験結果から大きな性能差が示された。
論文 参考訳(メタデータ) (2023-11-02T22:17:03Z) - Interpretable Imitation Learning with Dynamic Causal Relations [65.18456572421702]
得られた知識を有向非巡回因果グラフの形で公開することを提案する。
また、この因果発見プロセスを状態依存的に設計し、潜在因果グラフのダイナミクスをモデル化する。
提案するフレームワークは,動的因果探索モジュール,因果符号化モジュール,予測モジュールの3つの部分から構成され,エンドツーエンドで訓練される。
論文 参考訳(メタデータ) (2023-09-30T20:59:42Z) - Model-Based Reinforcement Learning with Isolated Imaginations [61.67183143982074]
モデルに基づく強化学習手法であるIso-Dream++を提案する。
我々は、切り離された潜在的想像力に基づいて政策最適化を行う。
これにより、野生の混合力学源を孤立させることで、長い水平振動子制御タスクの恩恵を受けることができる。
論文 参考訳(メタデータ) (2023-03-27T02:55:56Z) - Modelling human logical reasoning process in dynamic environmental
stress with cognitive agents [13.171768256928509]
本研究では,ドリフト拡散と深部強化学習を統合した認知エージェントを提案する。
21,157個の論理応答の大規模なデータセットを活用することで、動的ストレスのパフォーマンスへの影響を調査する。
定量的に、このフレームワークは、主観的および刺激特異的な行動差を捉えることにより、認知モデリングを改善する。
全体として、この研究は、動的文脈における人間の論理的推論プロセスのバガリーをシミュレートし、理解するための、強力でデータ駆動の方法論を示している。
論文 参考訳(メタデータ) (2023-01-15T23:46:37Z) - CausalCity: Complex Simulations with Agency for Causal Discovery and
Reasoning [68.74447489372037]
本稿では,因果探索と反事実推論のためのアルゴリズムの開発を目的とした,高忠実度シミュレーション環境を提案する。
私たちの作業の中核となるコンポーネントは、複雑なシナリオを定義して作成することが簡単になるような、テキストの緊急性を導入することです。
我々は3つの最先端の手法による実験を行い、ベースラインを作成し、この環境の可利用性を強調する。
論文 参考訳(メタデータ) (2021-06-25T00:21:41Z) - Learning intuitive physics and one-shot imitation using
state-action-prediction self-organizing maps [0.0]
人間は探索と模倣によって学び、世界の因果モデルを構築し、両方を使って新しいタスクを柔軟に解決する。
このような特徴を生み出す単純だが効果的な教師なしモデルを提案する。
エージェントがアクティブな推論スタイルで柔軟に解決する、複数の関連するが異なる1ショットの模倣タスクに対して、その性能を示す。
論文 参考訳(メタデータ) (2020-07-03T12:29:11Z) - Causal Discovery in Physical Systems from Videos [123.79211190669821]
因果発見は人間の認知の中心にある。
本研究では,ビデオの因果発見の課題を,地層構造を監督せずにエンドツーエンドで検討する。
論文 参考訳(メタデータ) (2020-07-01T17:29:57Z) - Learning Opinion Dynamics From Social Traces [25.161493874783584]
本稿では,現実の社会的トレースに,生成的,エージェントライクな意見力学モデルを適用するための推論機構を提案する。
本稿では,古典的エージェントに基づく意見力学モデルから,その生成的モデルへの変換による提案について紹介する。
われわれのモデルをRedditの現実世界のデータに適用して、バックファイア効果の影響に関する長年にわたる疑問を探る。
論文 参考訳(メタデータ) (2020-06-02T14:48:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。