Fugu-MT 論文翻訳(概要): Causal World Models by Unsupervised Deconfounding of Physical Dynamics

論文の概要: Causal World Models by Unsupervised Deconfounding of Physical Dynamics

arxiv url: http://arxiv.org/abs/2012.14228v1
Date: Mon, 28 Dec 2020 13:44:36 GMT
ステータス: 翻訳完了
システム内更新日: 2021-04-19 11:12:21.998205
Title: Causal World Models by Unsupervised Deconfounding of Physical Dynamics
Title（参考訳）: 物理力学の教師なし分解による因果世界モデル
Authors: Minne Li, Mengyue Yang, Furui Liu, Xu Chen, Zhitang Chen, Jun Wang
Abstract要約: 世界の精神モデルで内部を想像する能力は、人間の認知にとって極めて重要である。本稿では,相互関係の教師なしモデリングを可能にするCausal World Models(CWMs)を提案する。強化学習タスクの複雑性サンプルの削減と、反実物的推論の改善を示します。
参考スコア（独自算出の注目度）: 20.447000858907646
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The capability of imagining internally with a mental model of the world is vitally important for human cognition. If a machine intelligent agent can learn a world model to create a "dream" environment, it can then internally ask what-if questions -- simulate the alternative futures that haven't been experienced in the past yet -- and make optimal decisions accordingly. Existing world models are established typically by learning spatio-temporal regularities embedded from the past sensory signal without taking into account confounding factors that influence state transition dynamics. As such, they fail to answer the critical counterfactual questions about "what would have happened" if a certain action policy was taken. In this paper, we propose Causal World Models (CWMs) that allow unsupervised modeling of relationships between the intervened observations and the alternative futures by learning an estimator of the latent confounding factors. We empirically evaluate our method and demonstrate its effectiveness in a variety of physical reasoning environments. Specifically, we show reductions in sample complexity for reinforcement learning tasks and improvements in counterfactual physical reasoning.
Abstract（参考訳）: 世界の精神モデルで内部を想像する能力は、人間の認知にとって極めて重要である。マシンインテリジェントなエージェントが世界モデルを学び、"恐ろしい"環境を作ることができれば、内部で何の質問 -- 過去に経験されていない代替の未来をシミュレート -- を行い、それに応じて最適な決定を行うことができます。既存の世界モデルは通常、状態遷移ダイナミクスに影響を与える要因を考慮せずに、過去の感覚信号から埋め込まれた時空間正規性を学習することによって確立される。そのため、特定の行動方針が取られた場合、「何が起こったのか」という批判的な反事実的疑問に答えられなかった。本稿では,潜伏要因の推定器を学習することにより,干渉観測と代替未来との関係を教師なしでモデル化できる因果世界モデル(CWMs)を提案する。本手法を実証的に評価し,様々な物理的推論環境での有効性を実証する。具体的には,強化学習タスクにおけるサンプル複雑性の低減と,反事実的物理的推論の改善を示す。

関連論文リスト

Do Vision-Language Models Have Internal World Models? Towards an Atomic Evaluation [54.3628937181904]
内部世界モデル(英語版)(WM)は、エージェントが世界の状態を理解し、遷移を予測することを可能にする。近年,OpenAI o3, GPT-4o, Geminiなどの大規模視覚言語モデル(VLM)は汎用的なWMとしての可能性を示している。
論文参考訳（メタデータ） (2025-06-27T03:24:29Z)
Learning Local Causal World Models with State Space Models and Attention [1.5498250598583487]
本研究では,SSMが単純な環境のダイナミクスをモデル化し,因果モデルを同時に学習できることを示す。我々は、SSMの強みに傾倒するさらなる実験の道を開き、因果意識でそれらをさらに強化する。
論文参考訳（メタデータ） (2025-05-04T11:57:02Z)
When Counterfactual Reasoning Fails: Chaos and Real-World Complexity [1.9223856107206057]
構造因果モデルの枠組みにおける反実的推論の限界について検討する。低次モデル不確実性やカオス力学といった現実的な仮定は、直観に反する結果をもたらす。この研究は、カオスと不確実性を特徴とする設定に反実的推論を適用する際に注意を促している。
論文参考訳（メタデータ） (2025-03-31T08:14:51Z)
Emergent Abilities in Large Language Models: A Survey [9.50669909278749]
大規模言語モデル(LLM)は、人工知能への最も有望な研究の流れの1つとして、新しい技術革命を導いている。これらのモデルのスケーリングは、以前は観測されていなかった様々な創発的能力と関連付けられている。これらの能力は、高度な推論やコンテキスト内学習からコーディングや問題解決まで多岐にわたる。トランスフォーメーションの可能性にもかかわらず、創発的能力は未理解のままであり、定義、性質、予測可能性、含意について誤解を招く。
論文参考訳（メタデータ） (2025-02-28T01:20:01Z)
ViRAC: A Vision-Reasoning Agent Head Movement Control Framework in Arbitrary Virtual Environments [0.13654846342364302]
本稿では,大規模モデルの常識的知識と推論能力を活用するViRACを提案する。 ViRACは最近の最先端技術よりも自然でコンテキスト対応の頭部回転を生成する。
論文参考訳（メタデータ） (2025-02-14T09:46:43Z)
Making Large Language Models into World Models with Precondition and Effect Knowledge [1.8561812622368763]
本研究では,Large Language Models (LLM) を2つの重要な世界モデル関数の実行に利用することができることを示す。我々は、我々のモデルが生み出す前提条件と効果知識が、世界力学の人間の理解と一致していることを検証する。
論文参考訳（メタデータ） (2024-09-18T19:28:04Z)
Towards Interpretable Visuo-Tactile Predictive Models for Soft Robot Interactions [2.4100803794273]
ロボットエージェントの現実の状況への統合は、知覚能力に依存している。我々は、周囲を探索するために、様々な感覚モダリティの融合の上に構築する。生の感覚モダリティに応用されたディープラーニングは、実行可能な選択肢を提供する。我々は、知覚モデルとその制御目的への含意の展望を掘り下げる。
論文参考訳（メタデータ） (2024-07-16T21:46:04Z)
Learning World Models With Hierarchical Temporal Abstractions: A Probabilistic Perspective [2.61072980439312]
内部世界モデルを開発するためのフォーマリズムの開発は、人工知能と機械学習の分野における重要な研究課題である。この論文は、状態空間モデルを内部世界モデルとして広く用いられることによるいくつかの制限を識別する。形式主義におけるモデルの構造は、信念の伝播を用いた正確な確率的推論を促進するとともに、時間を通してのバックプロパゲーションによるエンドツーエンドの学習を促進する。これらの形式主義は、世界の状態における不確実性の概念を統合し、現実世界の性質をエミュレートし、その予測の信頼性を定量化する能力を向上させる。
論文参考訳（メタデータ） (2024-04-24T12:41:04Z)
The Essential Role of Causality in Foundation World Models for Embodied AI [102.75402420915965]
身体的なAIエージェントは、さまざまな現実世界環境で新しいタスクを実行する能力を必要とします。現在の基礎モデルは物理的相互作用を正確にモデル化することができないため、Embodied AIには不十分である。因果関係の研究は、検証世界モデルの構築に寄与する。
論文参考訳（メタデータ） (2024-02-06T17:15:33Z)
ACQUIRED: A Dataset for Answering Counterfactual Questions In Real-Life Videos [53.92440577914417]
ACQUIREDは3.9Kの注釈付きビデオで構成され、幅広いイベントタイプを包含し、ファーストパーソンとサードパーソンの両方の視点を取り入れている。各ビデオは、物理的、社会的、時間的な3つの異なる推論の次元にまたがる質問で注釈付けされている。我々は,現在最先端の言語のみおよびマルチモーダルモデルに対して,我々のデータセットをベンチマークし,実験結果から大きな性能差が示された。
論文参考訳（メタデータ） (2023-11-02T22:17:03Z)
Interpretable Imitation Learning with Dynamic Causal Relations [65.18456572421702]
得られた知識を有向非巡回因果グラフの形で公開することを提案する。また、この因果発見プロセスを状態依存的に設計し、潜在因果グラフのダイナミクスをモデル化する。提案するフレームワークは,動的因果探索モジュール,因果符号化モジュール,予測モジュールの3つの部分から構成され,エンドツーエンドで訓練される。
論文参考訳（メタデータ） (2023-09-30T20:59:42Z)
Model-Based Reinforcement Learning with Isolated Imaginations [61.67183143982074]
モデルに基づく強化学習手法であるIso-Dream++を提案する。我々は、切り離された潜在的想像力に基づいて政策最適化を行う。これにより、野生の混合力学源を孤立させることで、長い水平振動子制御タスクの恩恵を受けることができる。
論文参考訳（メタデータ） (2023-03-27T02:55:56Z)
CausalCity: Complex Simulations with Agency for Causal Discovery and Reasoning [68.74447489372037]
本稿では,因果探索と反事実推論のためのアルゴリズムの開発を目的とした,高忠実度シミュレーション環境を提案する。私たちの作業の中核となるコンポーネントは、複雑なシナリオを定義して作成することが簡単になるような、テキストの緊急性を導入することです。我々は3つの最先端の手法による実験を行い、ベースラインを作成し、この環境の可利用性を強調する。
論文参考訳（メタデータ） (2021-06-25T00:21:41Z)
Causal Discovery in Physical Systems from Videos [123.79211190669821]
因果発見は人間の認知の中心にある。本研究では,ビデオの因果発見の課題を,地層構造を監督せずにエンドツーエンドで検討する。
論文参考訳（メタデータ） (2020-07-01T17:29:57Z)
Learning Opinion Dynamics From Social Traces [25.161493874783584]
本稿では,現実の社会的トレースに,生成的,エージェントライクな意見力学モデルを適用するための推論機構を提案する。本稿では,古典的エージェントに基づく意見力学モデルから,その生成的モデルへの変換による提案について紹介する。われわれのモデルをRedditの現実世界のデータに適用して、バックファイア効果の影響に関する長年にわたる疑問を探る。
論文参考訳（メタデータ） (2020-06-02T14:48:17Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。