論文の概要: Curious Causality-Seeking Agents Learn Meta Causal World
- arxiv url: http://arxiv.org/abs/2506.23068v1
- Date: Sun, 29 Jun 2025 03:05:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 21:27:53.701185
- Title: Curious Causality-Seeking Agents Learn Meta Causal World
- Title(参考訳): 謎の因果関係を探索するエージェントがメタ因果世界を学ぶ
- Authors: Zhiyu Zhao, Haoxuan Li, Haifeng Zhang, Jun Wang, Francesco Faccio, Jürgen Schmidhuber, Mengyue Yang,
- Abstract要約: textbfMeta-Causal Graphを世界モデルとして紹介する。
単一のMeta-Causal Graphは複数の因果部分グラフで構成され、それぞれがメタ状態によってトリガーされる。
本手法は因果ダイナミクスのシフトを頑健に捉え,前例のない文脈に効果的に一般化する。
- 参考スコア(独自算出の注目度): 33.20398438220672
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: When building a world model, a common assumption is that the environment has a single, unchanging underlying causal rule, like applying Newton's laws to every situation. In reality, what appears as a drifting causal mechanism is often the manifestation of a fixed underlying mechanism seen through a narrow observational window. This brings about a problem that, when building a world model, even subtle shifts in policy or environment states can alter the very observed causal mechanisms. In this work, we introduce the \textbf{Meta-Causal Graph} as world models, a minimal unified representation that efficiently encodes the transformation rules governing how causal structures shift across different latent world states. A single Meta-Causal Graph is composed of multiple causal subgraphs, each triggered by meta state, which is in the latent state space. Building on this representation, we introduce a \textbf{Causality-Seeking Agent} whose objectives are to (1) identify the meta states that trigger each subgraph, (2) discover the corresponding causal relationships by agent curiosity-driven intervention policy, and (3) iteratively refine the Meta-Causal Graph through ongoing curiosity-driven exploration and agent experiences. Experiments on both synthetic tasks and a challenging robot arm manipulation task demonstrate that our method robustly captures shifts in causal dynamics and generalizes effectively to previously unseen contexts.
- Abstract(参考訳): 世界モデルを構築するとき、一般的な仮定は、ニュートンの法則をあらゆる状況に適用するなど、環境は単一の、変化のない基本的な因果律を持っているということである。
実際には、漂流因果機構として現れるものは、しばしば狭い観測窓から見られる固定された基盤機構の顕在化である。
これは、世界モデルを構築する際に、政策や環境状態の微妙な変化さえも、非常に観察された因果メカニズムを変えることができるという問題を引き起こす。
本研究では,世界モデルとして「textbf{Meta-Causal Graph}」を導入する。これは最小限の統一表現であり,因果構造が様々な潜在世界状態間でどのように変化するかを決定する変換規則を効率的に符号化する。
単一のMeta-Causal Graphは複数の因果部分グラフで構成され、それぞれが潜伏状態空間にあるメタ状態によってトリガーされる。
この表現に基づいて、(1)各サブグラフをトリガーするメタ状態を特定すること、(2)エージェント好奇心による介入政策によって対応する因果関係を発見すること、(3)継続的な好奇心による探索とエージェント体験を通じてメタ因果グラフを反復的に洗練することを目的とする「textbf{Causality-Seeking Agent」を導入する。
合成タスクとロボットアーム操作タスクの両方の実験により、我々の手法は因果ダイナミクスのシフトをしっかりと捉え、これまで見られなかった状況に効果的に一般化することを示した。
関連論文リスト
- Failure Modes of LLMs for Causal Reasoning on Narratives [51.19592551510628]
世界の知識と論理的推論の相互作用について検討する。
最先端の大規模言語モデル(LLM)は、しばしば表面的な一般化に依存している。
タスクの単純な再構成により、より堅牢な推論行動が引き起こされることを示す。
論文 参考訳(メタデータ) (2024-10-31T12:48:58Z) - Systems with Switching Causal Relations: A Meta-Causal Perspective [18.752058058199847]
エージェントの行動の柔軟性や、環境プロセスにおける転換点の柔軟性は、システムの質的なダイナミクスを変える可能性がある。
新しい因果関係が出現し、既存の因果関係が変化または消失し、結果として因果グラフが変化する。
本稿では,古典的因果モデルを等価な定性行動に基づいてクラスタに分類するメタ因果状態の概念を提案する。
論文 参考訳(メタデータ) (2024-10-16T21:32:31Z) - Interpretable Imitation Learning with Dynamic Causal Relations [65.18456572421702]
得られた知識を有向非巡回因果グラフの形で公開することを提案する。
また、この因果発見プロセスを状態依存的に設計し、潜在因果グラフのダイナミクスをモデル化する。
提案するフレームワークは,動的因果探索モジュール,因果符号化モジュール,予測モジュールの3つの部分から構成され,エンドツーエンドで訓練される。
論文 参考訳(メタデータ) (2023-09-30T20:59:42Z) - DeGroot-based opinion formation under a global steering mechanism [3.0215418312651057]
ネットワークレベルでの意見駆動型エージェント状態を集約するグローバルステアリング機構(GSM)による意見形成過程について検討する。
GSM-DeGrootと呼ばれる2層エージェントに基づく意見形成モデルを提案し、エージェント-エージェント-エージェント間の局所的相互作用の結合ダイナミクスをキャプチャする。
論文 参考訳(メタデータ) (2022-10-21T22:02:47Z) - Towards a Grounded Theory of Causation for Embodied AI [12.259552039796027]
既存のフレームワークは、どの行動方針や状態空間の物理的変換を介入とみなすべきかを示すものではありません。
このフレームワークは、例えばポリシーを実行するエージェントによって誘導される状態空間の変換としてアクションを記述する。
これにより、マイクロ状態空間の変換とその抽象モデルの両方を均一に記述することができる。
論文 参考訳(メタデータ) (2022-06-28T12:56:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。