論文の概要: Learning Causal Dynamics Models in Object-Oriented Environments
- arxiv url: http://arxiv.org/abs/2405.12615v1
- Date: Tue, 21 May 2024 09:10:51 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-22 13:49:12.116731
- Title: Learning Causal Dynamics Models in Object-Oriented Environments
- Title(参考訳): オブジェクト指向環境における因果ダイナミクスモデルの学習
- Authors: Zhongwei Yu, Jingqing Ruan, Dengpeng Xing,
- Abstract要約: 因果力学モデル(CDM)は、強化学習における様々な課題に対処する上で大きな可能性を示している。
我々は、同じクラスに属するオブジェクト間の因果関係とパラメータを共有するオブジェクト指向CDM(OOCDM)を紹介する。
大規模タスクの実験は、OOCDMが因果発見、予測精度、一般化、計算効率で既存のCDMより優れていることを示している。
- 参考スコア(独自算出の注目度): 4.887814315732678
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Causal dynamics models (CDMs) have demonstrated significant potential in addressing various challenges in reinforcement learning. To learn CDMs, recent studies have performed causal discovery to capture the causal dependencies among environmental variables. However, the learning of CDMs is still confined to small-scale environments due to computational complexity and sample efficiency constraints. This paper aims to extend CDMs to large-scale object-oriented environments, which consist of a multitude of objects classified into different categories. We introduce the Object-Oriented CDM (OOCDM) that shares causalities and parameters among objects belonging to the same class. Furthermore, we propose a learning method for OOCDM that enables it to adapt to a varying number of objects. Experiments on large-scale tasks indicate that OOCDM outperforms existing CDMs in terms of causal discovery, prediction accuracy, generalization, and computational efficiency.
- Abstract(参考訳): 因果力学モデル(CDM)は、強化学習における様々な課題に対処する上で大きな可能性を示している。
CDMを学習するために、最近の研究では、環境変数間の因果関係を捉えるために因果発見を行った。
しかし、CDMの学習は、計算複雑性とサンプル効率の制約により、まだ小規模の環境に限られている。
本稿では,CDMを多種多様なカテゴリに分類される大規模オブジェクト指向環境に拡張することを目的とする。
我々は、同じクラスに属するオブジェクト間の因果関係とパラメータを共有するオブジェクト指向CDM(OOCDM)を紹介する。
さらに,OOCDMの学習手法を提案する。
大規模タスクの実験は、OOCDMが因果発見、予測精度、一般化、計算効率で既存のCDMより優れていることを示している。
関連論文リスト
- Dynamic Detection of Relevant Objectives and Adaptation to Preference Drifts in Interactive Evolutionary Multi-Objective Optimization [2.4374097382908477]
意思決定過程を通じて進化し,目的の関連性に影響を与えるDM選好の動的性質について検討する。
このような変化が起こると、時代遅れや相反する好みを解消する手法を提案する。
実験により,提案手法は進化する嗜好を効果的に管理し,アルゴリズムが生成するソリューションの品質と望ましさを著しく向上することを示した。
論文 参考訳(メタデータ) (2024-11-07T09:09:06Z) - R-AIF: Solving Sparse-Reward Robotic Tasks from Pixels with Active Inference and World Models [50.19174067263255]
我々は、エージェントがスパース・リワード、継続的なアクション、ゴールベースのロボット制御POMDP環境においてエクササイズするのを助けるために、事前の選好学習手法と自己修正スケジュールを導入する。
我々のエージェントは、累積報酬、相対安定性、成功率の観点から、最先端モデルよりも優れたパフォーマンスを提供する。
論文 参考訳(メタデータ) (2024-09-21T18:32:44Z) - Discovery of the Hidden World with Large Language Models [95.58823685009727]
本稿では,大きな言語モデル(LLM)を導入してギャップを埋めるCausal representatiOn AssistanT(COAT)を提案する。
LLMは世界中の大規模な観測に基づいて訓練されており、構造化されていないデータから重要な情報を抽出する優れた能力を示している。
COATはまた、特定変数間の因果関係を見つけるためにCDを採用し、提案された要因を反復的に洗練するためにLSMにフィードバックを提供する。
論文 参考訳(メタデータ) (2024-02-06T12:18:54Z) - Targeted Reduction of Causal Models [55.11778726095353]
因果表現学習(Causal Representation Learning)は、シミュレーションで解釈可能な因果パターンを明らかにするための有望な道を提供する。
本稿では、複雑な相互作用可能なモデルを因果因子の簡潔な集合に凝縮する方法であるTCR(Targeted Causal Reduction)を紹介する。
複雑なモデルから解釈可能な高レベルな説明を生成する能力は、玩具や機械システムで実証されている。
論文 参考訳(メタデータ) (2023-11-30T15:46:22Z) - Endogenous Macrodynamics in Algorithmic Recourse [52.87956177581998]
対実説明(CE)とアルゴリズム・リコース(AR)に関する既存の研究は、静的環境における個人に主に焦点を当ててきた。
既存の方法論の多くは、一般化されたフレームワークによってまとめて記述できることを示す。
次に、既存のフレームワークは、グループレベルでの言論の内在的ダイナミクスを研究する際にのみ明らかとなるような、隠された対外的関係のコストを考慮に入れていないと論じる。
論文 参考訳(メタデータ) (2023-08-16T07:36:58Z) - Quantify the Causes of Causal Emergence: Critical Conditions of
Uncertainty and Asymmetry in Causal Structure [0.5372002358734439]
統計的および情報理論に基づく因果関係の調査は、大規模モデルに興味深い、価値のある課題を提起している。
本稿では,その発生の理論的制約として,因果関係の数値的条件を評価するための枠組みを提案する。
論文 参考訳(メタデータ) (2022-12-03T06:35:54Z) - Variational Causal Dynamics: Discovering Modular World Models from
Interventions [25.084146613277973]
後期世界モデルでは、エージェントは高次元の観測で複雑な環境を推論することができる。
本稿では,環境間の因果的メカニズムの不変性を利用した構造化世界モデルである,変分因果ダイナミクス(VCD)を提案する。
論文 参考訳(メタデータ) (2022-06-22T14:28:40Z) - Differentiable Invariant Causal Discovery [106.87950048845308]
観測データから因果構造を学ぶことは、機械学習の基本的な課題である。
本稿では,不特定変分因果解法(DICD)を提案する。
合成および実世界のデータセットに関する大規模な実験は、DICDがSHDの36%まで最先端の因果発見手法より優れていることを検証している。
論文 参考訳(メタデータ) (2022-05-31T09:29:07Z) - Systematic Evaluation of Causal Discovery in Visual Model Based
Reinforcement Learning [76.00395335702572]
AIと因果関係の中心的な目標は、抽象表現と因果構造を共同で発見することである。
因果誘導を研究するための既存の環境は、複雑なタスク固有の因果グラフを持つため、この目的には適していない。
本研究の目的は,高次変数の学習表現と因果構造の研究を促進することである。
論文 参考訳(メタデータ) (2021-07-02T05:44:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。