論文の概要: Learning Causal Dynamics Models in Object-Oriented Environments
- arxiv url: http://arxiv.org/abs/2405.12615v1
- Date: Tue, 21 May 2024 09:10:51 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-22 13:49:12.116731
- Title: Learning Causal Dynamics Models in Object-Oriented Environments
- Title(参考訳): オブジェクト指向環境における因果ダイナミクスモデルの学習
- Authors: Zhongwei Yu, Jingqing Ruan, Dengpeng Xing,
- Abstract要約: 因果力学モデル(CDM)は、強化学習における様々な課題に対処する上で大きな可能性を示している。
我々は、同じクラスに属するオブジェクト間の因果関係とパラメータを共有するオブジェクト指向CDM(OOCDM)を紹介する。
大規模タスクの実験は、OOCDMが因果発見、予測精度、一般化、計算効率で既存のCDMより優れていることを示している。
- 参考スコア(独自算出の注目度): 4.887814315732678
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Causal dynamics models (CDMs) have demonstrated significant potential in addressing various challenges in reinforcement learning. To learn CDMs, recent studies have performed causal discovery to capture the causal dependencies among environmental variables. However, the learning of CDMs is still confined to small-scale environments due to computational complexity and sample efficiency constraints. This paper aims to extend CDMs to large-scale object-oriented environments, which consist of a multitude of objects classified into different categories. We introduce the Object-Oriented CDM (OOCDM) that shares causalities and parameters among objects belonging to the same class. Furthermore, we propose a learning method for OOCDM that enables it to adapt to a varying number of objects. Experiments on large-scale tasks indicate that OOCDM outperforms existing CDMs in terms of causal discovery, prediction accuracy, generalization, and computational efficiency.
- Abstract(参考訳): 因果力学モデル(CDM)は、強化学習における様々な課題に対処する上で大きな可能性を示している。
CDMを学習するために、最近の研究では、環境変数間の因果関係を捉えるために因果発見を行った。
しかし、CDMの学習は、計算複雑性とサンプル効率の制約により、まだ小規模の環境に限られている。
本稿では,CDMを多種多様なカテゴリに分類される大規模オブジェクト指向環境に拡張することを目的とする。
我々は、同じクラスに属するオブジェクト間の因果関係とパラメータを共有するオブジェクト指向CDM(OOCDM)を紹介する。
さらに,OOCDMの学習手法を提案する。
大規模タスクの実験は、OOCDMが因果発見、予測精度、一般化、計算効率で既存のCDMより優れていることを示している。
関連論文リスト
- Targeted Reduction of Causal Models [55.11778726095353]
因果表現学習(Causal Representation Learning)は、シミュレーションで解釈可能な因果パターンを明らかにするための有望な道を提供する。
本稿では、複雑な相互作用可能なモデルを因果因子の簡潔な集合に凝縮する方法であるTCR(Targeted Causal Reduction)を紹介する。
複雑なモデルから解釈可能な高レベルな説明を生成する能力は、玩具や機械システムで実証されている。
論文 参考訳(メタデータ) (2023-11-30T15:46:22Z) - Finding emergence in data by maximizing effective information [2.1714094454496013]
創発的な現象を特定し、利用可能なデータを使用してマクロレベルで創発的なダイナミクスをキャプチャするフレームワークを開発することが重要です。
本稿では,因果発生理論(CE)にヒントを得て,創発的潜在空間におけるマクロ力学を学習するための機械学習フレームワークを提案する。
シミュレーションおよび実データによる実験結果から,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2023-08-19T09:12:47Z) - Endogenous Macrodynamics in Algorithmic Recourse [52.87956177581998]
対実説明(CE)とアルゴリズム・リコース(AR)に関する既存の研究は、静的環境における個人に主に焦点を当ててきた。
既存の方法論の多くは、一般化されたフレームワークによってまとめて記述できることを示す。
次に、既存のフレームワークは、グループレベルでの言論の内在的ダイナミクスを研究する際にのみ明らかとなるような、隠された対外的関係のコストを考慮に入れていないと論じる。
論文 参考訳(メタデータ) (2023-08-16T07:36:58Z) - A Comparative Study of Machine Learning Algorithms for Anomaly Detection
in Industrial Environments: Performance and Environmental Impact [62.997667081978825]
本研究は,環境の持続可能性を考慮した高性能機械学習モデルの要求に応えることを目的としている。
Decision TreesやRandom Forestsといった従来の機械学習アルゴリズムは、堅牢な効率性とパフォーマンスを示している。
しかし, 資源消費の累積増加にもかかわらず, 最適化された構成で優れた結果が得られた。
論文 参考訳(メタデータ) (2023-07-01T15:18:00Z) - Quantify the Causes of Causal Emergence: Critical Conditions of
Uncertainty and Asymmetry in Causal Structure [0.5372002358734439]
統計的および情報理論に基づく因果関係の調査は、大規模モデルに興味深い、価値のある課題を提起している。
本稿では,その発生の理論的制約として,因果関係の数値的条件を評価するための枠組みを提案する。
論文 参考訳(メタデータ) (2022-12-03T06:35:54Z) - Differentiable Agent-based Epidemiology [71.81552021144589]
GradABM(GradABM)は、エージェントベースのモデリングのためのスケーラブルで微分可能な設計で、勾配に基づく学習と自動微分が可能である。
GradABMは、コモディティハードウェア上で数秒で数百万の人口をシミュレートし、ディープニューラルネットワークと統合し、異種データソースを取り込みます。
論文 参考訳(メタデータ) (2022-07-20T07:32:02Z) - Variational Causal Dynamics: Discovering Modular World Models from
Interventions [25.084146613277973]
後期世界モデルでは、エージェントは高次元の観測で複雑な環境を推論することができる。
本稿では,環境間の因果的メカニズムの不変性を利用した構造化世界モデルである,変分因果ダイナミクス(VCD)を提案する。
論文 参考訳(メタデータ) (2022-06-22T14:28:40Z) - Differentiable Invariant Causal Discovery [106.87950048845308]
観測データから因果構造を学ぶことは、機械学習の基本的な課題である。
本稿では,不特定変分因果解法(DICD)を提案する。
合成および実世界のデータセットに関する大規模な実験は、DICDがSHDの36%まで最先端の因果発見手法より優れていることを検証している。
論文 参考訳(メタデータ) (2022-05-31T09:29:07Z) - Systematic Evaluation of Causal Discovery in Visual Model Based
Reinforcement Learning [76.00395335702572]
AIと因果関係の中心的な目標は、抽象表現と因果構造を共同で発見することである。
因果誘導を研究するための既存の環境は、複雑なタスク固有の因果グラフを持つため、この目的には適していない。
本研究の目的は,高次変数の学習表現と因果構造の研究を促進することである。
論文 参考訳(メタデータ) (2021-07-02T05:44:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。