Fugu-MT 論文翻訳(概要): Learning Causal Dynamics Models in Object-Oriented Environments

論文の概要: Learning Causal Dynamics Models in Object-Oriented Environments

arxiv url: http://arxiv.org/abs/2405.12615v1
Date: Tue, 21 May 2024 09:10:51 GMT
ステータス: 翻訳完了
システム内更新日: 2024-05-22 13:49:12.116731
Title: Learning Causal Dynamics Models in Object-Oriented Environments
Title（参考訳）: オブジェクト指向環境における因果ダイナミクスモデルの学習
Authors: Zhongwei Yu, Jingqing Ruan, Dengpeng Xing,
Abstract要約: 因果力学モデル(CDM)は、強化学習における様々な課題に対処する上で大きな可能性を示している。我々は、同じクラスに属するオブジェクト間の因果関係とパラメータを共有するオブジェクト指向CDM(OOCDM)を紹介する。大規模タスクの実験は、OOCDMが因果発見、予測精度、一般化、計算効率で既存のCDMより優れていることを示している。
参考スコア（独自算出の注目度）: 4.887814315732678
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Causal dynamics models (CDMs) have demonstrated significant potential in addressing various challenges in reinforcement learning. To learn CDMs, recent studies have performed causal discovery to capture the causal dependencies among environmental variables. However, the learning of CDMs is still confined to small-scale environments due to computational complexity and sample efficiency constraints. This paper aims to extend CDMs to large-scale object-oriented environments, which consist of a multitude of objects classified into different categories. We introduce the Object-Oriented CDM (OOCDM) that shares causalities and parameters among objects belonging to the same class. Furthermore, we propose a learning method for OOCDM that enables it to adapt to a varying number of objects. Experiments on large-scale tasks indicate that OOCDM outperforms existing CDMs in terms of causal discovery, prediction accuracy, generalization, and computational efficiency.
Abstract（参考訳）: 因果力学モデル(CDM)は、強化学習における様々な課題に対処する上で大きな可能性を示している。 CDMを学習するために、最近の研究では、環境変数間の因果関係を捉えるために因果発見を行った。しかし、CDMの学習は、計算複雑性とサンプル効率の制約により、まだ小規模の環境に限られている。本稿では,CDMを多種多様なカテゴリに分類される大規模オブジェクト指向環境に拡張することを目的とする。我々は、同じクラスに属するオブジェクト間の因果関係とパラメータを共有するオブジェクト指向CDM(OOCDM)を紹介する。さらに,OOCDMの学習手法を提案する。大規模タスクの実験は、OOCDMが因果発見、予測精度、一般化、計算効率で既存のCDMより優れていることを示している。

関連論文リスト

Anomaly Detection and Generation with Diffusion Models: A Survey [51.61574868316922]
異常検出(AD)は、サイバーセキュリティ、金融、医療、工業製造など、さまざまな分野において重要な役割を担っている。近年のディープラーニング,特に拡散モデル(DM)の進歩は,大きな関心を集めている。この調査は、研究者や実践者が様々なアプリケーションにまたがる革新的なADソリューションにDMを利用することをガイドすることを目的としている。
論文参考訳（メタデータ） (2025-06-11T03:29:18Z)
Better Decisions through the Right Causal World Model [17.623937562865617]
因果的対象中心モデル抽出ツール(COMET)は、正確に解釈可能な因果的世界モデル(CWM)を学習するために設計された新しいアルゴリズムである。 Pong や Freeway などの Atari 環境で検証した結果,COMET の精度とロバスト性を実証した。
論文参考訳（メタデータ） (2025-04-09T20:29:13Z)
Towards Empowerment Gain through Causal Structure Learning in Model-Based RL [35.933469787075]
本稿では,学習効率と制御性を向上させるための新しいフレームワークであるEmpowerment through Causal Learning (ECL)を提案する。 ECLは、まず、収集されたデータに基づいて環境の因果ダイナミクスモデルを訓練する。そして、探索によって収集されたデータを同時に利用して、因果ダイナミクスモデルをより制御しやすいように更新する。
論文参考訳（メタデータ） (2025-02-14T10:59:09Z)
Oriented Tiny Object Detection: A Dataset, Benchmark, and Dynamic Unbiased Learning [51.170479006249195]
本研究では,新しいデータセット,ベンチマーク,動的粗大な学習手法を提案する。提案するデータセットであるAI-TOD-Rは、すべてのオブジェクト指向オブジェクト検出データセットの中で最小のオブジェクトサイズを特徴としている。完全教師付きおよびラベル効率の両アプローチを含む,幅広い検出パラダイムにまたがるベンチマークを提案する。
論文参考訳（メタデータ） (2024-12-16T09:14:32Z)
Dynamic Detection of Relevant Objectives and Adaptation to Preference Drifts in Interactive Evolutionary Multi-Objective Optimization [2.4374097382908477]
意思決定過程を通じて進化し,目的の関連性に影響を与えるDM選好の動的性質について検討する。このような変化が起こると、時代遅れや相反する好みを解消する手法を提案する。実験により,提案手法は進化する嗜好を効果的に管理し,アルゴリズムが生成するソリューションの品質と望ましさを著しく向上することを示した。
論文参考訳（メタデータ） (2024-11-07T09:09:06Z)
R-AIF: Solving Sparse-Reward Robotic Tasks from Pixels with Active Inference and World Models [50.19174067263255]
我々は、エージェントがスパース・リワード、継続的なアクション、ゴールベースのロボット制御POMDP環境においてエクササイズするのを助けるために、事前の選好学習手法と自己修正スケジュールを導入する。我々のエージェントは、累積報酬、相対安定性、成功率の観点から、最先端モデルよりも優れたパフォーマンスを提供する。
論文参考訳（メタデータ） (2024-09-21T18:32:44Z)
Discovery of the Hidden World with Large Language Models [95.58823685009727]
本稿では,大きな言語モデル(LLM)を導入してギャップを埋めるCausal representatiOn AssistanT(COAT)を提案する。 LLMは世界中の大規模な観測に基づいて訓練されており、構造化されていないデータから重要な情報を抽出する優れた能力を示している。 COATはまた、特定変数間の因果関係を見つけるためにCDを採用し、提案された要因を反復的に洗練するためにLSMにフィードバックを提供する。
論文参考訳（メタデータ） (2024-02-06T12:18:54Z)
Targeted Reduction of Causal Models [55.11778726095353]
因果表現学習(Causal Representation Learning)は、シミュレーションで解釈可能な因果パターンを明らかにするための有望な道を提供する。本稿では、複雑な相互作用可能なモデルを因果因子の簡潔な集合に凝縮する方法であるTCR(Targeted Causal Reduction)を紹介する。複雑なモデルから解釈可能な高レベルな説明を生成する能力は、玩具や機械システムで実証されている。
論文参考訳（メタデータ） (2023-11-30T15:46:22Z)
Endogenous Macrodynamics in Algorithmic Recourse [52.87956177581998]
対実説明(CE)とアルゴリズム・リコース(AR)に関する既存の研究は、静的環境における個人に主に焦点を当ててきた。既存の方法論の多くは、一般化されたフレームワークによってまとめて記述できることを示す。次に、既存のフレームワークは、グループレベルでの言論の内在的ダイナミクスを研究する際にのみ明らかとなるような、隠された対外的関係のコストを考慮に入れていないと論じる。
論文参考訳（メタデータ） (2023-08-16T07:36:58Z)
Quantify the Causes of Causal Emergence: Critical Conditions of Uncertainty and Asymmetry in Causal Structure [0.5372002358734439]
統計的および情報理論に基づく因果関係の調査は、大規模モデルに興味深い、価値のある課題を提起している。本稿では,その発生の理論的制約として,因果関係の数値的条件を評価するための枠組みを提案する。
論文参考訳（メタデータ） (2022-12-03T06:35:54Z)
Variational Causal Dynamics: Discovering Modular World Models from Interventions [25.084146613277973]
後期世界モデルでは、エージェントは高次元の観測で複雑な環境を推論することができる。本稿では,環境間の因果的メカニズムの不変性を利用した構造化世界モデルである,変分因果ダイナミクス(VCD)を提案する。
論文参考訳（メタデータ） (2022-06-22T14:28:40Z)
Differentiable Invariant Causal Discovery [106.87950048845308]
観測データから因果構造を学ぶことは、機械学習の基本的な課題である。本稿では,不特定変分因果解法(DICD)を提案する。合成および実世界のデータセットに関する大規模な実験は、DICDがSHDの36%まで最先端の因果発見手法より優れていることを検証している。
論文参考訳（メタデータ） (2022-05-31T09:29:07Z)
Systematic Evaluation of Causal Discovery in Visual Model Based Reinforcement Learning [76.00395335702572]
AIと因果関係の中心的な目標は、抽象表現と因果構造を共同で発見することである。因果誘導を研究するための既存の環境は、複雑なタスク固有の因果グラフを持つため、この目的には適していない。本研究の目的は,高次変数の学習表現と因果構造の研究を促進することである。
論文参考訳（メタデータ） (2021-07-02T05:44:56Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。