論文の概要: DODO: Causal Structure Learning with Budgeted Interventions
- arxiv url: http://arxiv.org/abs/2510.08207v1
- Date: Thu, 09 Oct 2025 13:32:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-10 17:54:15.096106
- Title: DODO: Causal Structure Learning with Budgeted Interventions
- Title(参考訳): DODO:予算的介入による因果構造学習
- Authors: Matteo Gregorini, Chiara Boldrini, Lorenzo Valerio,
- Abstract要約: 本稿では,エージェントが環境の因果構造を自律的に学習する方法を定義するアルゴリズムであるDODOを紹介する。
その結果,最も限られた資源条件を除いて,観測的アプローチに比べ,DODOの性能は向上した。
- 参考スコア(独自算出の注目度): 1.0323063834827415
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Artificial Intelligence has achieved remarkable advancements in recent years, yet much of its progress relies on identifying increasingly complex correlations. Enabling causality awareness in AI has the potential to enhance its performance by enabling a deeper understanding of the underlying mechanisms of the environment. In this paper, we introduce DODO, an algorithm defining how an Agent can autonomously learn the causal structure of its environment through repeated interventions. We assume a scenario where an Agent interacts with a world governed by a causal Directed Acyclic Graph (DAG), which dictates the system's dynamics but remains hidden from the Agent. The Agent's task is to accurately infer the causal DAG, even in the presence of noise. To achieve this, the Agent performs interventions, leveraging causal inference techniques to analyze the statistical significance of observed changes. Results show better performance for DODO, compared to observational approaches, in all but the most limited resource conditions. DODO is often able to reconstruct with as low as zero errors the structure of the causal graph. In the most challenging configuration, DODO outperforms the best baseline by +0.25 F1 points.
- Abstract(参考訳): 人工知能は近年顕著な進歩を遂げているが、その進歩の多くは、ますます複雑な相関関係の同定に依存している。
AIにおける因果意識の実現は、環境の基盤となるメカニズムをより深く理解することで、そのパフォーマンスを高める可能性がある。
本稿では,エージェントが繰り返し介入することで,環境の因果構造を自律的に学習する方法を定義するアルゴリズムであるDODOを紹介する。
本稿では,エージェントが因果非巡回グラフ(DAG)によって支配される世界と相互作用するシナリオを仮定する。
エージェントのタスクは、ノイズがあっても因果DAGを正確に推測することである。
これを達成するために、エージェントは、因果推論技術を利用して、観察された変化の統計的意義を分析する介入を行う。
その結果,最も限られた資源条件を除いて,観測手法よりもDODOの方が優れた性能を示した。
DODOはしばしば因果グラフの構造をゼロエラーゼロで再構築することができる。
最も難しい構成では、DODOは+0.25 F1ポイントで最高のベースラインを上回ります。
関連論文リスト
- Mutual Information Tracks Policy Coherence in Reinforcement Learning [0.0]
強化学習(RL)エージェントは、センサの故障、アクチュエータの摩耗、環境変化による劣化に直面している。
本稿では,RLの基本動力学を両立させる情報理論フレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-12T17:24:20Z) - Graphs Meet AI Agents: Taxonomy, Progress, and Future Opportunities [117.49715661395294]
データ構造化は、複雑で非組織的なデータをよく構造化された形式に変換することで、有望な役割を果たす。
この調査では、グラフがAIエージェントにどのように権限を与えるかを、初めて体系的にレビューする。
論文 参考訳(メタデータ) (2025-06-22T12:59:12Z) - Variable-Agnostic Causal Exploration for Reinforcement Learning [56.52768265734155]
強化学習のための新しいフレームワークVACERL(Variable-Agnostic Causal Exploration for Reinforcement Learning)を導入する。
本手法は,注目機構を用いて,重要変数に関連する重要な観測行動ステップを自動的に同定する。
これらのステップを接続する因果グラフを構築し、エージェントをタスク完了に対する因果的影響の大きい観察-作用ペアへと導く。
論文 参考訳(メタデータ) (2024-07-17T09:45:27Z) - Realization of Causal Representation Learning to Adjust Confounding Bias
in Latent Space [28.133104562449212]
因果DAG (Directed Acyclic Graphs) は通常、2次元平面において考慮される。
本稿では,変数の値がもはや時間スタンプに依存しておらず,時系列を軸と見なすことができるEmphdo-DAGとして因果DAGを再定義する。
論文 参考訳(メタデータ) (2022-11-15T23:35:15Z) - A Meta-Reinforcement Learning Algorithm for Causal Discovery [3.4806267677524896]
因果構造は、モデルが純粋な相関に基づく推論を超えることを可能にする。
データから因果構造を見つけることは、計算の労力と精度の両方において大きな課題となる。
我々は,介入を学習することで因果発見を行うメタ強化学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2022-07-18T09:26:07Z) - Modeling Bounded Rationality in Multi-Agent Simulations Using Rationally
Inattentive Reinforcement Learning [85.86440477005523]
我々は、人間不合理性の確立されたモデルであるRational Inattention(RI)モデルを含む、より人間的なRLエージェントについて検討する。
RIRLは、相互情報を用いた認知情報処理のコストをモデル化する。
我々は、RIRLを用いることで、合理的な仮定の下で発見されたものと異なる、新しい平衡挙動の豊富なスペクトルが得られることを示す。
論文 参考訳(メタデータ) (2022-01-18T20:54:00Z) - Systematic Evaluation of Causal Discovery in Visual Model Based
Reinforcement Learning [76.00395335702572]
AIと因果関係の中心的な目標は、抽象表現と因果構造を共同で発見することである。
因果誘導を研究するための既存の環境は、複雑なタスク固有の因果グラフを持つため、この目的には適していない。
本研究の目的は,高次変数の学習表現と因果構造の研究を促進することである。
論文 参考訳(メタデータ) (2021-07-02T05:44:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。