論文の概要: Tree Search in DAG Space with Model-based Reinforcement Learning for
Causal Discovery
- arxiv url: http://arxiv.org/abs/2310.13576v1
- Date: Fri, 20 Oct 2023 15:14:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 22:12:40.769129
- Title: Tree Search in DAG Space with Model-based Reinforcement Learning for
Causal Discovery
- Title(参考訳): 因果発見のためのモデルベース強化学習を用いたDAG空間における木探索
- Authors: Victor-Alexandru Darvariu, Stephen Hailes, Mirco Musolesi
- Abstract要約: 木探索に基づく因果探索のためのモデルに基づく強化学習手法を提案する。
また、サイクルを導入するエッジを排除するための効率的なアルゴリズムの正しさを証明し、証明する。
我々は2つの実世界の課題に対するアプローチを評価し、最先端のモデルフリー手法よりもかなり優れた性能を実現した。
- 参考スコア(独自算出の注目度): 6.772856304452474
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Identifying causal structure is central to many fields ranging from strategic
decision-making to biology and economics. In this work, we propose a
model-based reinforcement learning method for causal discovery based on tree
search, which builds directed acyclic graphs incrementally. We also formalize
and prove the correctness of an efficient algorithm for excluding edges that
would introduce cycles, which enables deeper discrete search and sampling in
DAG space. We evaluate our approach on two real-world tasks, achieving
substantially better performance than the state-of-the-art model-free method
and greedy search, constituting a promising advancement for combinatorial
methods.
- Abstract(参考訳): 因果構造を特定することは、戦略的な意思決定から生物学や経済学まで、様々な分野の中心である。
本研究では,有向非巡回グラフを漸進的に構築する木探索に基づく因果探索のためのモデルベース強化学習手法を提案する。
また,DAG空間のより深い離散的な探索とサンプリングを可能にするエッジを除外する効率的なアルゴリズムの妥当性を定式化し,証明する。
我々は,2つの実世界の課題に対するアプローチを評価し,最先端のモデルフリー手法や欲求探索よりもはるかに優れた性能を実現し,組み合わせ手法の有望な進歩を図った。
関連論文リスト
- BPP-Search: Enhancing Tree of Thought Reasoning for Mathematical Modeling Problem Solving [11.596474985695679]
我々は、完全な数学的モデリングプロセスをキャプチャする包括的ラベルを付したStructuredORデータセットをリリースする。
本稿では,強化学習をツリー・オブ・シント構造に統合するアルゴリズムであるBPP-Searchを提案する。
BPP-Searchは、Chain-of-Thought、Self-Consistency、Tree-of-Thoughtなど、最先端の手法を大幅に上回っている。
論文 参考訳(メタデータ) (2024-11-26T13:05:53Z) - Technical Report: Enhancing LLM Reasoning with Reward-guided Tree Search [95.06503095273395]
o1のような推論アプローチは困難で、研究者はこのオープンな研究領域を前進させようとさまざまな試みを行ってきた。
本稿では,報酬誘導木探索アルゴリズムを用いて,LLMの推論能力を高めるための予備的な検討を行う。
論文 参考訳(メタデータ) (2024-11-18T16:15:17Z) - ALIAS: DAG Learning with Efficient Unconstrained Policies [30.67987131971867]
我々は、強化学習機械を利用した因果発見の新しいアプローチであるALIASを紹介する。
本手法は,DAGを最適2次複雑度で1ステップで生成する効率的なポリシを特徴とする。
因果発見における最先端技術と比較して, ALIAS の強い性能を示す説得力のある実証的証拠を提供する。
論文 参考訳(メタデータ) (2024-08-24T03:12:21Z) - Discovering Dynamic Causal Space for DAG Structure Learning [64.763763417533]
本稿では,DAG構造学習のための動的因果空間であるCASPERを提案する。
グラフ構造をスコア関数に統合し、因果空間における新しい尺度として、推定真理DAGと基底真理DAGの因果距離を忠実に反映する。
論文 参考訳(メタデータ) (2023-06-05T12:20:40Z) - Causality Learning With Wasserstein Generative Adversarial Networks [2.492300648514129]
DAG-WGANという名前のモデルは、ワッサーシュタインに基づく対向損失とオートエンコーダアーキテクチャにおける非巡回性制約を組み合わせたものである。
データ生成能力を改善しながら、因果構造を同時に学習する。
本稿では,DAG-WGAN と Wsserstein 計量を含まない他のモデルとの比較を行い,その因果構造学習への寄与を明らかにする。
論文 参考訳(メタデータ) (2022-06-03T10:45:47Z) - DAG-WGAN: Causal Structure Learning With Wasserstein Generative
Adversarial Networks [2.492300648514129]
本稿では、自動エンコーダアーキテクチャであるワッサーシュタインに基づく対向損失と非循環性制約を組み合わせたDAG-WGANを提案する。
同時に因果構造を学習し、ワッサーシュタイン距離メートル法から強度を利用することによりデータ生成能力を向上させる。
我々はDAG-WGANを最先端技術に対して評価し,その性能を実証した。
論文 参考訳(メタデータ) (2022-04-01T12:27:27Z) - BCDAG: An R package for Bayesian structure and Causal learning of
Gaussian DAGs [77.34726150561087]
観測データから因果関係の発見と因果関係を推定するためのRパッケージを提案する。
我々の実装は、観測回数とともに効率的にスケールし、DAGが十分にスパースであるたびに、データセット内の変数の数を削減します。
次に、実際のデータセットとシミュレーションデータセットの両方で、主な機能とアルゴリズムを説明します。
論文 参考訳(メタデータ) (2022-01-28T09:30:32Z) - Learning Neural Causal Models with Active Interventions [83.44636110899742]
本稿では,データ生成プロセスの根底にある因果構造を素早く識別する能動的介入ターゲット機構を提案する。
本手法は,ランダムな介入ターゲティングと比較して,要求される対話回数を大幅に削減する。
シミュレーションデータから実世界のデータまで,複数のベンチマークにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2021-09-06T13:10:37Z) - DAGs with No Curl: An Efficient DAG Structure Learning Approach [62.885572432958504]
近年のDAG構造学習は連続的な非巡回性制約を伴う制約付き連続最適化問題として定式化されている。
本稿では,DAG空間の重み付き隣接行列を直接モデル化し,学習するための新しい学習フレームワークを提案する。
本手法は, 線形および一般化された構造方程式モデルにおいて, ベースラインDAG構造学習法よりも精度が高いが, 効率がよいことを示す。
論文 参考訳(メタデータ) (2021-06-14T07:11:36Z) - Ordering-Based Causal Discovery with Reinforcement Learning [31.358145789333825]
本論文では, RL を順序付けに基づくパラダイムに組み込むことにより, RL に基づく因果的発見手法を提案する。
提案手法の一貫性と計算複雑性を分析し,事前学習モデルを用いて学習を高速化できることを実証的に示す。
論文 参考訳(メタデータ) (2021-05-14T03:49:59Z) - Efficient Model-Based Reinforcement Learning through Optimistic Policy
Search and Planning [93.1435980666675]
最先端の強化学習アルゴリズムと楽観的な探索を容易に組み合わせることができることを示す。
我々の実験は、楽観的な探索が行動に罰則がある場合、学習を著しくスピードアップすることを示した。
論文 参考訳(メタデータ) (2020-06-15T18:37:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。