論文の概要: Tree Search in DAG Space with Model-based Reinforcement Learning for
Causal Discovery
- arxiv url: http://arxiv.org/abs/2310.13576v2
- Date: Tue, 13 Feb 2024 16:18:04 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-14 19:20:30.327009
- Title: Tree Search in DAG Space with Model-based Reinforcement Learning for
Causal Discovery
- Title(参考訳): 因果発見のためのモデルベース強化学習を用いたDAG空間における木探索
- Authors: Victor-Alexandru Darvariu, Stephen Hailes, Mirco Musolesi
- Abstract要約: CD-UCTは木探索に基づく因果探索のためのモデルに基づく強化学習手法である。
我々は、サイクルを導入するエッジを排除するための効率的なアルゴリズムの正しさを形式化し、証明する。
提案手法は離散確率変数と連続確率変数の両方を持つ因果ベイズネットワークに広く適用することができる。
- 参考スコア(独自算出の注目度): 6.772856304452474
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Identifying causal structure is central to many fields ranging from strategic
decision-making to biology and economics. In this work, we propose CD-UCT, a
model-based reinforcement learning method for causal discovery based on tree
search that builds directed acyclic graphs incrementally. We also formalize and
prove the correctness of an efficient algorithm for excluding edges that would
introduce cycles, which enables deeper discrete search and sampling in DAG
space. The proposed method can be applied broadly to causal Bayesian networks
with both discrete and continuous random variables. We conduct a comprehensive
evaluation on synthetic and real-world datasets, showing that CD-UCT
substantially outperforms the state-of-the-art model-free reinforcement
learning technique and greedy search, constituting a promising advancement for
combinatorial methods.
- Abstract(参考訳): 因果構造を特定することは、戦略的な意思決定から生物学や経済学まで、様々な分野の中心である。
本研究では,有向非巡回グラフを漸進的に構築する木探索に基づく因果発見のためのモデルベース強化学習手法cd-uctを提案する。
また,DAG空間のより深い離散的な探索とサンプリングを可能にするエッジを除外する効率的なアルゴリズムの妥当性を定式化し,証明する。
提案手法は離散変数と連続変数の両方を持つ因果ベイズネットワークに広く適用することができる。
合成および実世界のデータセットの総合的な評価を行い、CD-UCTは最先端のモデルフリー強化学習技術とグリージー検索を著しく上回り、組合せ手法の進歩に期待できることを示す。
関連論文リスト
- Differentiable Tree Search in Latent State Space [17.688341927195033]
微分可能木探索(DTS)は、誘導バイアスを大幅に強化する新しいニューラルネットワークアーキテクチャである。
本稿では,最優先のオンライン検索アルゴリズムのアルゴリズム構造を組み込むことにより,誘導バイアスを大幅に強化するニューラルネットワークアーキテクチャを提案する。
我々は,DTSをオフラインRL設定で評価し,Procgenゲームとグリッドナビゲーションタスクのトレーニングデータシナリオを限定した。
論文 参考訳(メタデータ) (2024-01-22T02:33:38Z) - Discovering Dynamic Causal Space for DAG Structure Learning [64.763763417533]
本稿では,DAG構造学習のための動的因果空間であるCASPERを提案する。
グラフ構造をスコア関数に統合し、因果空間における新しい尺度として、推定真理DAGと基底真理DAGの因果距離を忠実に反映する。
論文 参考訳(メタデータ) (2023-06-05T12:20:40Z) - Latent Variable Representation for Reinforcement Learning [131.03944557979725]
モデルに基づく強化学習のサンプル効率を改善するために、潜在変数モデルが学習、計画、探索をいかに促進するかは理論上、実証上、不明である。
状態-作用値関数に対する潜在変数モデルの表現ビューを提供する。これは、抽出可能な変分学習アルゴリズムと楽観主義/悲観主義の原理の効果的な実装の両方を可能にする。
特に,潜伏変数モデルのカーネル埋め込みを組み込んだUPB探索を用いた計算効率の良い計画アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-17T00:26:31Z) - Causality Learning With Wasserstein Generative Adversarial Networks [2.492300648514129]
DAG-WGANという名前のモデルは、ワッサーシュタインに基づく対向損失とオートエンコーダアーキテクチャにおける非巡回性制約を組み合わせたものである。
データ生成能力を改善しながら、因果構造を同時に学習する。
本稿では,DAG-WGAN と Wsserstein 計量を含まない他のモデルとの比較を行い,その因果構造学習への寄与を明らかにする。
論文 参考訳(メタデータ) (2022-06-03T10:45:47Z) - DAG-WGAN: Causal Structure Learning With Wasserstein Generative
Adversarial Networks [2.492300648514129]
本稿では、自動エンコーダアーキテクチャであるワッサーシュタインに基づく対向損失と非循環性制約を組み合わせたDAG-WGANを提案する。
同時に因果構造を学習し、ワッサーシュタイン距離メートル法から強度を利用することによりデータ生成能力を向上させる。
我々はDAG-WGANを最先端技術に対して評価し,その性能を実証した。
論文 参考訳(メタデータ) (2022-04-01T12:27:27Z) - BCDAG: An R package for Bayesian structure and Causal learning of
Gaussian DAGs [77.34726150561087]
観測データから因果関係の発見と因果関係を推定するためのRパッケージを提案する。
我々の実装は、観測回数とともに効率的にスケールし、DAGが十分にスパースであるたびに、データセット内の変数の数を削減します。
次に、実際のデータセットとシミュレーションデータセットの両方で、主な機能とアルゴリズムを説明します。
論文 参考訳(メタデータ) (2022-01-28T09:30:32Z) - Learning Neural Causal Models with Active Interventions [83.44636110899742]
本稿では,データ生成プロセスの根底にある因果構造を素早く識別する能動的介入ターゲット機構を提案する。
本手法は,ランダムな介入ターゲティングと比較して,要求される対話回数を大幅に削減する。
シミュレーションデータから実世界のデータまで,複数のベンチマークにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2021-09-06T13:10:37Z) - DAGs with No Curl: An Efficient DAG Structure Learning Approach [62.885572432958504]
近年のDAG構造学習は連続的な非巡回性制約を伴う制約付き連続最適化問題として定式化されている。
本稿では,DAG空間の重み付き隣接行列を直接モデル化し,学習するための新しい学習フレームワークを提案する。
本手法は, 線形および一般化された構造方程式モデルにおいて, ベースラインDAG構造学習法よりも精度が高いが, 効率がよいことを示す。
論文 参考訳(メタデータ) (2021-06-14T07:11:36Z) - Ordering-Based Causal Discovery with Reinforcement Learning [31.358145789333825]
本論文では, RL を順序付けに基づくパラダイムに組み込むことにより, RL に基づく因果的発見手法を提案する。
提案手法の一貫性と計算複雑性を分析し,事前学習モデルを用いて学習を高速化できることを実証的に示す。
論文 参考訳(メタデータ) (2021-05-14T03:49:59Z) - Efficient Model-Based Reinforcement Learning through Optimistic Policy
Search and Planning [93.1435980666675]
最先端の強化学習アルゴリズムと楽観的な探索を容易に組み合わせることができることを示す。
我々の実験は、楽観的な探索が行動に罰則がある場合、学習を著しくスピードアップすることを示した。
論文 参考訳(メタデータ) (2020-06-15T18:37:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。