Fugu-MT 論文翻訳(概要): Tree Search in DAG Space with Model-based Reinforcement Learning for Causal Discovery

論文の概要: Tree Search in DAG Space with Model-based Reinforcement Learning for Causal Discovery

arxiv url: http://arxiv.org/abs/2310.13576v2
Date: Tue, 13 Feb 2024 16:18:04 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-14 19:20:30.327009
Title: Tree Search in DAG Space with Model-based Reinforcement Learning for Causal Discovery
Title（参考訳）: 因果発見のためのモデルベース強化学習を用いたDAG空間における木探索
Authors: Victor-Alexandru Darvariu, Stephen Hailes, Mirco Musolesi
Abstract要約: CD-UCTは木探索に基づく因果探索のためのモデルに基づく強化学習手法である。我々は、サイクルを導入するエッジを排除するための効率的なアルゴリズムの正しさを形式化し、証明する。提案手法は離散確率変数と連続確率変数の両方を持つ因果ベイズネットワークに広く適用することができる。
参考スコア（独自算出の注目度）: 6.772856304452474
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Identifying causal structure is central to many fields ranging from strategic decision-making to biology and economics. In this work, we propose CD-UCT, a model-based reinforcement learning method for causal discovery based on tree search that builds directed acyclic graphs incrementally. We also formalize and prove the correctness of an efficient algorithm for excluding edges that would introduce cycles, which enables deeper discrete search and sampling in DAG space. The proposed method can be applied broadly to causal Bayesian networks with both discrete and continuous random variables. We conduct a comprehensive evaluation on synthetic and real-world datasets, showing that CD-UCT substantially outperforms the state-of-the-art model-free reinforcement learning technique and greedy search, constituting a promising advancement for combinatorial methods.
Abstract（参考訳）: 因果構造を特定することは、戦略的な意思決定から生物学や経済学まで、様々な分野の中心である。本研究では,有向非巡回グラフを漸進的に構築する木探索に基づく因果発見のためのモデルベース強化学習手法cd-uctを提案する。また,DAG空間のより深い離散的な探索とサンプリングを可能にするエッジを除外する効率的なアルゴリズムの妥当性を定式化し,証明する。提案手法は離散変数と連続変数の両方を持つ因果ベイズネットワークに広く適用することができる。合成および実世界のデータセットの総合的な評価を行い、CD-UCTは最先端のモデルフリー強化学習技術とグリージー検索を著しく上回り、組合せ手法の進歩に期待できることを示す。

関連論文リスト

A joint optimization approach to identifying sparse dynamics using least squares kernel collocation [70.13783231186183]
本研究では,通常の微分方程式(ODE)の学習システムを,状態の不足,部分的,ノイズの多い観測から学習するためのオール・アット・オンス・モデリング・フレームワークを開発する。提案手法は,関数ライブラリ上でのODEのスパースリカバリ戦略とカーネルヒルベルト空間(RKHS)理論による状態推定とODEの離散化の手法を組み合わせたものである。
論文参考訳（メタデータ） (2025-11-23T18:04:15Z)
Learning Discrete Bayesian Networks with Hierarchical Dirichlet Shrinkage [52.914168158222765]
我々はDBNを学習するための包括的なベイズ的フレームワークについて詳述する。我々は、並列ランゲヴィン提案を用いてマルコフ連鎖モンテカルロ(MCMC)アルゴリズムを新たに提案し、正確な後続サンプルを生成する。原発性乳癌検体から予後ネットワーク構造を明らかにするために本手法を適用した。
論文参考訳（メタデータ） (2025-09-16T17:24:35Z)
Learning Decision Trees as Amortized Structure Inference [59.65621207449269]
本稿では,予測決定木アンサンブルを学習するためのハイブリッドアモータイズされた構造推論手法を提案する。提案手法であるDT-GFNは,標準分類ベンチマークにおける最先端決定木やディープラーニング手法よりも優れていることを示す。
論文参考訳（メタデータ） (2025-03-10T07:05:07Z)
Chain-of-Retrieval Augmented Generation [72.06205327186069]
本稿では,o1-like RAGモデルを学習し,最終回答を生成する前に段階的に関連情報を抽出・推論する手法を提案する。提案手法であるCoRAGは,進化状態に基づいて動的にクエリを再構成する。
論文参考訳（メタデータ） (2025-01-24T09:12:52Z)
BPP-Search: Enhancing Tree of Thought Reasoning for Mathematical Modeling Problem Solving [11.596474985695679]
我々は、完全な数学的モデリングプロセスをキャプチャする包括的ラベルを付したStructuredORデータセットをリリースする。本稿では,強化学習をツリー・オブ・シント構造に統合するアルゴリズムであるBPP-Searchを提案する。 BPP-Searchは、Chain-of-Thought、Self-Consistency、Tree-of-Thoughtなど、最先端の手法を大幅に上回っている。
論文参考訳（メタデータ） (2024-11-26T13:05:53Z)
Technical Report: Enhancing LLM Reasoning with Reward-guided Tree Search [95.06503095273395]
o1のような推論アプローチは困難で、研究者はこのオープンな研究領域を前進させようとさまざまな試みを行ってきた。本稿では,報酬誘導木探索アルゴリズムを用いて,LLMの推論能力を高めるための予備的な検討を行う。
論文参考訳（メタデータ） (2024-11-18T16:15:17Z)
ALIAS: DAG Learning with Efficient Unconstrained Policies [30.67987131971867]
我々は、強化学習機械を利用した因果発見の新しいアプローチであるALIASを紹介する。本手法は,DAGを最適2次複雑度で1ステップで生成する効率的なポリシを特徴とする。因果発見における最先端技術と比較して, ALIAS の強い性能を示す説得力のある実証的証拠を提供する。
論文参考訳（メタデータ） (2024-08-24T03:12:21Z)
Kernel-Based Differentiable Learning of Non-Parametric Directed Acyclic Graphical Models [17.52142371968811]
因果発見は因果モデルを符号化する有向非巡回グラフ (DAG) を学ぶことに相当する。近年の研究では、因果発見を連続最適化問題として再検討し、探索を回避しようとしている。
論文参考訳（メタデータ） (2024-08-20T16:09:40Z)
Discovering Dynamic Causal Space for DAG Structure Learning [64.763763417533]
本稿では,DAG構造学習のための動的因果空間であるCASPERを提案する。グラフ構造をスコア関数に統合し、因果空間における新しい尺度として、推定真理DAGと基底真理DAGの因果距離を忠実に反映する。
論文参考訳（メタデータ） (2023-06-05T12:20:40Z)
Causality Learning With Wasserstein Generative Adversarial Networks [2.492300648514129]
DAG-WGANという名前のモデルは、ワッサーシュタインに基づく対向損失とオートエンコーダアーキテクチャにおける非巡回性制約を組み合わせたものである。データ生成能力を改善しながら、因果構造を同時に学習する。本稿では,DAG-WGAN と Wsserstein 計量を含まない他のモデルとの比較を行い,その因果構造学習への寄与を明らかにする。
論文参考訳（メタデータ） (2022-06-03T10:45:47Z)
DAG-WGAN: Causal Structure Learning With Wasserstein Generative Adversarial Networks [2.492300648514129]
本稿では、自動エンコーダアーキテクチャであるワッサーシュタインに基づく対向損失と非循環性制約を組み合わせたDAG-WGANを提案する。同時に因果構造を学習し、ワッサーシュタイン距離メートル法から強度を利用することによりデータ生成能力を向上させる。我々はDAG-WGANを最先端技術に対して評価し,その性能を実証した。
論文参考訳（メタデータ） (2022-04-01T12:27:27Z)
BCDAG: An R package for Bayesian structure and Causal learning of Gaussian DAGs [77.34726150561087]
観測データから因果関係の発見と因果関係を推定するためのRパッケージを提案する。我々の実装は、観測回数とともに効率的にスケールし、DAGが十分にスパースであるたびに、データセット内の変数の数を削減します。次に、実際のデータセットとシミュレーションデータセットの両方で、主な機能とアルゴリズムを説明します。
論文参考訳（メタデータ） (2022-01-28T09:30:32Z)
Learning Neural Causal Models with Active Interventions [83.44636110899742]
本稿では,データ生成プロセスの根底にある因果構造を素早く識別する能動的介入ターゲット機構を提案する。本手法は,ランダムな介入ターゲティングと比較して,要求される対話回数を大幅に削減する。シミュレーションデータから実世界のデータまで,複数のベンチマークにおいて優れた性能を示す。
論文参考訳（メタデータ） (2021-09-06T13:10:37Z)
DAGs with No Curl: An Efficient DAG Structure Learning Approach [62.885572432958504]
近年のDAG構造学習は連続的な非巡回性制約を伴う制約付き連続最適化問題として定式化されている。本稿では,DAG空間の重み付き隣接行列を直接モデル化し,学習するための新しい学習フレームワークを提案する。本手法は, 線形および一般化された構造方程式モデルにおいて, ベースラインDAG構造学習法よりも精度が高いが, 効率がよいことを示す。
論文参考訳（メタデータ） (2021-06-14T07:11:36Z)
Ordering-Based Causal Discovery with Reinforcement Learning [31.358145789333825]
本論文では, RL を順序付けに基づくパラダイムに組み込むことにより, RL に基づく因果的発見手法を提案する。提案手法の一貫性と計算複雑性を分析し,事前学習モデルを用いて学習を高速化できることを実証的に示す。
論文参考訳（メタデータ） (2021-05-14T03:49:59Z)
Efficient Model-Based Reinforcement Learning through Optimistic Policy Search and Planning [93.1435980666675]
最先端の強化学習アルゴリズムと楽観的な探索を容易に組み合わせることができることを示す。我々の実験は、楽観的な探索が行動に罰則がある場合、学習を著しくスピードアップすることを示した。
論文参考訳（メタデータ） (2020-06-15T18:37:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。