論文の概要: Efficient Reinforced DAG Learning without Acyclicity Constraints
- arxiv url: http://arxiv.org/abs/2408.13448v1
- Date: Sat, 24 Aug 2024 03:12:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-27 19:29:34.842287
- Title: Efficient Reinforced DAG Learning without Acyclicity Constraints
- Title(参考訳): 非循環性制約のない効率的なDAG学習
- Authors: Bao Duong, Hung Le, Thin Nguyen,
- Abstract要約: RL機械による新たな因果発見手法としてREACT(Reinforced DAG learning without acyclicity Constraints)を提案する。
DAGの新たなパラメトリゼーションにより、実数値ベクトルを1ステップで有効なDAGを表す隣接行列にマッピングすることができる。
- 参考スコア(独自算出の注目度): 30.67987131971867
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unraveling cause-effect structures embedded in mere observational data is of great scientific interest, owning to the wealth of knowledge that can benefit from such structures. Recently, reinforcement learning (RL) has emerged as the enhancement for classical techniques to search for the most probable causal explanation in the form of a directed acyclic graph (DAG). Yet, effectively exploring the DAG space is challenging due to the vast number of candidates and the intricate constraint of acyclicity. In this study, we present REACT (REinforced DAG learning without acyclicity ConstrainTs)-a novel causal discovery approach fueled by the RL machinery with an efficient DAG generation policy. Through a novel parametrization of DAGs, which allows for directly mapping a real-valued vector to an adjacency matrix representing a valid DAG in a single step without enforcing any acyclicity constraint, we are able to navigate the search space much more effectively with policy gradient methods. In addition, our comprehensive numerical evaluations on a diverse set of both synthetic and real data confirm the effectiveness of our method compared with state-of-the-art baselines.
- Abstract(参考訳): 単なる観測データに埋め込まれた原因-影響構造は、そのような構造から恩恵を受けることができる知識の豊富さを所有する、非常に科学的な関心事である。
近年、強化学習(RL)は、有向非巡回グラフ(DAG)の形で最も考えられる因果的説明を探索する古典的手法の強化として現れている。
しかし、DAG空間を効果的に探索することは、多数の候補と複雑な非巡回性の制約のために困難である。
本研究では,効率的なDAG生成ポリシを備えたRL機械による新しい因果発見手法であるREACT(Reinforced DAG learning without acyclicity Constraints)を提案する。
DAGの新たなパラメトリゼーションにより、実数値ベクトルを1ステップで有効なDAGを表す隣接行列に直接マッピングし、非巡回性制約を課すことなく、より効率的に探索空間を探索できる。
さらに,合成データと実データの両方の多種多様な集合に関する包括的数値評価を行い,現状のベースラインと比較して,本手法の有効性を確認した。
関連論文リスト
- AcceleratedLiNGAM: Learning Causal DAGs at the speed of GPUs [57.12929098407975]
既存の因果探索法を効率的に並列化することにより,数千次元まで拡張可能であることを示す。
具体的には、DirectLiNGAMの因果順序付けサブプロデューサに着目し、GPUカーネルを実装して高速化する。
これにより、遺伝子介入による大規模遺伝子発現データに対する因果推論にDirectLiNGAMを適用することで、競争結果が得られる。
論文 参考訳(メタデータ) (2024-03-06T15:06:11Z) - Tree Search in DAG Space with Model-based Reinforcement Learning for
Causal Discovery [6.772856304452474]
CD-UCTは木探索に基づく因果探索のためのモデルに基づく強化学習手法である。
我々は、サイクルを導入するエッジを排除するための効率的なアルゴリズムの正しさを形式化し、証明する。
提案手法は離散確率変数と連続確率変数の両方を持つ因果ベイズネットワークに広く適用することができる。
論文 参考訳(メタデータ) (2023-10-20T15:14:18Z) - Discovering Dynamic Causal Space for DAG Structure Learning [64.763763417533]
本稿では,DAG構造学習のための動的因果空間であるCASPERを提案する。
グラフ構造をスコア関数に統合し、因果空間における新しい尺度として、推定真理DAGと基底真理DAGの因果距離を忠実に反映する。
論文 参考訳(メタデータ) (2023-06-05T12:20:40Z) - Learning Better with Less: Effective Augmentation for Sample-Efficient
Visual Reinforcement Learning [57.83232242068982]
データ拡張(DA)は、ビジュアル強化学習(RL)アルゴリズムのサンプル効率を高める重要な手法である。
サンプル効率のよい視覚的RLを実現する上で, DAのどの属性が有効かは明らかになっていない。
本研究は,DAの属性が有効性に与える影響を評価するための総合的な実験を行う。
論文 参考訳(メタデータ) (2023-05-25T15:46:20Z) - DAG-WGAN: Causal Structure Learning With Wasserstein Generative
Adversarial Networks [2.492300648514129]
本稿では、自動エンコーダアーキテクチャであるワッサーシュタインに基づく対向損失と非循環性制約を組み合わせたDAG-WGANを提案する。
同時に因果構造を学習し、ワッサーシュタイン距離メートル法から強度を利用することによりデータ生成能力を向上させる。
我々はDAG-WGANを最先端技術に対して評価し,その性能を実証した。
論文 参考訳(メタデータ) (2022-04-01T12:27:27Z) - Deceive D: Adaptive Pseudo Augmentation for GAN Training with Limited
Data [125.7135706352493]
GAN(Generative Adversarial Network)は、高忠実度画像を合成するために、訓練に十分なデータを必要とする。
近年の研究では、差別者の過度な適合により、限られたデータでGANを訓練することは困難であることが示されている。
本稿では,APA (Adaptive Pseudo Augmentation) と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2021-11-12T18:13:45Z) - Learning linear non-Gaussian directed acyclic graph with diverging
number of nodes [12.49848873864773]
有向非巡回グラフ(DAG)として表される非巡回モデルは、収集ノード間の方向因果関係を表現するために広く用いられている。
本研究では,高次元の場合において,連続的な非ガウス分布の雑音が生じるような線形非ガウスDAGを効率よく学習する方法を提案する。
論文 参考訳(メタデータ) (2021-11-01T07:34:53Z) - Efficient Neural Causal Discovery without Acyclicity Constraints [30.08586535981525]
本研究では,有向非巡回因果グラフの効率的な構造学習法であるENCOを提案する。
実験の結果,ENCOは数百ノードのグラフを効率よく回収できることがわかった。
論文 参考訳(メタデータ) (2021-07-22T07:01:41Z) - DAGs with No Curl: An Efficient DAG Structure Learning Approach [62.885572432958504]
近年のDAG構造学習は連続的な非巡回性制約を伴う制約付き連続最適化問題として定式化されている。
本稿では,DAG空間の重み付き隣接行列を直接モデル化し,学習するための新しい学習フレームワークを提案する。
本手法は, 線形および一般化された構造方程式モデルにおいて, ベースラインDAG構造学習法よりも精度が高いが, 効率がよいことを示す。
論文 参考訳(メタデータ) (2021-06-14T07:11:36Z) - DEALIO: Data-Efficient Adversarial Learning for Imitation from
Observation [57.358212277226315]
観察ifoからの模倣学習において、学習エージェントは、実演者の生成した制御信号にアクセスせずに、実演行動の観察のみを用いて実演エージェントを模倣しようとする。
近年、逆模倣学習に基づく手法は、ifO問題に対する最先端のパフォーマンスをもたらすが、データ非効率でモデルなしの強化学習アルゴリズムに依存するため、サンプルの複雑さに悩まされることが多い。
この問題は、サンプルの収集が時間、エネルギー、およびリスクの面で高いコストを被る可能性がある現実世界の設定に展開することは非現実的です。
よりデータ効率の高いifOアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-31T23:46:32Z) - On the Role of Sparsity and DAG Constraints for Learning Linear DAGs [16.97675762810828]
ガウス系および非ガウス系におけるDAGモデルの学習におけるスパーシリティとDAG制約の役割について検討した。
確率に基づくスコア関数を提案し, 基本真理DAGと同等のDAGを学習するためには, ソフト・スパシティとDAG制約を適用するだけでよいことを示す。
論文 参考訳(メタデータ) (2020-06-17T23:43:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。