論文の概要: ALIAS: DAG Learning with Efficient Unconstrained Policies
- arxiv url: http://arxiv.org/abs/2408.13448v2
- Date: Tue, 27 Aug 2024 03:28:50 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-28 12:43:02.009449
- Title: ALIAS: DAG Learning with Efficient Unconstrained Policies
- Title(参考訳): ALIAS: 効率的な制約のないポリシによるDAG学習
- Authors: Bao Duong, Hung Le, Thin Nguyen,
- Abstract要約: 我々は、強化学習機械を利用した因果発見の新しいアプローチであるALIASを紹介する。
本手法は,DAGを最適2次複雑度で1ステップで生成する効率的なポリシを特徴とする。
因果発見における最先端技術と比較して, ALIAS の強い性能を示す説得力のある実証的証拠を提供する。
- 参考スコア(独自算出の注目度): 30.67987131971867
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, reinforcement learning (RL) has proved a promising alternative for conventional local heuristics in score-based approaches to learning directed acyclic causal graphs (DAGs) from observational data. However, the intricate acyclicity constraint still challenges the efficient exploration of the vast space of DAGs in existing methods. In this study, we introduce ALIAS (reinforced dAg Learning wIthout Acyclicity conStraints), a novel approach to causal discovery powered by the RL machinery. Our method features an efficient policy for generating DAGs in just a single step with an optimal quadratic complexity, fueled by a novel parametrization of DAGs that directly translates a continuous space to the space of all DAGs, bypassing the need for explicitly enforcing acyclicity constraints. This approach enables us to navigate the search space more effectively by utilizing policy gradient methods and established scoring functions. In addition, we provide compelling empirical evidence for the strong performance of ALIAS in comparison with state-of-the-arts in causal discovery over increasingly difficult experiment conditions on both synthetic and real datasets.
- Abstract(参考訳): 近年、強化学習(RL)は、観測データから有向非巡回因果グラフ(DAG)を学習するためのスコアベースのアプローチにおいて、従来の局所ヒューリスティックの代替として有望であることが証明されている。
しかし、複雑な非巡回性制約は、既存の方法でのDAGの広大な空間の効率的な探索に依然として挑戦している。
本研究では,ALIAS(reinforced dAg Learning wIthout Acyclicity constraints)を紹介する。
本手法は,DAGの連続空間を全DAGの空間に直接変換する新しいパラメトリゼーションにより,1ステップでDAGを最適2次複雑性で生成する効率的なポリシを特徴とする。
提案手法は,ポリシー勾配法と確立されたスコアリング関数を利用して,より効率的に探索空間をナビゲートすることを可能にする。
さらに、合成データセットと実データセットの両方において、ますます困難な実験条件に対する因果発見の最先端技術と比較して、ALIASの強い性能を示す説得力のある実証的証拠を提供する。
関連論文リスト
- AcceleratedLiNGAM: Learning Causal DAGs at the speed of GPUs [57.12929098407975]
既存の因果探索法を効率的に並列化することにより,数千次元まで拡張可能であることを示す。
具体的には、DirectLiNGAMの因果順序付けサブプロデューサに着目し、GPUカーネルを実装して高速化する。
これにより、遺伝子介入による大規模遺伝子発現データに対する因果推論にDirectLiNGAMを適用することで、競争結果が得られる。
論文 参考訳(メタデータ) (2024-03-06T15:06:11Z) - Tree Search in DAG Space with Model-based Reinforcement Learning for
Causal Discovery [6.772856304452474]
CD-UCTは木探索に基づく因果探索のためのモデルに基づく強化学習手法である。
我々は、サイクルを導入するエッジを排除するための効率的なアルゴリズムの正しさを形式化し、証明する。
提案手法は離散確率変数と連続確率変数の両方を持つ因果ベイズネットワークに広く適用することができる。
論文 参考訳(メタデータ) (2023-10-20T15:14:18Z) - Discovering Dynamic Causal Space for DAG Structure Learning [64.763763417533]
本稿では,DAG構造学習のための動的因果空間であるCASPERを提案する。
グラフ構造をスコア関数に統合し、因果空間における新しい尺度として、推定真理DAGと基底真理DAGの因果距離を忠実に反映する。
論文 参考訳(メタデータ) (2023-06-05T12:20:40Z) - Learning Better with Less: Effective Augmentation for Sample-Efficient
Visual Reinforcement Learning [57.83232242068982]
データ拡張(DA)は、ビジュアル強化学習(RL)アルゴリズムのサンプル効率を高める重要な手法である。
サンプル効率のよい視覚的RLを実現する上で, DAのどの属性が有効かは明らかになっていない。
本研究は,DAの属性が有効性に与える影響を評価するための総合的な実験を行う。
論文 参考訳(メタデータ) (2023-05-25T15:46:20Z) - DAG-WGAN: Causal Structure Learning With Wasserstein Generative
Adversarial Networks [2.492300648514129]
本稿では、自動エンコーダアーキテクチャであるワッサーシュタインに基づく対向損失と非循環性制約を組み合わせたDAG-WGANを提案する。
同時に因果構造を学習し、ワッサーシュタイン距離メートル法から強度を利用することによりデータ生成能力を向上させる。
我々はDAG-WGANを最先端技術に対して評価し,その性能を実証した。
論文 参考訳(メタデータ) (2022-04-01T12:27:27Z) - Deceive D: Adaptive Pseudo Augmentation for GAN Training with Limited
Data [125.7135706352493]
GAN(Generative Adversarial Network)は、高忠実度画像を合成するために、訓練に十分なデータを必要とする。
近年の研究では、差別者の過度な適合により、限られたデータでGANを訓練することは困難であることが示されている。
本稿では,APA (Adaptive Pseudo Augmentation) と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2021-11-12T18:13:45Z) - Learning linear non-Gaussian directed acyclic graph with diverging
number of nodes [12.49848873864773]
有向非巡回グラフ(DAG)として表される非巡回モデルは、収集ノード間の方向因果関係を表現するために広く用いられている。
本研究では,高次元の場合において,連続的な非ガウス分布の雑音が生じるような線形非ガウスDAGを効率よく学習する方法を提案する。
論文 参考訳(メタデータ) (2021-11-01T07:34:53Z) - Efficient Neural Causal Discovery without Acyclicity Constraints [30.08586535981525]
本研究では,有向非巡回因果グラフの効率的な構造学習法であるENCOを提案する。
実験の結果,ENCOは数百ノードのグラフを効率よく回収できることがわかった。
論文 参考訳(メタデータ) (2021-07-22T07:01:41Z) - DAGs with No Curl: An Efficient DAG Structure Learning Approach [62.885572432958504]
近年のDAG構造学習は連続的な非巡回性制約を伴う制約付き連続最適化問題として定式化されている。
本稿では,DAG空間の重み付き隣接行列を直接モデル化し,学習するための新しい学習フレームワークを提案する。
本手法は, 線形および一般化された構造方程式モデルにおいて, ベースラインDAG構造学習法よりも精度が高いが, 効率がよいことを示す。
論文 参考訳(メタデータ) (2021-06-14T07:11:36Z) - DEALIO: Data-Efficient Adversarial Learning for Imitation from
Observation [57.358212277226315]
観察ifoからの模倣学習において、学習エージェントは、実演者の生成した制御信号にアクセスせずに、実演行動の観察のみを用いて実演エージェントを模倣しようとする。
近年、逆模倣学習に基づく手法は、ifO問題に対する最先端のパフォーマンスをもたらすが、データ非効率でモデルなしの強化学習アルゴリズムに依存するため、サンプルの複雑さに悩まされることが多い。
この問題は、サンプルの収集が時間、エネルギー、およびリスクの面で高いコストを被る可能性がある現実世界の設定に展開することは非現実的です。
よりデータ効率の高いifOアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-31T23:46:32Z) - On the Role of Sparsity and DAG Constraints for Learning Linear DAGs [16.97675762810828]
ガウス系および非ガウス系におけるDAGモデルの学習におけるスパーシリティとDAG制約の役割について検討した。
確率に基づくスコア関数を提案し, 基本真理DAGと同等のDAGを学習するためには, ソフト・スパシティとDAG制約を適用するだけでよいことを示す。
論文 参考訳(メタデータ) (2020-06-17T23:43:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。