論文の概要: Linear Causal Representation Learning by Topological Ordering, Pruning, and Disentanglement
- arxiv url: http://arxiv.org/abs/2509.22553v1
- Date: Fri, 26 Sep 2025 16:35:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-29 20:57:54.585366
- Title: Linear Causal Representation Learning by Topological Ordering, Pruning, and Disentanglement
- Title(参考訳): トポロジカルオーダリング, プルーニング, アンタングルメントによる線形因果表現学習
- Authors: Hao Chen, Lin Liu, Yu Guang Wang,
- Abstract要約: 因果表現学習(CRL)は、因果推論や人工知能コミュニティからの関心が高まっている。
本研究では, 環境の不均一性やデータ生成分布について, より弱い仮定の下での線形CRLアルゴリズムを提案する。
合成実験と大規模言語モデルの解釈可能性解析により,新しいアルゴリズムの有効性を検証した。
- 参考スコア(独自算出の注目度): 12.380741069149956
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Causal representation learning (CRL) has garnered increasing interests from the causal inference and artificial intelligence community, due to its capability of disentangling potentially complex data-generating mechanism into causally interpretable latent features, by leveraging the heterogeneity of modern datasets. In this paper, we further contribute to the CRL literature, by focusing on the stylized linear structural causal model over the latent features and assuming a linear mixing function that maps latent features to the observed data or measurements. Existing linear CRL methods often rely on stringent assumptions, such as accessibility to single-node interventional data or restrictive distributional constraints on latent features and exogenous measurement noise. However, these prerequisites can be challenging to satisfy in certain scenarios. In this work, we propose a novel linear CRL algorithm that, unlike most existing linear CRL methods, operates under weaker assumptions about environment heterogeneity and data-generating distributions while still recovering latent causal features up to an equivalence class. We further validate our new algorithm via synthetic experiments and an interpretability analysis of large language models (LLMs), demonstrating both its superiority over competing methods in finite samples and its potential in integrating causality into AI.
- Abstract(参考訳): 因果表現学習(CRL)は、現代のデータセットの不均一性を利用して、潜在的に複雑なデータ生成機構を因果的に解釈可能な潜在特徴に切り離す能力によって、因果推論や人工知能コミュニティからの関心が高まりつつある。
本稿では、潜伏特徴に対するスタイリングされた線形構造因果モデルに着目し、潜伏特徴を観測データや測定値にマッピングする線形混合関数を仮定することにより、CRLの文献にさらに貢献する。
既存の線形CRL法は、単一ノード干渉データへのアクセシビリティや、潜伏した特徴に対する制限的な分布制約や外因性測定ノイズなど、厳密な仮定に依存することが多い。
しかし、これらの前提条件は特定のシナリオで満たすのが困難である。
本研究では, 従来の線形CRL法とは異なり, 環境の不均一性やデータ生成分布についてより弱い仮定の下で動作し, 因果的特徴を等値クラスまで回復する新しい線形CRLアルゴリズムを提案する。
さらに, 合成実験と大規模言語モデル (LLM) の解釈可能性解析により, 有限標本における競合する手法よりも優れていること, 因果関係をAIに組み込む可能性について検証した。
関連論文リスト
- On the Identifiability of Causal Abstractions [15.785002371773139]
因果表現学習は機械学習モデルの堅牢性と一般化性を高める。
本研究では,観測可能空間内のデータ対を用いて潜在因果モデルを特定するCRL手法のファミリーに着目した。
そこで我々は,一組の介入を前提として,因果モデルを特定することができる程度を計算できる理論的枠組みを導入する。
論文 参考訳(メタデータ) (2025-03-13T19:34:05Z) - Induced Covariance for Causal Discovery in Linear Sparse Structures [55.2480439325792]
因果モデルでは、観測データから変数間の因果関係を解き明かそうとしている。
本稿では,変数が線形に疎結合な関係を示す設定のための新しい因果探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-02T04:01:38Z) - Hybrid Top-Down Global Causal Discovery with Local Search for Linear and Nonlinear Additive Noise Models [2.0738462952016232]
関数因果モデルに基づく手法は、ユニークなグラフを識別することができるが、次元性の呪いや強いパラメトリックな仮定を課すことに苦しむ。
本研究では,局所的な因果構造を利用した観測データにおけるグローバル因果発見のための新しいハイブリッド手法を提案する。
我々は, 合成データに対する実証的な検証を行い, 正確性および最悪の場合の時間複雑度を理論的に保証する。
論文 参考訳(メタデータ) (2024-05-23T12:28:16Z) - Neural Network Approximation for Pessimistic Offline Reinforcement
Learning [17.756108291816908]
一般ニューラルネットワーク近似を用いた悲観的オフラインRLの非漸近的推定誤差を提案する。
その結果, 推定誤差は2つの部分から構成されることがわかった。第1は, 部分的に制御可能な集束率でサンプルサイズに所望の速度で0に収束し, 第2は残留制約が厳密であれば無視可能である。
論文 参考訳(メタデータ) (2023-12-19T05:17:27Z) - GEC: A Unified Framework for Interactive Decision Making in MDP, POMDP,
and Beyond [101.5329678997916]
対話型意思決定の一般的な枠組みの下で, サンプル高能率強化学習(RL)について検討した。
本稿では,探索とエクスプロイトの基本的なトレードオフを特徴付ける,新しい複雑性尺度である一般化エルダー係数(GEC)を提案する。
低 GEC の RL 問題は非常にリッチなクラスであり、これは低ベルマン楕円体次元問題、双線型クラス、低証人ランク問題、PO-双線型クラス、一般化正規PSR を仮定する。
論文 参考訳(メタデータ) (2022-11-03T16:42:40Z) - Learning Neural Causal Models with Active Interventions [83.44636110899742]
本稿では,データ生成プロセスの根底にある因果構造を素早く識別する能動的介入ターゲット機構を提案する。
本手法は,ランダムな介入ターゲティングと比較して,要求される対話回数を大幅に削減する。
シミュレーションデータから実世界のデータまで,複数のベンチマークにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2021-09-06T13:10:37Z) - Discovering Latent Causal Variables via Mechanism Sparsity: A New
Principle for Nonlinear ICA [81.4991350761909]
ICA(Independent component analysis)は、この目的を定式化し、実用的な応用のための推定手順を提供する手法の集合を指す。
潜伏変数は、潜伏機構をスパースに正則化すれば、置換まで復元可能であることを示す。
論文 参考訳(メタデータ) (2021-07-21T14:22:14Z) - Multiplicative noise and heavy tails in stochastic optimization [62.993432503309485]
経験的最適化は現代の機械学習の中心であるが、その成功における役割はまだ不明である。
分散による離散乗法雑音のパラメータによく現れることを示す。
最新のステップサイズやデータを含む重要な要素について、詳細な分析を行い、いずれも最先端のニューラルネットワークモデルで同様の結果を示す。
論文 参考訳(メタデータ) (2020-06-11T09:58:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。