論文の概要: Detection of Unobserved Common Causes based on NML Code in Discrete,
Mixed, and Continuous Variables
- arxiv url: http://arxiv.org/abs/2403.06499v1
- Date: Mon, 11 Mar 2024 08:11:52 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-12 19:50:39.304172
- Title: Detection of Unobserved Common Causes based on NML Code in Discrete,
Mixed, and Continuous Variables
- Title(参考訳): 離散・混合・連続変数におけるNML符号に基づく観測不能な共通原因の検出
- Authors: Masatoshi Kobayashi, Kohei Miyagichi, Shin Matsushima
- Abstract要約: 2つの確率変数間の因果関係を次の4つのカテゴリに分類する。
我々は,CLOUDが,合成データと実世界のデータの両方に関する広範な実験により因果関係を推定する既存手法よりも有効であることを示す。
- 参考スコア(独自算出の注目度): 1.5039745292757667
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Causal discovery in the presence of unobserved common causes from
observational data only is a crucial but challenging problem. We categorize all
possible causal relationships between two random variables into the following
four categories and aim to identify one from observed data: two cases in which
either of the direct causality exists, a case that variables are independent,
and a case that variables are confounded by latent confounders. Although
existing methods have been proposed to tackle this problem, they require
unobserved variables to satisfy assumptions on the form of their equation
models. In our previous study (Kobayashi et al., 2022), the first causal
discovery method without such assumptions is proposed for discrete data and
named CLOUD. Using Normalized Maximum Likelihood (NML) Code, CLOUD selects a
model that yields the minimum codelength of the observed data from a set of
model candidates. This paper extends CLOUD to apply for various data types
across discrete, mixed, and continuous. We not only performed theoretical
analysis to show the consistency of CLOUD in terms of the model selection, but
also demonstrated that CLOUD is more effective than existing methods in
inferring causal relationships by extensive experiments on both synthetic and
real-world data.
- Abstract(参考訳): 観測データから観察されていない共通の原因が存在する場合の因果発見は重要な問題であるが、難しい問題である。
2つの確率変数間の因果関係を次の4つのカテゴリに分類し、観察されたデータから1つを特定することを目的としている。
この問題に対処するために既存の手法が提案されているが、それらの方程式モデルの形で仮定を満たすためには観測されていない変数が必要である。
先行研究 (kobayashi et al., 2022) では, 個別データと名前付きクラウドに対して, このような仮定を伴わない最初の因果発見法が提案されている。
Normalized Maximum Likelihood (NML) Codeを使用して、CLOUDは、観測されたデータの最小コード長をモデル候補のセットから取得するモデルを選択する。
本稿では、CLOUDを拡張して、離散的、混合的、連続的な様々なデータ型に適用する。
我々はモデル選択の観点からCLOUDの整合性を示す理論的解析を行っただけでなく、CLOUDは合成データと実世界のデータの両方に関する広範な実験によって因果関係を推定する既存の手法よりも効果的であることを示した。
関連論文リスト
- Score matching through the roof: linear, nonlinear, and latent variables causal discovery [18.46845413928147]
観測データからの因果発見は、非常に有望である。
既存の手法は根底にある因果構造に関する強い仮定に依存している。
線形・非線形・潜在変数モデルにまたがる因果探索のためのフレキシブルアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-07-26T14:09:06Z) - Federated Causal Discovery from Heterogeneous Data [70.31070224690399]
任意の因果モデルと異種データに対応する新しいFCD法を提案する。
これらのアプローチには、データのプライバシを保護するために、生データのプロキシとして要約統計を構築することが含まれる。
提案手法の有効性を示すために, 合成および実データを用いた広範囲な実験を行った。
論文 参考訳(メタデータ) (2024-02-20T18:53:53Z) - Identifiable Latent Polynomial Causal Models Through the Lens of Change [82.14087963690561]
因果表現学習は、観測された低レベルデータから潜在的な高レベル因果表現を明らかにすることを目的としている。
主な課題の1つは、識別可能性(identifiability)として知られるこれらの潜伏因果モデルを特定する信頼性の高い保証を提供することである。
論文 参考訳(メタデータ) (2023-10-24T07:46:10Z) - Discovering Mixtures of Structural Causal Models from Time Series Data [23.18511951330646]
基礎となる因果モデルを推測するために, MCD と呼ばれる一般的な変分推論に基づくフレームワークを提案する。
このアプローチでは、データ可能性のエビデンス-ローバウンドを最大化するエンドツーエンドのトレーニングプロセスを採用しています。
本研究では,本手法が因果発見タスクにおける最先端のベンチマークを上回ることを実証する。
論文 参考訳(メタデータ) (2023-10-10T05:13:10Z) - Nonparametric Identifiability of Causal Representations from Unknown
Interventions [63.1354734978244]
本研究では, 因果表現学習, 潜伏因果変数を推定するタスク, およびそれらの変数の混合から因果関係を考察する。
我々のゴールは、根底にある真理潜入者とその因果グラフの両方を、介入データから解決不可能なあいまいさの集合まで識別することである。
論文 参考訳(メタデータ) (2023-06-01T10:51:58Z) - Distinguishing Cause from Effect on Categorical Data: The Uniform
Channel Model [0.0]
一対の確率変数の観測による効果による原因の識別は因果発見における中核的な問題である。
分類変数を用いた原因影響問題に対処するための基準を提案する。
我々は、条件付き確率質量関数が一様チャネル(UC)に最も近い因果方向として選択する。
論文 参考訳(メタデータ) (2023-03-14T13:54:11Z) - Causality-Based Multivariate Time Series Anomaly Detection [63.799474860969156]
我々は、因果的観点から異常検出問題を定式化し、多変量データを生成するための通常の因果的メカニズムに従わない事例として、異常を考察する。
次に、まずデータから因果構造を学習し、次に、あるインスタンスが局所因果機構に対して異常であるかどうかを推定する因果検出手法を提案する。
我々は、実世界のAIOpsアプリケーションに関するケーススタディと同様に、シミュレートされたデータセットとパブリックなデータセットの両方を用いて、私たちのアプローチを評価します。
論文 参考訳(メタデータ) (2022-06-30T06:00:13Z) - MissDAG: Causal Discovery in the Presence of Missing Data with
Continuous Additive Noise Models [78.72682320019737]
不完全な観測データから因果発見を行うため,MissDAGと呼ばれる一般的な手法を開発した。
MissDAGは、期待-最大化の枠組みの下で観測の可視部分の期待される可能性を最大化する。
各種因果探索アルゴリズムを組み込んだMissDAGの柔軟性について,広範囲なシミュレーションと実データ実験により検証した。
論文 参考訳(メタデータ) (2022-05-27T09:59:46Z) - Disentangling Observed Causal Effects from Latent Confounders using
Method of Moments [67.27068846108047]
我々は、軽度の仮定の下で、識別性と学習可能性に関する保証を提供する。
我々は,線形制約付き結合テンソル分解に基づく効率的なアルゴリズムを開発し,スケーラブルで保証可能な解を得る。
論文 参考訳(メタデータ) (2021-01-17T07:48:45Z) - Information-Theoretic Approximation to Causal Models [0.0]
有限標本から2つの確率変数間の因果方向と因果効果を推定する問題の解法が可能であることを示す。
X と Y のサンプルから生じる分布を高次元確率空間に埋め込む。
本稿では, 線形最適化問題を解くことにより, 因果モデル(IACM)に対する情報理論近似が可能であることを示す。
論文 参考訳(メタデータ) (2020-07-29T18:34:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。