論文の概要: Causal Order Identification to Address Confounding: Binary Variables
- arxiv url: http://arxiv.org/abs/2108.04947v1
- Date: Tue, 10 Aug 2021 22:09:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-12 13:15:41.069936
- Title: Causal Order Identification to Address Confounding: Binary Variables
- Title(参考訳): 結合に対処する因果順序の識別:バイナリ変数
- Authors: Joe Suzuki and Yusuke Inaoka
- Abstract要約: 本稿では,線形非ガウス非巡回モデル(LiNGAM)の拡張について考察する。
LiNGAMは、変数が雑音を含む一連の線形方程式で表されるとき、データセットから変数間の因果順序を決定する。
- 参考スコア(独自算出の注目度): 4.56877715768796
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper considers an extension of the linear non-Gaussian acyclic model
(LiNGAM) that determines the causal order among variables from a dataset when
the variables are expressed by a set of linear equations, including noise. In
particular, we assume that the variables are binary. The existing LiNGAM
assumes that no confounding is present, which is restrictive in practice. Based
on the concept of independent component analysis (ICA), this paper proposes an
extended framework in which the mutual information among the noises is
minimized. Another significant contribution is to reduce the realization of the
shortest path problem. The distance between each pair of nodes expresses an
associated mutual information value, and the path with the minimum sum (KL
divergence) is sought. Although $p!$ mutual information values should be
compared, this paper dramatically reduces the computation when no confounding
is present. The proposed algorithm finds the globally optimal solution, while
the existing locally greedily seek the order based on hypothesis testing. We
use the best estimator in the sense of Bayes/MDL that correctly detects
independence for mutual information estimation. Experiments using artificial
and actual data show that the proposed version of LiNGAM achieves significantly
better performance, particularly when confounding is present.
- Abstract(参考訳): 本稿では,線形非ガウス非巡回モデル(lingam)の拡張について検討し,ノイズを含む一組の線形方程式によって表される変数がデータセットから変数間の因果順序を決定する。
特に、変数がバイナリであると仮定します。
既存のLiNGAMは、実際には制限のある欠点はないと仮定している。
本稿では,独立成分分析(ica)の概念に基づき,雑音間の相互情報を最小限にする拡張枠組みを提案する。
もう一つの重要な貢献は、最短経路問題の実現を減らすことである。
各一対のノード間の距離は関連する相互情報値を表し、最小和(kl発散)のパスを求める。
相互情報値を比較する必要があるが, コンバウンドが存在しない場合, 本論文は計算量を劇的に削減する。
提案アルゴリズムはグローバルな最適解を求めるが,既存のアルゴリズムは仮説テストに基づく順序を求める。
相互情報推定のための独立性を正確に検出するベイズ/mdlの意味で最高の推定器を用いる。
人工的および実データを用いた実験により,提案したLiNGAMは,特にコンバウンディングが存在する場合,性能が著しく向上することが示された。
関連論文リスト
- Pareto Set Identification With Posterior Sampling [14.121842087273167]
本稿では,PSIを有意な相関性を有する線形変換系で検討する。
既存のオラクルベースのアルゴリズムの計算コストを負担することなく,構造と相関を同時に扱うPSIPSアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-11-07T18:15:38Z) - Learning causal graphs using variable grouping according to ancestral relationship [7.126300090990439]
サンプルサイズが変数数に対して小さい場合には,既存手法を用いた因果グラフの推定精度が低下する。
サンプルサイズが変数の数より小さい場合、いくつかのメソッドは実現不可能である。
これらの問題を回避すべく、ある研究者は分割・対数アプローチを用いた因果構造学習アルゴリズムを提案した。
論文 参考訳(メタデータ) (2024-03-21T04:42:04Z) - Optimal Multi-Distribution Learning [88.3008613028333]
マルチディストリビューション学習は、$k$の異なるデータ分散における最悪のリスクを最小限に抑える共有モデルを学ぶことを目指している。
本稿では, (d+k)/varepsilon2の順に, サンプルの複雑さを伴って, ヴァレプシロン最適ランダム化仮説を導出するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-12-08T16:06:29Z) - Distributionally Robust Skeleton Learning of Discrete Bayesian Networks [9.46389554092506]
我々は、潜在的に破損したデータから一般的な離散ベイズネットワークの正確なスケルトンを学習する問題を考察する。
本稿では,有界ワッサーシュタイン距離(KL)における分布群に対する最も有害なリスクを,経験的分布へのKL分散を最適化することを提案する。
本稿では,提案手法が標準正規化回帰手法と密接に関連していることを示す。
論文 参考訳(メタデータ) (2023-11-10T15:33:19Z) - Local Discovery by Partitioning: Polynomial-Time Causal Discovery Around Exposure-Outcome Pairs [18.31538168213386]
本稿では,因果推論タスクの分割(LDP)による局所的な発見を提案する。
LDPは制約ベースのプロシージャで、潜伏したコンバウンディングの下で露光出力ペアのVASを返す。
LDPの調整セットは、ベースライン発見アルゴリズムよりもバイアスが少なく、より正確な平均処理効果の推定値が得られる。
論文 参考訳(メタデータ) (2023-10-25T14:53:10Z) - Revisiting Rotation Averaging: Uncertainties and Robust Losses [51.64986160468128]
現在の手法の主な問題は、推定エピポーラを通して入力データと弱い結合しか持たない最小コスト関数である。
本稿では,点対応から回転平均化への不確実性を直接伝播させることにより,基礎となる雑音分布をモデル化することを提案する。
論文 参考訳(メタデータ) (2023-03-09T11:51:20Z) - Learning versus Refutation in Noninteractive Local Differential Privacy [133.80204506727526]
非対話的局所差分プライバシー(LDP)における2つの基本的な統計課題について検討する。
本研究の主な成果は,非対話型LDPプロトコルにおけるPAC学習の複雑さの完全な評価である。
論文 参考訳(メタデータ) (2022-10-26T03:19:24Z) - Meta-Learning for Relative Density-Ratio Estimation [59.75321498170363]
相対密度比推定(DRE)の既存の方法は、両方の密度から多くのインスタンスを必要とする。
本稿では,関係データセットの知識を用いて,相対密度比を数例から推定する,相対DREのメタラーニング手法を提案する。
提案手法の有効性を,相対的DRE,データセット比較,外乱検出の3つの問題を用いて実証的に実証した。
論文 参考訳(メタデータ) (2021-07-02T02:13:45Z) - Examining and Combating Spurious Features under Distribution Shift [94.31956965507085]
我々は、最小限の統計量という情報理論の概念を用いて、ロバストで刺激的な表現を定義し、分析する。
入力分布のバイアスしか持たない場合でも、モデルはトレーニングデータから急激な特徴を拾い上げることができることを証明しています。
分析から着想を得た結果,グループDROは,グループ同士の相関関係を直接考慮しない場合に失敗する可能性が示唆された。
論文 参考訳(メタデータ) (2021-06-14T05:39:09Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Binary Classification of Gaussian Mixtures: Abundance of Support
Vectors, Benign Overfitting and Regularization [39.35822033674126]
生成ガウス混合モデルに基づく二項線形分類について検討する。
後者の分類誤差に関する新しい非漸近境界を導出する。
この結果は, 確率が一定である雑音モデルに拡張される。
論文 参考訳(メタデータ) (2020-11-18T07:59:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。