論文の概要: Detecting Unobserved Confounders: A Kernelized Regression Approach
- arxiv url: http://arxiv.org/abs/2601.00200v1
- Date: Thu, 01 Jan 2026 04:26:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-05 15:04:33.305113
- Title: Detecting Unobserved Confounders: A Kernelized Regression Approach
- Title(参考訳): 監視されていない共同創業者を検出する - カーネル化された回帰アプローチ
- Authors: Yikai Chen, Yunxin Mao, Chunyuan Zheng, Hao Zou, Shanzhi Gu, Shixuan Liu, Yang Shi, Wenjing Yang, Kun Kuang, Haotian Wang,
- Abstract要約: Kernel Regression Confounder Detection (KRCD) は、単一環境下での非線形観測データにおける観測不能なコンバウンディングを検出する新しい方法である。
ゼロからの有意な偏差が観測不能な共起を示すテスト統計学。
合成ベンチマークとツインズデータセットの実験は、KRCDが既存のベースラインを上回るだけでなく、計算効率も優れていることを示した。
- 参考スコア(独自算出の注目度): 46.52607207396279
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Detecting unobserved confounders is crucial for reliable causal inference in observational studies. Existing methods require either linearity assumptions or multiple heterogeneous environments, limiting applicability to nonlinear single-environment settings. To bridge this gap, we propose Kernel Regression Confounder Detection (KRCD), a novel method for detecting unobserved confounding in nonlinear observational data under single-environment conditions. KRCD leverages reproducing kernel Hilbert spaces to model complex dependencies. By comparing standard and higherorder kernel regressions, we derive a test statistic whose significant deviation from zero indicates unobserved confounding. Theoretically, we prove two key results: First, in infinite samples, regression coefficients coincide if and only if no unobserved confounders exist. Second, finite-sample differences converge to zero-mean Gaussian distributions with tractable variance. Extensive experiments on synthetic benchmarks and the Twins dataset demonstrate that KRCD not only outperforms existing baselines but also achieves superior computational efficiency.
- Abstract(参考訳): 観察研究における因果推論の信頼性には,非観察的共同設立者の検出が不可欠である。
既存の手法では、線形性仮定または複数の異種環境を必要とし、非線形な単一環境設定の適用性を制限する。
このギャップを埋めるために, 単一環境下での非線形観測データにおける観測不能なコンバウンディングを検出する新しい手法であるKernel Regression Confounder Detection (KRCD)を提案する。
KRCDは、複製カーネルヒルベルト空間を利用して複雑な依存関係をモデル化する。
標準のカーネル回帰と高次のカーネル回帰を比較することで、ゼロからの有意な偏差が観測不能なコンバウンディングを示すテスト統計を導出する。
理論的には、2つの重要な結果が証明される: まず、無限のサンプルにおいて、回帰係数は、観測されていない共同設立者が存在しない場合にのみ一致する。
第二に、有限サンプル差分は、トラクタブルな分散を持つゼロ平均ガウス分布に収束する。
合成ベンチマークとツインズデータセットの大規模な実験は、KRCDが既存のベースラインを上回るだけでなく、計算効率も優れていることを示した。
関連論文リスト
- A Partial Initialization Strategy to Mitigate the Overfitting Problem in CATE Estimation with Hidden Confounding [44.874826691991565]
観察データから条件平均治療効果(CATE)を推定することは、電子商取引、医療、経済などの分野において重要な役割を果たす。
既存の研究は主に、隠れた共同設立者がいないという強い無知の仮定に依存している。
ランダム化制御試験 (RCT) から収集されたデータは、共起に苦しむことはないが、通常は小さなサンプルサイズによって制限される。
論文 参考訳(メタデータ) (2025-01-15T15:58:16Z) - On the Wasserstein Convergence and Straightness of Rectified Flow [54.580605276017096]
Rectified Flow (RF) は、ノイズからデータへの直流軌跡の学習を目的とした生成モデルである。
RFのサンプリング分布とターゲット分布とのワッサーシュタイン距離に関する理論的解析を行った。
本稿では,従来の経験的知見と一致した1-RFの特異性と直線性を保証する一般的な条件について述べる。
論文 参考訳(メタデータ) (2024-10-19T02:36:11Z) - Theory on Score-Mismatched Diffusion Models and Zero-Shot Conditional Samplers [49.97755400231656]
一般のスコアミスマッチ拡散サンプリング器に対する明示的な次元依存性を持つ最初の性能保証を示す。
その結果, スコアミスマッチは, 目標分布とサンプリング分布の分布バイアスとなり, 目標分布とトレーニング分布の累積ミスマッチに比例することがわかった。
この結果は、測定ノイズに関係なく、任意の条件モデルに対するゼロショット条件付きサンプリングに直接適用することができる。
論文 参考訳(メタデータ) (2024-10-17T16:42:12Z) - Selective Nonparametric Regression via Testing [54.20569354303575]
本研究では,所定の点における条件分散の値に関する仮説を検証し,留置手順を開発する。
既存の手法とは異なり、提案手法は分散自体の値だけでなく、対応する分散予測器の不確実性についても考慮することができる。
論文 参考訳(メタデータ) (2023-09-28T13:04:11Z) - Online Bootstrap Inference with Nonconvex Stochastic Gradient Descent
Estimator [0.0]
本稿では,凸問題の文脈における統計的推論のための勾配降下(SGD)の理論的性質について検討する。
多重誤差最小値を含む2つの干渉手順を提案する。
論文 参考訳(メタデータ) (2023-06-03T22:08:10Z) - Data thinning for convolution-closed distributions [2.299914829977005]
本稿では,観測を2つ以上の独立した部分に分割する手法であるデータ薄型化を提案する。
教師なし学習手法の結果の検証には,データの薄化が有効であることを示す。
論文 参考訳(メタデータ) (2023-01-18T02:47:41Z) - Binary Independent Component Analysis via Non-stationarity [7.283533791778359]
本稿では,バイナリデータの独立成分分析について考察する。
まず,線形混合モデルを連続値の潜在空間に仮定し,次に2値の観測モデルを仮定する。
連続値の場合とは対照的に、観測変数が少ないモデルの非識別性を証明する。
論文 参考訳(メタデータ) (2021-11-30T14:23:53Z) - Binary Classification of Gaussian Mixtures: Abundance of Support
Vectors, Benign Overfitting and Regularization [39.35822033674126]
生成ガウス混合モデルに基づく二項線形分類について検討する。
後者の分類誤差に関する新しい非漸近境界を導出する。
この結果は, 確率が一定である雑音モデルに拡張される。
論文 参考訳(メタデータ) (2020-11-18T07:59:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。