論文の概要: Data-Driven Information-Theoretic Causal Bounds under Unmeasured Confounding
- arxiv url: http://arxiv.org/abs/2601.17160v1
- Date: Fri, 23 Jan 2026 20:47:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-27 15:23:07.313062
- Title: Data-Driven Information-Theoretic Causal Bounds under Unmeasured Confounding
- Title(参考訳): データ駆動型情報理論因果境界
- Authors: Yonghan Jung, Bogyeong Kang,
- Abstract要約: 本研究では,データ駆動型情報理論フレームワークを開発し,条件付き因果関係の同定を行う。
我々の重要な理論的貢献は、観測分布 P(Y | A = a, X = x) と干渉分布 P(Y | do(A = a), X = x) の間の f-分割が、確率スコアのみの関数によって上界であることが示している。
この結果により、外部感度パラメータ、補助変数、完全な構造仕様、結果境界性仮定を必要とせず、観測データから直接条件因果効果を鋭く同定することができる。
- 参考スコア(独自算出の注目度): 10.590231532335691
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We develop a data-driven information-theoretic framework for sharp partial identification of causal effects under unmeasured confounding. Existing approaches often rely on restrictive assumptions, such as bounded or discrete outcomes; require external inputs (for example, instrumental variables, proxies, or user-specified sensitivity parameters); necessitate full structural causal model specifications; or focus solely on population-level averages while neglecting covariate-conditional treatment effects. We overcome all four limitations simultaneously by establishing novel information-theoretic, data-driven divergence bounds. Our key theoretical contribution shows that the f-divergence between the observational distribution P(Y | A = a, X = x) and the interventional distribution P(Y | do(A = a), X = x) is upper bounded by a function of the propensity score alone. This result enables sharp partial identification of conditional causal effects directly from observational data, without requiring external sensitivity parameters, auxiliary variables, full structural specifications, or outcome boundedness assumptions. For practical implementation, we develop a semiparametric estimator satisfying Neyman orthogonality (Chernozhukov et al., 2018), which ensures square-root-n consistent inference even when nuisance functions are estimated using flexible machine learning methods. Simulation studies and real-world data applications, implemented in the GitHub repository (https://github.com/yonghanjung/Information-Theretic-Bounds), demonstrate that our framework provides tight and valid causal bounds across a wide range of data-generating processes.
- Abstract(参考訳): 本研究では,不測な条件下での因果関係の鮮明な部分的同定のためのデータ駆動型情報理論フレームワークを開発した。
既存のアプローチは、境界あるいは離散的な結果のような制限的な仮定に頼り、外部入力(例えば、機器変数、プロキシ、またはユーザ特定感度パラメータ)を必要とすること、完全な構造因果モデル仕様を必要とすること、あるいは共変量-条件処理効果を無視しながら人口レベルの平均にのみフォーカスすること、などである。
我々は、新しい情報理論、データ駆動分散境界を確立することで、4つの制限を同時に克服する。
我々の重要な理論的貢献は、観測分布 P(Y | A = a, X = x) と干渉分布 P(Y | do(A = a), X = x) の間の f-分割が、確率スコアのみの関数によって上界であることが示している。
この結果により、外部感度パラメータ、補助変数、完全な構造仕様、結果境界性仮定を必要とせず、観測データから直接条件因果効果を鋭く同定することができる。
実用的な実装として,ネマン直交性を満たす半パラメトリック推定器 (Chernozhukov et al , 2018) を開発した。
GitHubリポジトリに実装されているシミュレーション研究と実世界のデータアプリケーション(https://github.com/yonghanjung/Information-Theretic-Bounds)は、我々のフレームワークが幅広いデータ生成プロセスに対して厳密で有効な因果境界を提供することを示した。
関連論文リスト
- Explainability of Complex AI Models with Correlation Impact Ratio [10.61008729196936]
複雑なAIシステムはより良い予測を行うが、透明性が欠如し、信頼性、解釈可能性、安全なデプロイメントが制限されることが多い。
ExCIR(Explainability through correlation Impact Ratio)は,モデル出力に対する入力特徴の寄与を説明するための理論的基礎とシンプルで信頼性の高い指標である。
我々は,ExCIRが軽量なシングルパスの定式化により,相関した特徴から生じる依存関係をキャプチャすることを示した。
論文 参考訳(メタデータ) (2026-01-10T21:56:24Z) - Federated Causal Discovery from Heterogeneous Data [70.31070224690399]
任意の因果モデルと異種データに対応する新しいFCD法を提案する。
これらのアプローチには、データのプライバシを保護するために、生データのプロキシとして要約統計を構築することが含まれる。
提案手法の有効性を示すために, 合成および実データを用いた広範囲な実験を行った。
論文 参考訳(メタデータ) (2024-02-20T18:53:53Z) - Nonparametric Identifiability of Causal Representations from Unknown
Interventions [63.1354734978244]
本研究では, 因果表現学習, 潜伏因果変数を推定するタスク, およびそれらの変数の混合から因果関係を考察する。
我々のゴールは、根底にある真理潜入者とその因果グラフの両方を、介入データから解決不可能なあいまいさの集合まで識別することである。
論文 参考訳(メタデータ) (2023-06-01T10:51:58Z) - Learning to Bound Counterfactual Inference in Structural Causal Models
from Observational and Randomised Data [64.96984404868411]
我々は、従来のEMベースのアルゴリズムを拡張するための全体的なデータの特徴付けを導出する。
新しいアルゴリズムは、そのような混合データソースからモデルパラメータの(不特定性)領域を近似することを学ぶ。
反実的な結果に間隔近似を与え、それが特定可能な場合の点に崩壊する。
論文 参考訳(メタデータ) (2022-12-06T12:42:11Z) - Conditional Feature Importance for Mixed Data [1.6114012813668934]
ノックオフサンプリングを用いた条件付き予測インパクト(CPI)フレームワークを開発した。
提案するワークフローは,I型エラーを制御し,高い出力を達成し,他の条件FI測定結果と一致していることを示す。
本研究は,混合データに対して,統計的に適切な,専門的な手法を開発することの必要性を強調した。
論文 参考訳(メタデータ) (2022-10-06T16:52:38Z) - Data-Driven Influence Functions for Optimization-Based Causal Inference [105.5385525290466]
統計的汎関数に対するガトー微分を有限差分法で近似する構成的アルゴリズムについて検討する。
本研究では,確率分布を事前知識がないが,データから推定する必要がある場合について検討する。
論文 参考訳(メタデータ) (2022-08-29T16:16:22Z) - The interventional Bayesian Gaussian equivalent score for Bayesian
causal inference with unknown soft interventions [0.0]
ゲノミクスのような特定の環境では、不均一な研究条件からのデータがあり、研究変数のサブセットのみに関連するソフトな(部分的な)介入がある。
観察データと介入データとの混合に対する介入BGeスコアを定義し,介入の目的と効果が不明である可能性がある。
論文 参考訳(メタデータ) (2022-05-05T12:32:08Z) - A Class of Algorithms for General Instrumental Variable Models [29.558215059892206]
因果治療効果の推定は、様々な現実世界で発生する重要な問題である。
連続分布における因果効果のバウンディング法を提案する。
論文 参考訳(メタデータ) (2020-06-11T12:32:24Z) - Identification Methods With Arbitrary Interventional Distributions as
Inputs [8.185725740857595]
因果推論は、データから反事実パラメータを推定することで、原因と影響の関係を定量化する。
我々は、単一世界干渉グラフと混合グラフに関連付けられたモデルのネスト係数化を用いて、実験データに対する既存の識別理論の非常に単純なビューを提供する。
論文 参考訳(メタデータ) (2020-04-02T17:27:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。