論文の概要: Cross-Balancing for Data-Informed Design and Efficient Analysis of Observational Studies
- arxiv url: http://arxiv.org/abs/2511.15896v1
- Date: Wed, 19 Nov 2025 21:56:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-21 17:08:52.383285
- Title: Cross-Balancing for Data-Informed Design and Efficient Analysis of Observational Studies
- Title(参考訳): データインフォームドデザインのためのクロスバランシングと観察研究の効率的な分析
- Authors: Ying Jin, José Zubizarreta,
- Abstract要約: クロスバランシング(英語: Cross-balancing)とは、サンプル分割を用いて特徴構造における誤差と重み推定における誤差を分離する手法である。
結果情報の慎重な利用は、解釈可能性を維持しながら、推定と推測の両方を大幅に改善できることを示す。
- 参考スコア(独自算出の注目度): 7.899668963928307
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Causal inference starts with a simple idea: compare groups that differ by treatment, not much else. Traditionally, similar groups are constructed using only observed covariates; however, it remains a long-standing challenge to incorporate available outcome data into the study design while preserving valid inference. In this paper, we study the general problem of covariate adjustment, effect estimation, and statistical inference when balancing features are constructed or selected with the aid of outcome information from the data. We propose cross-balancing, a method that uses sample splitting to separate the error in feature construction from the error in weight estimation. Our framework addresses two cases: one where the features are learned functions and one where they are selected from a potentially high-dimensional dictionary. In both cases, we establish mild and general conditions under which cross-balancing produces consistent, asymptotically normal, and efficient estimators. In the learned-function case, cross-balancing achieves finite-sample bias reduction relative to plug-in-type estimators, and is multiply robust when the learned features converge at slow rates. In the variable-selection case, cross-balancing only requires a product condition on how well the selected variables approximate true functions. We illustrate cross-balancing in extensive simulations and an observational study, showing that careful use of outcome information can substantially improve both estimation and inference while maintaining interpretability.
- Abstract(参考訳): 因果推論は単純なアイデアから始まり、治療によって異なるグループを比較します。
伝統的に、類似したグループは観測された共変量のみを用いて構成されるが、有効な推論を維持しつつ、利用可能な結果データを研究設計に組み込むことは長年にわたる課題である。
本稿では,データから得られる結果情報を用いて,バランス特性を構築し,選択する場合の共変量調整,効果推定,統計的推測の一般的な問題について検討する。
重み推定における誤差から特徴構造における誤差を分離するために,サンプル分割を用いたクロスバランシングを提案する。
本フレームワークは,特徴が学習関数である場合と,高次元辞書から選択される場合の2つの事例に対処する。
どちらの場合も、クロスバランシングが一貫した漸近的に正常で効率的な推定を行うような、穏やかで一般的な条件を確立する。
学習関数の場合、クロスバランシングは、プラグイン型推定器と比較して有限サンプルバイアスの低減を実現し、学習特徴が遅い速度で収束すると、乗算的に堅牢である。
変数選択の場合、クロスバランシングは、選択された変数が真の関数をいかにうまく近似するかに関する積条件のみを必要とする。
本研究では,広範シミュレーションにおけるクロスバランスと観察的研究について述べるとともに,解析可能性を維持しながら,結果情報の慎重に活用することで,推定と推測の両方を大幅に改善できることを示す。
関連論文リスト
- Joint Registration and Conformal Prediction for Partially Observed Functional Data [8.700521915355]
部分的な観測関数における欠落部分の予測は、無限次元性、観測の内外における複雑な依存、不規則ノイズによって困難である。
本稿では,共形予測フレームワークに基づく部分観測関数に対する統一的な登録と予測手法を提案する。
提案手法は、慎重に構築された予測-応答ペアによる交換性を確保しつつ、登録と予測を統合する。
論文 参考訳(メタデータ) (2025-02-20T19:42:20Z) - Model-free Methods for Event History Analysis and Efficient Adjustment (PhD Thesis) [55.2480439325792]
この論文は、モデルフリーの観点から統一された統計学への独立した貢献のシリーズである。
第1章では、機械学習から予測技術を活用する柔軟なメソッドを定式化するために、モデルフリーの視点をどのように利用できるか、詳しく説明している。
第2章では、あるプロセスの進化が他のプロセスに直接影響されるかどうかを記述した地域独立の概念を研究している。
論文 参考訳(メタデータ) (2025-02-11T19:24:09Z) - High-dimensional logistic regression with missing data: Imputation, regularization, and universality [7.167672851569787]
我々は高次元リッジ規則化ロジスティック回帰について検討する。
予測誤差と推定誤差の両方を正確に評価する。
論文 参考訳(メタデータ) (2024-10-01T21:41:21Z) - Unveiling the Statistical Foundations of Chain-of-Thought Prompting Methods [59.779795063072655]
CoT(Chain-of-Thought)の促進とその変種は、多段階推論問題を解決する効果的な方法として人気を集めている。
統計的推定の観点からCoTのプロンプトを解析し,その複雑さを包括的に評価する。
論文 参考訳(メタデータ) (2024-08-25T04:07:18Z) - Multivariate Probabilistic Time Series Forecasting with Correlated Errors [17.212396544233307]
本稿では,自動回帰モデルのための複数ステップでエラーの共分散構造を学習するプラグイン・アンド・プレイ手法を提案する。
RNNとTransformerアーキテクチャ上に構築された確率モデルについて,本手法の評価を行った。
論文 参考訳(メタデータ) (2024-02-01T20:27:19Z) - Trade-off Between Dependence and Complexity for Nonparametric Learning
-- an Empirical Process Approach [10.27974860479791]
データが時間的依存を示す多くのアプリケーションでは、対応する経験的プロセスは理解されていない。
標準的な$beta/rho$-mixingの仮定の下では、経験過程の期待上限に一般化する。
長距離依存下であっても、i.d.設定と同じ速度で達成できることが示される。
論文 参考訳(メタデータ) (2024-01-17T05:08:37Z) - Amortized Inference for Causal Structure Learning [72.84105256353801]
因果構造を学習することは、通常、スコアまたは独立テストを使用して構造を評価することを伴う探索問題を引き起こす。
本研究では,観測・干渉データから因果構造を予測するため,変分推論モデルを訓練する。
我々のモデルは、実質的な分布シフトの下で頑健な一般化能力を示す。
論文 参考訳(メタデータ) (2022-05-25T17:37:08Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - Optimal regularizations for data generation with probabilistic graphical
models [0.0]
経験的に、よく調和された正規化スキームは、推論されたモデルの品質を劇的に改善する。
生成的ペアワイドグラフィカルモデルの最大Aポストエリオーリ(MAP)推論におけるL2とL1の正規化について検討する。
論文 参考訳(メタデータ) (2021-12-02T14:45:16Z) - Stable Prediction via Leveraging Seed Variable [73.9770220107874]
従来の機械学習手法は、非因果変数によって誘導されるトレーニングデータにおいて、微妙に刺激的な相関を利用して予測する。
本研究では, 条件付き独立性テストに基づくアルゴリズムを提案し, 種子変数を先行変数とする因果変数を分離し, 安定な予測に採用する。
我々のアルゴリズムは、安定した予測のための最先端の手法より優れている。
論文 参考訳(メタデータ) (2020-06-09T06:56:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。