論文の概要: Selective machine learning of doubly robust functionals
- arxiv url: http://arxiv.org/abs/1911.02029v6
- Date: Sun, 3 Sep 2023 07:36:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-07 12:39:01.262884
- Title: Selective machine learning of doubly robust functionals
- Title(参考訳): 2重ロバスト関数の選択的機械学習
- Authors: Yifan Cui and Eric Tchetgen Tchetgen
- Abstract要約: 半パラメトリックモデル上で定義された有限次元関数に関する推論を行うための選択的機械学習フレームワークを提案する。
疑似リスクの新たな定義に基づき、興味の機能を推定する際のバイアス低減を目的とした新しい選択基準を導入する。
- 参考スコア(独自算出の注目度): 6.880360838661036
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While model selection is a well-studied topic in parametric and nonparametric
regression or density estimation, selection of possibly high-dimensional
nuisance parameters in semiparametric problems is far less developed. In this
paper, we propose a selective machine learning framework for making inferences
about a finite-dimensional functional defined on a semiparametric model, when
the latter admits a doubly robust estimating function and several candidate
machine learning algorithms are available for estimating the nuisance
parameters. We introduce a new selection criterion aimed at bias reduction in
estimating the functional of interest based on a novel definition of
pseudo-risk inspired by the double robustness property. Intuitively, the
proposed criterion selects a pair of learners with the smallest pseudo-risk, so
that the estimated functional is least sensitive to perturbations of a nuisance
parameter. We establish an oracle property for a multi-fold cross-validation
version of the new selection criterion which states that our empirical
criterion performs nearly as well as an oracle with a priori knowledge of the
pseudo-risk for each pair of candidate learners. Finally, we apply the approach
to model selection of a semiparametric estimator of average treatment effect
given an ensemble of candidate machine learners to account for confounding in
an observational study which we illustrate in simulations and a data
application.
- Abstract(参考訳): モデル選択は、パラメトリックおよび非パラメトリック回帰または密度推定においてよく研究されているトピックであるが、半パラメトリック問題における高次元ニュアンスパラメータの選択は、はるかに少ない。
本稿では,半パラメトリックモデル上で定義される有限次元関数に関する推論を行うための選択的機械学習フレームワークを提案する。
ダブルロバスト性にインスパイアされた疑似リスクの新しい定義に基づいて,関心関数の推定におけるバイアス低減を目的とした新たな選択基準を提案する。
直感的には、提案した基準は最小の擬似リスクを持つ学習者を選択するため、推定関数はニュアンスパラメータの摂動に最も敏感である。
我々は,2組の候補学習者に対して擬似リスクの事前知識を持つオラクルと同様に,経験的基準がほぼ同等であることを示す,新しい選択基準の多次元クロスバリデーションバージョンに対するオラクル特性を確立する。
最後に, 提案手法を用いて, シミュレーションおよびデータ応用による観察研究において, 候補マシン学習者の集合を考慮し, 平均治療効果の半パラメトリック推定器のモデル選択に適用する。
関連論文リスト
- Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - Selective Nonparametric Regression via Testing [54.20569354303575]
本研究では,所定の点における条件分散の値に関する仮説を検証し,留置手順を開発する。
既存の手法とは異なり、提案手法は分散自体の値だけでなく、対応する分散予測器の不確実性についても考慮することができる。
論文 参考訳(メタデータ) (2023-09-28T13:04:11Z) - Distributed Estimation and Inference for Semi-parametric Binary Response
Models [10.719978332351621]
本稿では,分散コンピューティング環境下での半パラメトリック二値選択モデルの最大スコア推定について検討する。
直感的な分割・対数推定器は計算コストが高く、機械数に対する非正規制約によって制限される。
論文 参考訳(メタデータ) (2022-10-15T23:06:46Z) - Supervised Multivariate Learning with Simultaneous Feature Auto-grouping
and Dimension Reduction [7.093830786026851]
本稿では,クラスタ化低ランク学習フレームワークを提案する。
2つの合同行列正則化を課し、予測因子を構成する特徴を自動的にグループ化する。
低ランクなモデリングよりも解釈可能であり、変数選択における厳密な空間性仮定を緩和する。
論文 参考訳(メタデータ) (2021-12-17T20:11:20Z) - MINIMALIST: Mutual INformatIon Maximization for Amortized Likelihood
Inference from Sampled Trajectories [61.3299263929289]
シミュレーションベースの推論は、その可能性が実際に計算できない場合でもモデルのパラメータを学習することができる。
あるクラスのメソッドは、異なるパラメータでシミュレートされたデータを使用して、確率とエビデンス比の償却推定器を推定する。
モデルパラメータとシミュレーションデータ間の相互情報の観点から,本手法が定式化可能であることを示す。
論文 参考訳(メタデータ) (2021-06-03T12:59:16Z) - Doubly Robust Semiparametric Difference-in-Differences Estimators with
High-Dimensional Data [15.27393561231633]
不均一な治療効果を推定するための2段半パラメトリック差分差分推定器を提案する。
第1段階では、確率スコアを推定するために、一般的な機械学習手法が使用できる。
第2段階ではパラメトリックパラメータと未知関数の両方の収束率を導出する。
論文 参考訳(メタデータ) (2020-09-07T15:14:29Z) - Variable selection for Gaussian process regression through a sparse
projection [0.802904964931021]
本稿では,ガウス過程(GP)レグレッションと統合された新しい変数選択手法を提案する。
パラメータの調整と推定の精度を,選択したベンチマーク手法を用いて評価した。
論文 参考訳(メタデータ) (2020-08-25T01:06:10Z) - Machine learning for causal inference: on the use of cross-fit
estimators [77.34726150561087]
より優れた統計特性を得るために、二重ローバストなクロスフィット推定器が提案されている。
平均因果効果(ACE)に対する複数の推定器の性能評価のためのシミュレーション研究を行った。
機械学習で使用する場合、二重確率のクロスフィット推定器は、バイアス、分散、信頼区間のカバレッジで他のすべての推定器よりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-04-21T23:09:55Z) - Orthogonal Statistical Learning [49.55515683387805]
人口リスクが未知のニュアンスパラメータに依存するような環境では,統計学習における非漸近的過剰リスク保証を提供する。
人口リスクがNeymanityと呼ばれる条件を満たす場合,メタアルゴリズムによって達成される過剰リスクに対するニュアンス推定誤差の影響は2次であることを示す。
論文 参考訳(メタデータ) (2019-01-25T02:21:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。