論文の概要: Semi-Supervised Quantile Estimation: Robust and Efficient Inference in
High Dimensional Settings
- arxiv url: http://arxiv.org/abs/2201.10208v1
- Date: Tue, 25 Jan 2022 10:02:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-26 16:10:19.902428
- Title: Semi-Supervised Quantile Estimation: Robust and Efficient Inference in
High Dimensional Settings
- Title(参考訳): 半監督量子推定:高次元設定におけるロバストと効率的な推論
- Authors: Abhishek Chakrabortty, Guorong Dai and Raymond J. Carroll
- Abstract要約: 2つの利用可能なデータセットを特徴とする半教師付き環境での量子推定を考察する。
本稿では,2つのデータセットに基づいて,応答量子化(s)に対する半教師付き推定器群を提案する。
- 参考スコア(独自算出の注目度): 0.07031569227782805
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider quantile estimation in a semi-supervised setting, characterized
by two available data sets: (i) a small or moderate sized labeled data set
containing observations for a response and a set of possibly high dimensional
covariates, and (ii) a much larger unlabeled data set where only the covariates
are observed. We propose a family of semi-supervised estimators for the
response quantile(s) based on the two data sets, to improve the estimation
accuracy compared to the supervised estimator, i.e., the sample quantile from
the labeled data. These estimators use a flexible imputation strategy applied
to the estimating equation along with a debiasing step that allows for full
robustness against misspecification of the imputation model. Further, a
one-step update strategy is adopted to enable easy implementation of our method
and handle the complexity from the non-linear nature of the quantile estimating
equation. Under mild assumptions, our estimators are fully robust to the choice
of the nuisance imputation model, in the sense of always maintaining root-n
consistency and asymptotic normality, while having improved efficiency relative
to the supervised estimator. They also attain semi-parametric optimality if the
relation between the response and the covariates is correctly specified via the
imputation model. As an illustration of estimating the nuisance imputation
function, we consider kernel smoothing type estimators on lower dimensional and
possibly estimated transformations of the high dimensional covariates, and we
establish novel results on their uniform convergence rates in high dimensions,
involving responses indexed by a function class and usage of dimension
reduction techniques. These results may be of independent interest. Numerical
results on both simulated and real data confirm our semi-supervised approach's
improved performance, in terms of both estimation and inference.
- Abstract(参考訳): 2つの利用可能なデータセットを特徴とする半教師付き環境での量子推定を考える。
(i)応答の観察とおそらく高次元の共変量の集合を含む、小型又は中程度のラベル付きデータセット
(ii)共変量のみを観測する、はるかに大きなラベルのないデータセット。
本研究では,2つのデータセットに基づく応答量子化のための半教師付き推定器群を提案し,教師付き推定器,すなわちラベル付きデータからのサンプル量子化器と比較して推定精度を向上させる。
これらの推定器は、推定式に適用される柔軟なインプテーション戦略と、インプテーションモデルの誤特定に対する完全なロバスト性を可能にするデバイアスステップを用いる。
さらに,本手法の実装が容易な一段階更新戦略を採用し,量子的推定方程式の非線形性質から複雑性を扱えるようにした。
軽微な仮定の下では、根nの一貫性と漸近正規性を常に維持するという意味で、我々の推定器はニュアンス計算モデルの選択に対して完全に堅牢であり、教師付き推定器と比較して効率が向上する。
また、応答と共変量の関係がインプテーションモデルによって正しく指定されている場合、半パラメトリック最適性を得る。
ニュアサンスインプテーション関数を推定する例として,高次元共変量の低次元およびおそらく推定された変換上での核平滑化型推定器について検討し,関数クラスにインデックスされた応答と次元減少手法を用いた高次元における一様収束率に関する新しい結果を確立した。
これらの結果は独立した関心事かもしれない。
シミュレーションデータと実データの両方の数値計算結果から,推定と推測の両方の観点から,半教師付きアプローチによる性能向上が確認できた。
関連論文リスト
- Semiparametric conformal prediction [79.6147286161434]
リスクに敏感なアプリケーションは、複数の、潜在的に相関したターゲット変数に対して、よく校正された予測セットを必要とする。
スコアをランダムなベクトルとして扱い、それらの連接関係構造を考慮した予測セットを構築することを目的とする。
実世界のレグレッション問題に対して,所望のカバレッジと競争効率について報告する。
論文 参考訳(メタデータ) (2024-11-04T14:29:02Z) - Multivariate root-n-consistent smoothing parameter free matching estimators and estimators of inverse density weighted expectations [51.000851088730684]
我々は、パラメトリックな$sqrt n $-rateで収束する、最も近い隣人の新しい修正とマッチング推定器を開発する。
我々は,非パラメトリック関数推定器は含まないこと,特に標本サイズ依存パラメータの平滑化には依存していないことを強調する。
論文 参考訳(メタデータ) (2024-07-11T13:28:34Z) - Learning Unnormalized Statistical Models via Compositional Optimization [73.30514599338407]
実データと人工雑音のロジスティックな損失として目的を定式化することにより, ノイズコントラスト推定(NCE)を提案する。
本稿では,非正規化モデルの負の対数類似度を最適化するための直接的アプローチについて検討する。
論文 参考訳(メタデータ) (2023-06-13T01:18:16Z) - Distributed Estimation and Inference for Semi-parametric Binary Response Models [8.309294338998539]
本稿では,分散コンピューティング環境下での半パラメトリック二値選択モデルの最大スコア推定について検討する。
直感的な分割・対数推定器は計算コストが高く、機械数に対する非正規制約によって制限される。
論文 参考訳(メタデータ) (2022-10-15T23:06:46Z) - A General Framework for Treatment Effect Estimation in Semi-Supervised and High Dimensional Settings [0.0]
我々は, より堅牢で, (2) 教師付きよりも効率的であるSS推定器群を開発した。
さらに、モデル内の正当性スコアが正しく指定されたときに、SS推定器のルート-n整合性と正規性を確立する。
我々の推定器は、すべてのニュアンス関数が正しく指定されている限り、半パラメトリックに効率的であることが示される。
論文 参考訳(メタデータ) (2022-01-03T04:12:44Z) - Communication-Efficient Distributed Quantile Regression with Optimal
Statistical Guarantees [2.064612766965483]
本稿では,分散量子レグレッションにおいて,厳密なスケーリング条件を伴わずに最適な推論を実現する方法の課題に対処する。
この問題は、ローカル(各データソース)とグローバルな目的関数に適用される二重平滑化アプローチによって解決される。
局所的および大域的滑らか化パラメータの微妙な組み合わせに依存するにもかかわらず、量子回帰モデルは完全にパラメトリックである。
論文 参考訳(メタデータ) (2021-10-25T17:09:59Z) - Statistical Inference for High-Dimensional Linear Regression with
Blockwise Missing Data [13.48481978963297]
ブロックワイドなデータは、異なるソースまたはモダリティが相補的な情報を含むマルチソースまたはマルチモダリティデータを統合するときに発生する。
本稿では,未偏差推定方程式に基づいて回帰係数ベクトルを計算効率良く推定する手法を提案する。
アルツハイマー病神経画像イニシアチブの数値的研究と応用分析により、提案手法は既存の方法よりも教師なしのサンプルからより優れた性能と利益を得られることを示した。
論文 参考訳(メタデータ) (2021-06-07T05:12:42Z) - Instability, Computational Efficiency and Statistical Accuracy [101.32305022521024]
我々は,人口レベルでのアルゴリズムの決定論的収束率と,$n$サンプルに基づく経験的対象に適用した場合の(不安定性)の間の相互作用に基づいて,統計的精度を得るフレームワークを開発する。
本稿では,ガウス混合推定,非線形回帰モデル,情報的非応答モデルなど,いくつかの具体的なモデルに対する一般結果の応用について述べる。
論文 参考訳(メタデータ) (2020-05-22T22:30:52Z) - Nonparametric Score Estimators [49.42469547970041]
未知分布によって生成されたサンプルの集合からスコアを推定することは確率モデルの推論と学習における基本的なタスクである。
正規化非パラメトリック回帰の枠組みの下で、これらの推定器の統一的なビューを提供する。
カールフリーカーネルと高速収束による計算効果を享受する反復正規化に基づくスコア推定器を提案する。
論文 参考訳(メタデータ) (2020-05-20T15:01:03Z) - Machine learning for causal inference: on the use of cross-fit
estimators [77.34726150561087]
より優れた統計特性を得るために、二重ローバストなクロスフィット推定器が提案されている。
平均因果効果(ACE)に対する複数の推定器の性能評価のためのシミュレーション研究を行った。
機械学習で使用する場合、二重確率のクロスフィット推定器は、バイアス、分散、信頼区間のカバレッジで他のすべての推定器よりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-04-21T23:09:55Z) - Statistical Inference for Model Parameters in Stochastic Gradient
Descent [45.29532403359099]
勾配降下係数(SGD)は,その計算効率とメモリ効率から,大規模データの統計的推定に広く用いられている。
人口減少関数が強い凸であり,一定の条件を満たす場合,SGDに基づく真のモデルパラメータの統計的推測の問題について検討する。
論文 参考訳(メタデータ) (2016-10-27T07:04:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。