論文の概要: High-dimensional Measurement Error Models for Lipschitz Loss
- arxiv url: http://arxiv.org/abs/2210.15008v1
- Date: Wed, 26 Oct 2022 20:06:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-28 15:42:25.929710
- Title: High-dimensional Measurement Error Models for Lipschitz Loss
- Title(参考訳): リプシッツ損失の高次元計測誤差モデル
- Authors: Xin Ma and Suprateek Kundu
- Abstract要約: リプシッツ損失関数のクラスに対する高次元計測誤差モデルを開発する。
我々の推定器は、適切な実現可能な集合に属するすべての推定器の中で、$L_1$ノルムを最小化するように設計されている。
有限標本統計誤差境界と符号の整合性の観点から理論的な保証を導出する。
- 参考スコア(独自算出の注目度): 2.6415509201394283
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Recently emerging large-scale biomedical data pose exciting opportunities for
scientific discoveries. However, the ultrahigh dimensionality and
non-negligible measurement errors in the data may create difficulties in
estimation. There are limited methods for high-dimensional covariates with
measurement error, that usually require knowledge of the noise distribution and
focus on linear or generalized linear models. In this work, we develop
high-dimensional measurement error models for a class of Lipschitz loss
functions that encompasses logistic regression, hinge loss and quantile
regression, among others. Our estimator is designed to minimize the $L_1$ norm
among all estimators belonging to suitable feasible sets, without requiring any
knowledge of the noise distribution. Subsequently, we generalize these
estimators to a Lasso analog version that is computationally scalable to higher
dimensions. We derive theoretical guarantees in terms of finite sample
statistical error bounds and sign consistency, even when the dimensionality
increases exponentially with the sample size. Extensive simulation studies
demonstrate superior performance compared to existing methods in classification
and quantile regression problems. An application to a gender classification
task based on brain functional connectivity in the Human Connectome Project
data illustrates improved accuracy under our approach, and the ability to
reliably identify significant brain connections that drive gender differences.
- Abstract(参考訳): 最近の大規模生物医学データは、科学的な発見にエキサイティングな機会をもたらす。
しかし、データ中の超高次元および非無視測定誤差は、推定に困難をもたらす可能性がある。
測定誤差を伴う高次元共変量の限定的な方法があり、通常はノイズ分布の知識を必要とし、線形あるいは一般化線形モデルに焦点をあてる。
本研究では,ロジスティック回帰,ヒンジ損失,量子量回帰などを含むリプシッツ損失関数の高次元計測誤差モデルを開発した。
我々の推定器は、ノイズ分布の知識を必要とせずに、適切な実行可能集合に属するすべての推定器の$l_1$ノルムを最小化するように設計されている。
その後、これらの推定器をより高次元にスケーラブルなラッソアナログ版に一般化する。
有限標本の統計的誤差境界と符号の一貫性という観点からは、たとえその次元が標本サイズとともに指数関数的に増加する場合でも、理論的保証が得られる。
大規模なシミュレーション研究は、従来の分類法や量子回帰問題と比較して優れた性能を示す。
人コネクトームプロジェクトデータにおける脳機能接続に基づく性別分類タスクの応用は、このアプローチによる精度の向上と、性差を駆動する重要な脳接続を確実に識別する能力を示している。
関連論文リスト
- RMFGP: Rotated Multi-fidelity Gaussian process with Dimension Reduction
for High-dimensional Uncertainty Quantification [12.826754199680474]
マルチフィデリティモデリングは、少量の正確なデータしか入手できない場合でも、正確な推測を可能にする。
高忠実度モデルと1つ以上の低忠実度モデルを組み合わせることで、多忠実度法は興味のある量の正確な予測を行うことができる。
本稿では,回転多要素ガウス過程の回帰に基づく新しい次元削減フレームワークとベイズ能動学習手法を提案する。
論文 参考訳(メタデータ) (2022-04-11T01:20:35Z) - Theoretical characterization of uncertainty in high-dimensional linear
classification [24.073221004661427]
本研究では,高次元入力データとラベルの限られたサンプル数から学習する不確実性が,近似メッセージパッシングアルゴリズムによって得られることを示す。
我々は,信頼度を適切に正則化することで緩和する方法について論じるとともに,損失に対するクロスバリデーションが0/1誤差よりもキャリブレーションが優れていることを示す。
論文 参考訳(メタデータ) (2022-02-07T15:32:07Z) - Data-driven Uncertainty Quantification in Computational Human Head
Models [0.6745502291821954]
現代の生物モデルシミュレーションは、非常に高い計算コストと高次元の入力と出力に関連付けられている。
本研究では、計算ヘッドモデルの不確実性定量化(UQ)のために、2段階のデータ駆動型学習ベースフレームワークを提案する。
代理モデルが計算モデルの高精度な近似を提供するとともに,計算コストを大幅に削減することを示した。
論文 参考訳(メタデータ) (2021-10-29T05:42:31Z) - X-model: Improving Data Efficiency in Deep Learning with A Minimax Model [78.55482897452417]
ディープラーニングにおける分類と回帰設定の両面でのデータ効率の向上を目標とする。
両世界の力を生かすために,我々は新しいX-モデルを提案する。
X-モデルは、特徴抽出器とタスク固有のヘッドの間でミニマックスゲームを行う。
論文 参考訳(メタデータ) (2021-10-09T13:56:48Z) - Near-optimal inference in adaptive linear regression [60.08422051718195]
最小二乗法のような単純な方法でさえ、データが適応的に収集されるときの非正規な振る舞いを示すことができる。
我々は,これらの分布異常を少なくとも2乗推定で補正するオンラインデバイアス推定器のファミリーを提案する。
我々は,マルチアームバンディット,自己回帰時系列推定,探索による能動的学習などの応用を通して,我々の理論の有用性を実証する。
論文 参考訳(メタデータ) (2021-07-05T21:05:11Z) - Low-rank Characteristic Tensor Density Estimation Part II: Compression
and Latent Density Estimation [31.631861197477185]
生成確率モデルを学習することは、機械学習における中核的な問題である。
本稿では,共同次元化と非パラメトリック密度推定の枠組みを提案する。
提案手法は, 回帰処理, サンプリング, 異常検出において, 極めて有望な結果が得られることを示す。
論文 参考訳(メタデータ) (2021-06-20T00:38:56Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - Instability, Computational Efficiency and Statistical Accuracy [101.32305022521024]
我々は,人口レベルでのアルゴリズムの決定論的収束率と,$n$サンプルに基づく経験的対象に適用した場合の(不安定性)の間の相互作用に基づいて,統計的精度を得るフレームワークを開発する。
本稿では,ガウス混合推定,非線形回帰モデル,情報的非応答モデルなど,いくつかの具体的なモデルに対する一般結果の応用について述べる。
論文 参考訳(メタデータ) (2020-05-22T22:30:52Z) - Machine learning for causal inference: on the use of cross-fit
estimators [77.34726150561087]
より優れた統計特性を得るために、二重ローバストなクロスフィット推定器が提案されている。
平均因果効果(ACE)に対する複数の推定器の性能評価のためのシミュレーション研究を行った。
機械学習で使用する場合、二重確率のクロスフィット推定器は、バイアス、分散、信頼区間のカバレッジで他のすべての推定器よりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-04-21T23:09:55Z) - Dimension Independent Generalization Error by Stochastic Gradient
Descent [12.474236773219067]
本稿では, 局所凸損失関数に対する降下(SGD)解の一般化誤差に関する理論を提案する。
一般化誤差は$p$次元に依存したり、低効用$p$対数因子に依存しないことを示す。
論文 参考訳(メタデータ) (2020-03-25T03:08:41Z) - Localized Debiased Machine Learning: Efficient Inference on Quantile
Treatment Effects and Beyond [69.83813153444115]
因果推論における(局所)量子化処理効果((L)QTE)の効率的な推定式を検討する。
Debiased Machine Learning (DML)は、高次元のニュアンスを推定するデータ分割手法である。
本稿では、この負担のかかるステップを避けるために、局所的脱バイアス機械学習(LDML)を提案する。
論文 参考訳(メタデータ) (2019-12-30T14:42:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。