論文の概要: A Huber loss-based super learner with applications to healthcare
expenditures
- arxiv url: http://arxiv.org/abs/2205.06870v1
- Date: Fri, 13 May 2022 19:57:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-19 10:10:24.795691
- Title: A Huber loss-based super learner with applications to healthcare
expenditures
- Title(参考訳): ハマー損失に基づくスーパーラーナーと医療支出への応用
- Authors: Ziyue Wu, David Benkeser
- Abstract要約: 本稿では,2乗誤差損失と絶対損失とを結合した「ロバスト」損失関数であるHuber損失に基づく超学習者を提案する。
提案手法は,ハマーリスクの最適化だけでなく,有限サンプル設定でも直接利用できることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Complex distributions of the healthcare expenditure pose challenges to
statistical modeling via a single model. Super learning, an ensemble method
that combines a range of candidate models, is a promising alternative for cost
estimation and has shown benefits over a single model. However, standard
approaches to super learning may have poor performance in settings where
extreme values are present, such as healthcare expenditure data. We propose a
super learner based on the Huber loss, a "robust" loss function that combines
squared error loss with absolute loss to down-weight the influence of outliers.
We derive oracle inequalities that establish bounds on the finite-sample and
asymptotic performance of the method. We show that the proposed method can be
used both directly to optimize Huber risk, as well as in finite-sample settings
where optimizing mean squared error is the ultimate goal. For this latter
scenario, we provide two methods for performing a grid search for values of the
robustification parameter indexing the Huber loss. Simulations and real data
analysis demonstrate appreciable finite-sample gains in cost prediction and
causal effect estimation using our proposed method.
- Abstract(参考訳): 医療支出の複雑な分布は、単一のモデルによる統計モデリングに困難をもたらす。
さまざまな候補モデルを組み合わせたアンサンブル手法であるSuper Learningは,コスト見積のための有望な代替手段であり,単一のモデルに対するメリットを示している。
しかし、スーパーラーニングへの標準的なアプローチは、医療費データなどの極端な値が存在する環境では、パフォーマンスが劣る可能性がある。
本稿では,2乗誤差損失と絶対損失を組み合わせ,アウトレーヤの影響を下げる「ロバスト」損失関数であるHuber損失に基づく超学習者を提案する。
我々は、この手法の有限サンプルおよび漸近性能上の境界を確立するオラクル不等式を導出する。
提案手法は,ハバーリスクの最適化と,平均二乗誤差の最適化が究極の目標となる有限サンプル設定の両方に利用できることを示す。
後者のシナリオでは,フーバー損失をインデックス化するロバスト化パラメータの値のグリッド探索を行う2つの方法を提案する。
シミュレーションと実データ解析は,提案手法によるコスト予測と因果効果推定において有意な有限サンプルゲインを示す。
関連論文リスト
- Regret Minimization and Statistical Inference in Online Decision Making with High-dimensional Covariates [7.21848268647674]
我々は、決定のための$varepsilon$-greedybanditアルゴリズムと、疎帯域パラメータを推定するためのハードしきい値アルゴリズムを統合する。
マージン条件下では、我々の手法は、$O(T1/2)$ regret あるいは古典的な$O(T1/2)$-consistent推論のいずれかを達成する。
論文 参考訳(メタデータ) (2024-11-10T01:47:11Z) - Rejection via Learning Density Ratios [50.91522897152437]
拒絶による分類は、モデルを予測しないことを許容する学習パラダイムとして現れます。
そこで我々は,事前学習したモデルの性能を最大化する理想的なデータ分布を求める。
私たちのフレームワークは、クリーンでノイズの多いデータセットで実証的にテストされます。
論文 参考訳(メタデータ) (2024-05-29T01:32:17Z) - Equation Discovery with Bayesian Spike-and-Slab Priors and Efficient Kernels [57.46832672991433]
ケルネル学習とBayesian Spike-and-Slab pres (KBASS)に基づく新しい方程式探索法を提案する。
カーネルレグレッションを用いてターゲット関数を推定する。これはフレキシブルで表現力があり、データ空間やノイズに対してより堅牢である。
我々は,効率的な後部推論と関数推定のための予測伝搬予測最大化アルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-10-09T03:55:09Z) - Asymptotic Characterisation of Robust Empirical Risk Minimisation
Performance in the Presence of Outliers [18.455890316339595]
我々は,次元$d$とデータ点数$n$が固定比$alpha=n/d$で分岐した場合,高次元の線形回帰について検討し,出力率を含むデータモデルについて検討する。
我々は、$ell$-regularized $ell$, $ell_$, Huber損失を用いて、経験的リスク最小化(ERM)のパフォーマンスの正確性を提供する。
論文 参考訳(メタデータ) (2023-05-30T12:18:39Z) - Optimal Sparse Recovery with Decision Stumps [7.24496247221802]
木に基づく手法は,多種多様な条件下で,強力な特徴選択特性が得られることを示す。
また,本分析の副産物として,アクティブ機能数$s$が不明な場合でも,回復を確実に保証できることを示す。
論文 参考訳(メタデータ) (2023-03-08T00:43:06Z) - On the Pitfalls of Heteroscedastic Uncertainty Estimation with
Probabilistic Neural Networks [23.502721524477444]
このアプローチがいかにして非常に貧弱だが安定な推定に繋がるかを示す合成例を示す。
問題を悪化させる特定の条件とともに、犯人をログライクな損失とみなす。
我々は、損失に対する各データポイントの寄与を、$beta$-exponentiated variance estimateによって重み付けする、$beta$-NLLと呼ばれる別の定式化を提案する。
論文 参考訳(メタデータ) (2022-03-17T08:46:17Z) - Error-based Knockoffs Inference for Controlled Feature Selection [49.99321384855201]
本手法では, ノックオフ特徴量, エラーベース特徴重要度統計量, ステップダウン手順を一体化して, エラーベースのノックオフ推定手法を提案する。
提案手法では回帰モデルを指定する必要はなく,理論的保証で特徴選択を処理できる。
論文 参考訳(メタデータ) (2022-03-09T01:55:59Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Risk Minimization from Adaptively Collected Data: Guarantees for
Supervised and Policy Learning [57.88785630755165]
経験的リスク最小化(Empirical Risk Minimization, ERM)は、機械学習のワークホースであるが、適応的に収集されたデータを使用すると、そのモデルに依存しない保証が失敗する可能性がある。
本研究では,仮説クラス上での損失関数の平均値を最小限に抑えるため,適応的に収集したデータを用いた一般的な重み付きERMアルゴリズムについて検討する。
政策学習では、探索がゼロになるたびに既存の文献のオープンギャップを埋める率-最適後悔保証を提供する。
論文 参考訳(メタデータ) (2021-06-03T09:50:13Z) - Scalable Personalised Item Ranking through Parametric Density Estimation [53.44830012414444]
暗黙のフィードバックから学ぶことは、一流問題の難しい性質のために困難です。
ほとんどの従来の方法は、一級問題に対処するためにペアワイズランキングアプローチとネガティブサンプラーを使用します。
本論文では,ポイントワイズと同等の収束速度を実現する学習対ランクアプローチを提案する。
論文 参考訳(メタデータ) (2021-05-11T03:38:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。