論文の概要: SHIFT: Robust Double Machine Learning for Average Dose-Response Functions under Heavy-Tailed Contamination
- arxiv url: http://arxiv.org/abs/2605.00176v1
- Date: Thu, 30 Apr 2026 19:51:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 17:43:28.729568
- Title: SHIFT: Robust Double Machine Learning for Average Dose-Response Functions under Heavy-Tailed Contamination
- Title(参考訳): 重機汚染下の平均線量応答関数に対するロバストな二重機械学習
- Authors: Eichi Uehara,
- Abstract要約: ShiFT(Self-calibrated Heavy-tail Inlier-Fit with Tempering)は、強力なDML推定器である。
代数的非凸性により最適化されたカーネル局所ウェルシュロス第二段階とクロスフィットニュアンス化を組み合わせる。
1400個のメインスウィープにまたがる、競争力のある最悪の形状のリカバリがある。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Double-machine-learning pipelines for the Average Dose-Response Function rely on kernel-weighted local-linear smoothers, which inherit unbounded functional influence: a single outlier within a kernel window biases the curve across the entire window. We introduce SHIFT (Self-calibrated Heavy-tail Inlier-Fit with Tempering), a robust DML estimator combining cross-fit nuisance orthogonalization with a kernel-local Welsch-loss second stage optimized by Graduated Non-Convexity, and -- the principal design choice -- a defensive OLS refit whose inlier cutoff is scaled by post-GNC residual MAD rather than the raw-outcome MAD. On a localized-contamination stress test at $p=0.25$ this design choice drops level-RMSE from 1.03 to 0.33 while leaving clean and uniformly-contaminated runs unchanged. Across 1,400 main-sweep fits, SHIFT has competitive worst-case shape recovery (RMSE $0.325$ at $p=0.25$, second to Huber-DML's $0.276$); among the three methods with worst-case RMSE below $0.35$, only SHIFT emits a non-uniform per-sample weight vector, recovering the ground-truth outlier mask at mean $F_1 \approx 0.96$ (range $0.945$--$0.968$) on Gaussian-jump DGPs. We pair the estimator with a six-technique Extreme Value Theory diagnostic suite (Hill, GPD-MLE/PWM, GEV, Mean Excess, parameter stability, causal tail coefficient) that lets a practitioner distinguish Frechet from Weibull regimes and choose between SHIFT and L1 alternatives on empirical grounds. Extensions to binary-treatment CATE (Huber pseudo-outcome X-Learner) and time-series ADRF (block-CV + rolling MAD) are included. A counter-intuitive ablation: linear nuisance models (Ridge, Lasso) outperform gradient-boosted nuisances for robust DML under uniform contamination, inverting the usual more-flexible-is-better heuristic.
- Abstract(参考訳): Average Dose-Response関数のためのダブルマシン学習パイプラインは、カーネル重み付きローカルリニアスムーサに依存しており、非有界な機能的影響を継承する。
非凸性により最適化されたカーネルローカルのウェルシュロス2段目と整合直交直交直交直交直交二段目を組み合わせた堅牢なDML推定器ShiFT(Self-calibrated Heavy-tail Inlier-Fit with Tempering)を導入する。
局所汚染ストレステストの$p=0.25$では、この設計の選択はレベルRMSEを1.03から0.33に落とし、クリーンで均一に汚染された状態は変わらない。
1400本のメインスイープのフィットで、ShiFTは競争力のある最悪のケース形状の回復(RMSE $0.325$ at p=0.25$, second to Huber-DML's $0.276$); 最悪のケースを持つRMSEが0.35$以下である3つの方法のうち、ShiFTのみが、Gaussian-jump DGPで平均$F_1 \approx 0.96$ (range $0.945$-0.968$)でグラウンドトルースアウトリアマスクを回復する。
この推定器を6つの専門的価値理論診断スイート(Hill, GPD-MLE/PWM, GEV, Mean Excess, パラメータ安定性, 因果尾係数)と組み合わせて, 実践者がWeibullの制度とFrechetを区別し, 経験的根拠に基づいてShiFTとL1の代替品を選択する。
バイナリ処理CATE(Huber pseudo-outcome X-Learner)および時系列ADRF(block-CV + rolling MAD)の拡張を含む。
反直感的アブレーション:線形ニュアンスモデル (Ridge, Lasso) は、一様汚染下で頑健なDMLに対して勾配型ニュアンスよりも優れ、通常より柔軟でベターなヒューリスティックを反転させる。
関連論文リスト
- Bayesian X-Learner: Calibrated Posterior Inference for Heterogeneous Treatment Effects under Heavy-Tailed Outcomes [0.0]
X-ラーナー(X-ラーナー、X-ラーナー、X-ラーナー、X-ラーナー、X-ラーナー、X-ラーナー、X-ラーナー、X-ラーナー、X-ラーナー。
20-25%の尾密度を持つ汚染された「鯨」DGPでは、ハマーのミニマックス=$の関係でハマー=$損失を選択する1フラグ拡張 (contamination_severity) が厳密な信頼区間を持つ$(x)$を回復する。
論文 参考訳(メタデータ) (2026-04-30T04:07:11Z) - ALMAB-DC: Active Learning, Multi-Armed Bandits, and Distributed Computing for Sequential Experimental Design and Black-Box Optimization [0.0]
ALMAB-DCはブラックボックス実験のための逐次設計フレームワークである。
バンディット成分に対する累積的後悔境界を示し、Amdahlの法則を通した並列スケーラビリティを特徴付ける。
分散実行は、Amdahlの法則に従って、$K = 16$エージェントでの7.5times$スピードアップを達成する。
論文 参考訳(メタデータ) (2026-03-22T11:47:20Z) - Reinforcement Learning from Multi-Source Imperfect Preferences: Best-of-Both-Regimes Regret [71.69884486156359]
我々は, 累積的不完全化予算を用いて, エンフルティソースの不完全性選好からエピソードRLを考察した。
我々は,最良な登録行動を示す,後悔$tildeO(sqrtK/M+)$の統一アルゴリズムを提案する。
論文 参考訳(メタデータ) (2026-03-20T19:34:53Z) - SA-CycleGAN-2.5D: Self-Attention CycleGAN with Tri-Planar Context for Multi-Site MRI Harmonization [3.5109108807229403]
本稿では,Ben-David らによる$HH$-divergence 境界によるドメイン適応フレームワーク SA-CycleGAN-2.5D を提案する。
2D効率と3D一貫性をブリッジすることで,腫瘍の病態を保ったボクセルレベルの高調波画像が得られる。
論文 参考訳(メタデータ) (2026-03-17T23:49:46Z) - TRACE: Theoretical Risk Attribution under Covariate-shift Effects [4.211510706776732]
ソースをトレーニングしたモデル$Q$を、シフトしたデータに基づいてトレーニングされたモデル$tildeQ$に置き換えると、ソースドメインのパフォーマンスは予測不能に変化する可能性がある。
TRACEは$|R|$を解釈可能な上界に分解するフレームワークである。
論文 参考訳(メタデータ) (2026-02-11T07:22:33Z) - AdamHD: Decoupled Huber Decay Regularization for Language Model Pre-Training [0.2578242050187029]
AdamHuberDecayはAdamWのドロップイン代替品で、$ell$ペナルティを分離したスムーズなHuberレギュレータで置き換える。
GPT-2 と GPT-3 の事前学習実験により,AdamHuberDecay は壁面時間で 10-15% の速度で収束することが示された。
論文 参考訳(メタデータ) (2025-11-18T18:08:20Z) - MaskPro: Linear-Space Probabilistic Learning for Strict (N:M)-Sparsity on Large Language Models [53.36415620647177]
半構造化された空間は、M$M$の重みからN$の要素を戦略的に保持することで、有望なソリューションを提供する。
既存の(N:M)互換のアプローチは通常、かなりのエラーに悩まされるルールベースの階層的な欲求探索と、禁止的なトレーニングコストを引き起こす勾配駆動学習の2つのカテゴリに分類される。
MaskProという新しい線形空間確率的フレームワークを提案する。これは、M$連続重みごとに事前のカテゴリー分布を学習し、その後、この分布を活用して(N:M)スパーシリティを$N$-wayサンプリングを通じて生成することを目的としている。
論文 参考訳(メタデータ) (2025-06-15T15:02:59Z) - Flow-GRPO: Training Flow Matching Models via Online RL [80.62659379624867]
本稿では,オンライン政策強化学習をフローマッチングモデルに統合する最初の方法であるFlow-GRPOを提案する。
提案手法では,(1)決定論的正規微分方程式を同値な微分方程式に変換するODE-to-SDE変換と,(2)推論ステップの数を維持しながらトレーニングの段階を短縮するDenoising Reduction戦略の2つの主要な戦略を用いる。
論文 参考訳(メタデータ) (2025-05-08T17:58:45Z) - Towards Robust Model-Based Reinforcement Learning Against Adversarial Corruption [60.958746600254884]
本研究は、モデルベース強化学習(RL)における敵対的腐敗の課題に取り組む。
本稿では,MLE に対する不確実性重みとして全変量 (TV) に基づく情報比を利用する,汚損楽観的 MLE (CR-OMLE) アルゴリズムを提案する。
我々は、重み付け手法をオフライン設定にまで拡張し、汚損性悲観的MLE (CR-PMLE) というアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-02-14T07:27:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。