論文の概要: Conformal Prediction Under Distribution Shift: A COVID-19 Natural Experiment
- arxiv url: http://arxiv.org/abs/2601.00908v1
- Date: Thu, 01 Jan 2026 01:05:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-06 16:25:21.842892
- Title: Conformal Prediction Under Distribution Shift: A COVID-19 Natural Experiment
- Title(参考訳): 分布変化によるコンフォーマルな予測:COVID-19自然実験
- Authors: Chorok Lee,
- Abstract要約: 本研究は,8つのサプライチェーンタスクを対象とした自然実験として,COVID-19を用いた研究である。
破滅的な失敗は単一機能依存と相関している。
デプロイメント前にSHAP濃度を監視し、脆弱性があれば四半期毎に再トレーニングする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Conformal prediction guarantees degrade under distribution shift. We study this using COVID-19 as a natural experiment across 8 supply chain tasks. Despite identical severe feature turnover (Jaccard approximately 0), coverage drops vary from 0% to 86.7%, spanning two orders of magnitude. Using SHapley Additive exPlanations (SHAP) analysis, we find catastrophic failures correlate with single-feature dependence (rho = 0.714, p = 0.047). Catastrophic tasks concentrate importance in one feature (4.5x increase), while robust tasks redistribute across many (10-20x). Quarterly retraining restores catastrophic task coverage from 22% to 41% (+19 pp, p = 0.04), but provides no benefit for robust tasks (99.8% coverage). Exploratory analysis of 4 additional tasks with moderate feature stability (Jaccard 0.13-0.86) reveals feature stability, not concentration, determines robustness, suggesting concentration effects apply specifically to severe shifts. We provide a decision framework: monitor SHAP concentration before deployment; retrain quarterly if vulnerable (>40% concentration); skip retraining if robust.
- Abstract(参考訳): 等角予測は、分散シフトの下での劣化を保証する。
本研究は,8つのサプライチェーンタスクを対象とした自然実験として,COVID-19を用いた研究である。
非常に厳しい特徴(ジャカードは約0)にもかかわらず、範囲の減少は0%から86.7%と大きく2桁に及んでいる。
SHAP (SHapley Additive exPlanations) 分析により、破滅的故障は単一機能依存(rho = 0.714, p = 0.047)と相関することがわかった。
破滅的なタスクは1つの特徴(4.5倍)で重要であり、ロバストなタスクは多くの特徴(10-20倍)で再分配される。
クォーターリトレーニングは破滅的なタスクカバレッジを22%から41%(+19 pp, p = 0.04)に回復させるが、堅牢なタスクにはメリットがない(99.8%)。
適度な特徴安定性を持つ4つのタスクの探索的解析 (Jaccard 0.13-0.86) では、濃度ではなく特徴安定性が示され、頑健さが決定される。
デプロイメント前にSHAP濃度をモニタリングし、脆弱な場合(>40%)に再トレーニングし、堅牢であれば再トレーニングをスキップする。
関連論文リスト
- Causal Judge Evaluation: Calibrated Surrogate Metrics for LLM Systems [0.29465623430708904]
未校正スコアは選好を逆転させることができ、未校正スコアに対するナイーブな信頼区間は、ほぼ0%のカバレッジを獲得し、重要度重み付け推定器は、限られた重複の下で崩壊する。
3つの障害を全て解決するフレームワークであるCausal Judge Evaluationを紹介します。
論文 参考訳(メタデータ) (2025-12-11T22:16:24Z) - Feature Selection and Regularization in Multi-Class Classification: An Empirical Study of One-vs-Rest Logistic Regression with Gradient Descent Optimization and L1 Sparsity Constraints [0.0]
マルチクラスのワイン分類は、モデル精度、特徴次元、解釈可能性の基本的なトレードオフを示す。
本稿では,UCIワインデータセット上での1-vs-Restロジスティック回帰に関する総合的研究について述べる。
論文 参考訳(メタデータ) (2025-10-16T08:47:05Z) - Learnable Conformal Prediction with Context-Aware Nonconformity Functions for Robotic Planning and Perception [4.694504497452662]
Learnable Conformal Predictionは、固定スコアを軽量なニューラル関数に置き換えて、コンテキスト認識の不確実性セットを生成する。
CPの理論的保証を維持しつつ、予測セットのサイズを18%減らし、検出間隔を52%減らし、経路計画の安全性を72%から91%に改善し、オーバーヘッドを最小限に抑えている。
ハードウェア評価では、LCPは1%未満のメモリと15.9%の推論オーバーヘッドを追加したが、検出タスクでは39 FPSを維持し、アンサンブルの7.4倍のエネルギー効率を保っている。
論文 参考訳(メタデータ) (2025-09-26T06:44:58Z) - Benchmarking Reasoning Robustness in Large Language Models [76.79744000300363]
新規データや不完全データでは,性能が著しく低下することがわかった。
これらの結果は、厳密な論理的推論に対するリコールへの依存を浮き彫りにした。
本稿では,情報不足によって引き起こされる幻覚を利用して推論ギャップを明らかにする,Math-RoBと呼ばれる新しいベンチマークを提案する。
論文 参考訳(メタデータ) (2025-03-06T15:36:06Z) - Stabilizing Extreme Q-learning by Maclaurin Expansion [51.041889588036895]
XQL(Extreme Q-learning)は、ベルマン誤差がガムベル分布に従うという仮定に基づいて損失関数を用いる。
オフラインとオンラインの強化学習環境では、強力なパフォーマンスを示している。
安定度を高めるため,Maclaurin Expanded Extreme Q-learningを提案する。
論文 参考訳(メタデータ) (2024-06-07T12:43:17Z) - RULSurv: A probabilistic survival-based method for early censoring-aware prediction of remaining useful life in ball bearings [39.58317527488534]
Kullback-Leibler分散とRUL推定を用いた早期故障検出のための新しいフレキシブルな手法を提案する。
我々は,XJTU-SYデータセットにおいて,3つの異なる操作条件にまたがる5倍のクロスバリデーション戦略を用いてアプローチを実証する。
提案手法は,最大荷重下での5軸受の平均累積相対精度(CRA)を0.7586で達成し,複数の最先端ベースラインを改良する。
論文 参考訳(メタデータ) (2024-05-02T16:17:29Z) - Robust and Agnostic Learning of Conditional Distributional Treatment Effects [44.31792000298105]
問題クラスに対する条件付きDTE(Conditional DTE)を学習するための、新しい堅牢でモデルに依存しない方法論を提供する。
本手法は回帰モデルクラスにCDTEの最良のプロジェクションを提供することができるため,モデルに依存しない。
シミュレーションにおける提案手法の挙動と,富に対する401(k)の適格性の影響を事例として検討した。
論文 参考訳(メタデータ) (2022-05-23T17:40:31Z) - Treatment Effect Risk: Bounds and Inference [58.442274475425144]
平均的な治療効果は社会福祉の変化を測定するため、たとえ肯定的であっても、人口の約10%に悪影響を及ぼすリスクがある。
本稿では,ICT分布のリスク条件値(CVaR)として定式化されたこの重要なリスク尺度をどう評価するかを検討する。
いくつかの境界は、複素CATE関数を単一の計量に要約したものと解釈することもでき、有界であることとは無関係に興味を持つ。
論文 参考訳(メタデータ) (2022-01-15T17:21:26Z) - Learning Stable Classifiers by Transferring Unstable Features [59.06169363181417]
本研究では,素早い相関関係の存在下での伝達学習について検討する。
提案手法は, ソースタスクで学習した安定な特徴抽出器を直接転送しても, 対象タスクのバイアスを排除できないことを実験的に実証する。
我々は、ソースタスクの不安定な特徴とターゲットタスクの不安定な特徴が直接関連していると仮定する。
論文 参考訳(メタデータ) (2021-06-15T02:41:12Z) - Learning Calibrated Uncertainties for Domain Shift: A Distributionally
Robust Learning Approach [150.8920602230832]
ドメインシフトの下で校正された不確実性を学習するためのフレームワークを提案する。
特に、密度比推定は、ターゲット(テスト)サンプルの近さをソース(トレーニング)分布に反映する。
提案手法は下流タスクに有利な校正不確実性を生成する。
論文 参考訳(メタデータ) (2020-10-08T02:10:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。