論文の概要: Active Multiple-Prediction-Powered Inference
- arxiv url: http://arxiv.org/abs/2605.08429v1
- Date: Fri, 08 May 2026 19:48:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:49.639781
- Title: Active Multiple-Prediction-Powered Inference
- Title(参考訳): アクティブ・マルチプレディション・パワード推論
- Authors: Nicholas Brawand, Nima Leclerc, Anhthy Ngo, Matthew Peterson, Sriram Vishwanath, Laith Alhussein, Ben Wellner,
- Abstract要約: 医療のデプロイ後のモニタリングには統計的に有効なラベル効率の方法が必要であるが、クリニックチャートのゴールドスタンダードラベルは高価である。
我々は,各インスタンスをコスト適切な予測器にルーティングし,金標準ラベルを比例してサンプリングし,単一のデプロイ時間に予測を再現する予測能動型推論(AM-PPI)を提案する。
- 参考スコア(独自算出の注目度): 2.1710524042938073
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Post-deployment monitoring of healthcare AI requires statistically valid, label-efficient methods, but gold-standard labels from clinician chart review are expensive. Prediction-powered inference (PPI) and active statistical inference (ASI) reduce label cost by combining a small labeled sample with abundant model predictions, but both are restricted to a single predictor, a poor fit for modern clinical pipelines that have multiple predictors of differing cost and accuracy available at inference time. We propose Active Multiple-Prediction-Powered Inference (AM-PPI), which routes each instance to a cost-appropriate predictor subset, samples gold-standard labels in proportion to the chosen subset's residual uncertainty, and reweights predictions to minimize estimator variance, all under a single deployment-time budget. AM-PPI generalizes ASI to leverage multiple predictors and extends Multiple-PPI from global per-predictor allocation to per-instance adaptive routing. We derive closed-form Karush-Kuhn-Tucker (KKT) conditions for all three decisions and prove, via biconvexity and strong duality, that the resulting fixed point is a global optimum despite the joint problem being non-jointly-convex. We establish asymptotic normality with valid coverage, minimum-variance unbiasedness within the linear-prediction augmented inverse propensity weighted (AIPW) class, and a closed-form criterion identifying when multiple predictors help. On synthetic data and three healthcare monitoring tasks, AM-PPI produces 10 to 40 percent narrower confidence intervals (CIs) than single-predictor ASI in the budget regime where routing matters, and matches the better baseline elsewhere.
- Abstract(参考訳): 医療AIのデプロイ後のモニタリングには統計的に有効なラベル効率の方法が必要であるが、クリニックチャートのゴールドスタンダードラベルは高価である。
予測駆動推論 (PPI) とアクティブ統計的推論 (ASI) は, ラベル付き小さなサンプルと豊富なモデル予測を組み合わせることでラベルコストを削減するが, どちらも単一の予測器に制限される。
本稿では,各インスタンスをコスト適切な予測サブセットにルーティングし,選択したサブセットの不確かさに比例して金標準ラベルをサンプリングする能動多重予測(AM-PPI)を提案する。
AM-PPIは、ASIを一般化して、複数の予測子を活用するとともに、グローバルな予測子割り当てからインスタンスごとの適応ルーティングまで、多重PPIを拡張する。
閉形式カルーシュ・クーン=タッカー条件(KKT)を3つの決定すべてに対して導出し、両凸性と強い双対性を通じて、結果の固定点が非連接凸であるにもかかわらず大域的最適であることを証明する。
我々は,線形予測型逆不偏性重み付け(AIPW)クラスにおいて,有意なカバレッジ,最小分散不偏性,および複数の予測因子がいつ助けられるかを特定するクローズドフォームの基準を定め,漸近的正規性を確立した。
合成データと3つの医療モニタリングタスクにおいて、AM-PPIは、ルーティングが問題となる予算体制において、単一予測型AISよりも10から40%狭い信頼区間(CI)を生成し、他の場所でのより良いベースラインと一致させる。
関連論文リスト
- Dual Strategies for Test-Time Adaptation [37.36806938657306]
従来のテスト時間適応アプローチは、ごく少数のテストサンプルを使用してモデルを適応させるのが一般的である。
本稿では,より大規模で多様なテストサンプルを活用することで,分散シフトによる性能向上を実現する新しいフレームワークであるDualTTAを紹介する。
論文 参考訳(メタデータ) (2026-04-19T17:04:36Z) - Multiple-Prediction-Powered Inference [57.30769275944024]
この研究は、MultiPPI推定器のミニマックス最適性、有限サンプル性能、正規性に関する理論的保証を提供する。
我々は,MultiPPIが既存のベースラインよりも低い推定誤差を実現することを示す。
論文 参考訳(メタデータ) (2026-03-28T21:24:00Z) - LEC: Linear Expectation Constraints for False-Discovery Control in Selective Prediction and Routing Systems [95.35293543918762]
大規模言語モデル(LLM)はしばしば信頼できない答えを生成するが、不確実性のある手法は誤った予測と完全に区別することができない。
我々は、この問題を、偽発見率(FDR)制御のレンズを通して解決し、全ての許容された予測のうち、エラーの割合が目標のリスクレベルを超えないことを保証する。
本稿では,線形期待制約を強制することで,選択予測を制約付き決定問題として再解釈するLECを提案する。
論文 参考訳(メタデータ) (2025-12-01T11:27:09Z) - Beyond Uncertainty Sets: Leveraging Optimal Transport to Extend Conformal Predictive Distribution to Multivariate Settings [0.14504054468850666]
コンフォーマル予測(CP)は、有限サンプルカバレッジを保証するモデル出力に対する不確実性集合を構成する。
最適な割り当ては、スコア空間の固定された多面体分割において一括的に一定であることを示す。
これにより、予測セット全体を魅力的に特徴付けることができ、予測セットのより深い制限に対処するための機械を提供する。
論文 参考訳(メタデータ) (2025-11-19T05:59:01Z) - MMDCP: A Distribution-free Approach to Outlier Detection and Classification with Coverage Guarantees and SCW-FDR Control [6.429952624399788]
ラベルシフト下でのマルチクラス分類と外乱検出のための統一的なフレームワークを提案する。
修正マハラノビス距離等角予測(MMDCP)は、クラス固有の距離測度と完全な等角予測を組み合わせてスコア関数を構築する。
オラクルと経験的コンフォーマルな$p$-値のギャップを初めて理論的に評価し、クラスワイド偽発見率(CW-FDR)の有効なカバレッジと効果的な制御を確実にする。
論文 参考訳(メタデータ) (2025-11-15T03:48:44Z) - Wasserstein-regularized Conformal Prediction under General Distribution Shift [21.29977879431466]
等式予測は、i.d.仮定の下で真のターゲットの1-alpha$カバレッジが保証された予測セットを生成する。
本稿では、ワッサーシュタイン距離に基づくカバレッジギャップの上界を提案し、確率測度をプッシュフォワードで解析する。
本稿では,重要重み付けと正規化表現学習(WR-CP)に基づくアルゴリズム設計のための分離を利用して,有限サンプル誤差境界のワッサーシュタイン境界を低減する。
論文 参考訳(メタデータ) (2025-01-23T07:29:44Z) - Semiparametric conformal prediction [79.6147286161434]
ベクトル値の非整合性スコアの結合相関構造を考慮した共形予測セットを構築する。
スコアの累積分布関数(CDF)を柔軟に推定する。
提案手法は,現実の回帰問題に対して,所望のカバレッジと競争効率をもたらす。
論文 参考訳(メタデータ) (2024-11-04T14:29:02Z) - Uncertainty-Calibrated Test-Time Model Adaptation without Forgetting [65.21599711087538]
テスト時間適応(TTA)は、与えられたモデルw.r.t.を任意のテストサンプルに適用することにより、トレーニングデータとテストデータの間の潜在的な分散シフトに取り組むことを目指している。
事前の手法は各テストサンプルに対してバックプロパゲーションを実行するため、多くのアプリケーションに対して許容できない最適化コストがかかる。
本稿では, 有効サンプル選択基準を策定し, 信頼性および非冗長なサンプルを同定する, 効率的なアンチフォッティングテスト時間適応法を提案する。
論文 参考訳(メタデータ) (2024-03-18T05:49:45Z) - Equal Opportunity of Coverage in Fair Regression [50.76908018786335]
我々は、予測の不確実性の下で公正な機械学習(ML)を研究し、信頼性と信頼性のある意思決定を可能にする。
本研究は,(1)類似した結果の異なる集団に対するカバー率が近いこと,(2)人口全体のカバー率が一定水準にあること,の2つの特性を達成することを目的としたカバーの平等機会(EOC)を提案する。
論文 参考訳(メタデータ) (2023-11-03T21:19:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。