論文の概要: When Calibration Fails the Vulnerable Hospital: Federated Conformal Risk Control via Risk-Curve Shrinkage
- arxiv url: http://arxiv.org/abs/2606.20115v2
- Date: Fri, 19 Jun 2026 16:03:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-23 13:41:31.033026
- Title: When Calibration Fails the Vulnerable Hospital: Federated Conformal Risk Control via Risk-Curve Shrinkage
- Title(参考訳): 重篤な病院の校正が失敗した場合--リスク・サーブ・収縮による共生型リスクコントロール
- Authors: Nafis Fuad Shahid,
- Abstract要約: コンフォーマルリスク制御(CRC)は、セグメンテーション品質の分布自由保証を提供する。
フェデレートされたデプロイメントでは、標準的なアプローチは、サイト間でキャリブレーションスコアを単一のしきい値にプールする。
この単純プール型CRCは平均的な病院を保護しているが、個々の施設の40%はカバー範囲に違反している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Conformal risk control (CRC) provides distribution-free guarantees on segmentation quality by calibrating a prediction-set threshold on held-out data. In federated deployments, the standard approach pools calibration scores across sites into a single threshold. We provide the first quantification, on real multi-institutional brain tumor data (FeTS-2022, 1,251 subjects, 20 institutions), showing that this naive pooled CRC protects the average hospital but violates coverage at 40% of individual institutions, with the worst site exceeding the target false-negative rate by 7.8 percentage points. The naive alternative, per-site local CRC, largely restores coverage but inflates prediction sets by 83x, rendering them clinically useless. We propose a shrinkage-based federated CRC protocol: each site transmits only its empirical risk curve (G scalars) to a server, which computes a shrinkage-regularized threshold per site. A single hyperparameter n0 smoothly trades worst-case coverage for prediction-set efficiency; leave-one-site-out sensitivity analysis identifies n0=19, achieving 2.7/20 violations at 2.0x stretch. We further show that direct Lagrangian optimization of coverage budgets fails, concentrating risk on vulnerable hospitals, and that the finite-sample correction term is essential: removing it triples violations. The marginal CRC guarantee is preserved by construction under the stated site-mixture assumption; per-site coverage is validated across four targets with three seeds. No patient-level images, masks, or per-volume scores leave any site.
- Abstract(参考訳): コンフォーマルリスク制御(CRC)は、保持データ上の予測セット閾値を校正することにより、セグメンテーション品質の分布自由保証を提供する。
フェデレートされたデプロイメントでは、標準的なアプローチは、サイト間でキャリブレーションスコアを単一のしきい値にプールする。
本研究は, 実際の多施設脳腫瘍データ(FeTS-2022, 1,251人, 20施設)を用いて, 平均病院を保護しているが, 個々の施設の40%でカバー範囲に反することを示す。
単純で局所的なCRCは、主にカバー範囲を回復するが、予測セットを83倍に膨らませ、臨床的に役に立たない。
各サイトは、その経験的リスク曲線(Gスカラー)のみをサーバに送信し、サイトごとの収縮規則化しきい値を算出する。
1つのハイパーパラメータn0は、予測セット効率で最悪のケースカバレッジを円滑に交換し、Leath-one-site-out sensitivity analysisはn0=19を識別し、2.0xストレッチで2.7/20違反を達成している。
さらに、ラグランジアンによるカバー予算の直接最適化が失敗し、脆弱な病院のリスクが集中し、有限サンプル補正期間が不可欠であることを示す。
限界CRC保証は、記載されたサイト混合仮定の下で構築によって保存され、サイトごとのカバレッジは4つのターゲットで3つのシードで検証される。
患者レベルの画像やマスクや1巻あたりのスコアは一切残っていない。
関連論文リスト
- CARE: A Conformal Safety Layer for Medical Summarization [24.00849890172944]
大きな言語モデル(LLM)は、医学的な要約にますます使われている。
既存のエラー検出手法ではスコアが生成または未校正され、エラーを正しく制御することができない。
リスク評価のためのコンフォーマルアセスメント(CARE, Conformal Assessment for Risk Evaluation)を導入する。
論文 参考訳(メタデータ) (2026-06-08T03:10:45Z) - Calibration, Uncertainty Communication, and Deployment Readiness in CKD Risk Prediction: A Framework Evaluation Study [0.0]
慢性腎臓病の機械学習モデルは、しばしば内部テストセットに強い差別的スコアを与える。
UCI CKDデータセット(400例,62.5%)を用いた5つの分類器の訓練を行った。
キャリブレーション品質,コンフォーマルな予測カバレッジ,8基準の展開準備フレームワークについて検討した。
論文 参考訳(メタデータ) (2026-05-20T17:12:48Z) - Conformal Prediction for Risk-Controlled Medical Entity Extraction Across Clinical Domains [2.744879848686032]
本稿では,医療機関抽出のための有限サンプルカバレッジ保証を提供するコンフォメーション予測フレームワークを提案する。
まず,FactScoreをベースとした原子式ステートメント評価により,GPT-4.1を用いて,FDAの医薬品ラベル1000個から構造化されたエンティティを抽出した。
第2に,GPT-4.1とLlama-4-Maverickを用いたRadGraphスキーマを用いてMIMIC-CXRレポートから放射線学的実体を抽出し,医師のアノテーションに対して評価した。
論文 参考訳(メタデータ) (2026-03-01T05:12:25Z) - LATA: Laplacian-Assisted Transductive Adaptation for Conformal Uncertainty in Medical VLMs [61.06744611795341]
医用視覚言語モデル(VLM)は医用画像の強力なゼロショット認識器である。
本研究では,ラプラシアン支援トランスダクティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ(texttttextbfLATA,ラプラシアン支援トランスダクティブ・アダプティブ・アダプティブ・アダプティブ)を提案する。
texttttextbfLATAは交換性を損なうことなくゼロショット予測をシャープにする。
論文 参考訳(メタデータ) (2026-02-19T16:45:38Z) - Conditional Coverage Diagnostics for Conformal Prediction [47.93989136542648]
条件付きカバレッジ推定が分類問題であることを示す。
得られたメトリクスの族をターゲットカバレッジ(ERT)の過剰なリスクと呼びます。
ERTのオープンソースパッケージと、以前の条件付きカバレッジメトリクスをリリースしています。
論文 参考訳(メタデータ) (2025-12-12T18:47:39Z) - Conformal Lesion Segmentation for 3D Medical Images [82.92159832699583]
本稿では,データ駆動しきい値の校正をコンフォーマル化することで,テスト時間FNRが目標許容値以下であることを保証する,リスク制約付きフレームワークを提案する。
5つのバックボーンモデルにまたがる6つの3D-LSデータセット上でのCLSの統計的健全性と予測性能を検証し,臨床実践におけるリスク認識セグメンテーションの展開に関する実用的な知見を得た。
論文 参考訳(メタデータ) (2025-10-19T08:21:00Z) - Towards Reliable Medical Image Segmentation by Modeling Evidential Calibrated Uncertainty [57.023423137202485]
医用画像のセグメンテーションの信頼性に関する懸念が臨床医の間で続いている。
本稿では,医療画像セグメンテーションネットワークにシームレスに統合可能な,実装が容易な基礎モデルであるDEviSを紹介する。
主観的論理理論を活用することで、医用画像分割の確率と不確実性を明示的にモデル化する。
論文 参考訳(メタデータ) (2023-01-01T05:02:46Z) - Privacy Preserving Recalibration under Domain Shift [119.21243107946555]
本稿では,差分プライバシー制約下での校正問題の性質を抽象化する枠組みを提案する。
また、新しいリカレーションアルゴリズム、精度温度スケーリングを設計し、プライベートデータセットの事前処理より優れています。
論文 参考訳(メタデータ) (2020-08-21T18:43:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。