論文の概要: Knowing When Not to Predict: Self Supervised Learning and Abstention for Safer DR Screening
- arxiv url: http://arxiv.org/abs/2605.19133v1
- Date: Mon, 18 May 2026 21:32:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:08.999638
- Title: Knowing When Not to Predict: Self Supervised Learning and Abstention for Safer DR Screening
- Title(参考訳): 予測すべきでないことを知る: 自己指導型学習とサファーDRスクリーニングの欠如
- Authors: Muskaan Chopra, Lorenz Sparrenberg, Jan H. Terheyden, Rafet Sifa,
- Abstract要約: 自己教師付き学習(SSL)は、現在、医療画像モデルを事前訓練する標準的な方法である。
我々は,SSL事前トレーニングの長さが,信頼性と信頼性に基づく棄権の校正にどのように影響するかを検討する。
- 参考スコア(独自算出の注目度): 1.3288901827225499
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Self-supervised learning (SSL) is now a standard way to pretrain medical image models, but performance is still mostly judged by downstream accuracy. For safety-critical screening tasks such as diabetic retinopathy grading, this is not enough: a model must also know when its predictions are unreliable and defer uncertain cases for clinical review. In this work, we examine how the length of SSL pretraining influences calibrated confidence and confidence-based abstention. We evaluate multiple SSL checkpoints under a fixed fine-tuning protocol and assess calibrated confidence, coverage, selective accuracy, and selective macro-F1. Across datasets and data regimes, SSL pretraining improves selective prediction compared to training from scratch. Unlike prior SSL studies that primarily evaluate downstream accuracy or AUROC, we analyze how SSL pretraining duration influences confidence behavior under calibrated confidence-based abstention. However, once accuracy saturates, selective performance can still change markedly across checkpoints, and longer pretraining does not consistently improve reliability. These results underscore the importance of abstention-aware evaluation and suggest that pretraining length should be treated as an important reliability-related design choice rather than only a computational detail. Code is available at GitHub.
- Abstract(参考訳): 自己教師付き学習(SSL)は現在、医療画像モデルを事前訓練する標準的な方法であるが、パフォーマンスは依然として下流の精度で判断されている。
糖尿病性網膜症のグレーディングのような安全クリティカルなスクリーニングタスクでは、これは十分ではない: モデルは、その予測が信頼できないことを認識し、臨床検査の不確実なケースを遅らせる必要がある。
本研究では,SSL事前トレーニングの長さが信頼度と信頼度に基づく棄権にどのように影響するかを検討する。
固定された微調整プロトコルの下で複数のSSLチェックポイントを評価し、キャリブレーションされた信頼度、カバレッジ、選択精度、選択マクロF1を評価する。
データセットとデータ構造全体で、SSL事前トレーニングは、スクラッチからのトレーニングよりも選択的な予測を改善する。
下流の精度やAUROCを主に評価する以前のSSL研究とは異なり、SSL事前学習期間が信頼度に基づく禁忌条件下での信頼行動にどのように影響するかを分析する。
しかし、精度が飽和すると、チェックポイント間で選択的なパフォーマンスが著しく変化し、事前トレーニングが長くても信頼性は向上しない。
これらの結果は, 留意点を考慮した評価の重要性を裏付けるものであり, 事前学習長は, 計算の詳細だけでなく, 重要な信頼性に関する設計選択として扱うべきであることを示唆している。
コードはGitHubで入手できる。
関連論文リスト
- The Illusion of Certainty: Decoupling Capability and Calibration in On-Policy Distillation [67.26315138466312]
モデルロールアウトから経験的信頼性を推定するキャリブレーション対応のOPDフレームワークであるCaOPDを提案する。
本研究は, 能力蒸留が信頼性を示唆するものではないこと, 信頼性をポストトレーニングの本質的な目的として扱うべきであることを明らかにする。
論文 参考訳(メタデータ) (2026-04-18T04:43:40Z) - Temperature Scaling Attack Disrupting Model Confidence in Federated Learning [4.863985119779627]
精度を保ちながらキャリブレーションを低下させる訓練時間攻撃である温度スケーリング攻撃(TSA)を提案する。
その結果, 校正整合性は, 連合学習における重要な攻撃面として確立された。
論文 参考訳(メタデータ) (2026-02-06T12:01:54Z) - Stable Prediction of Adverse Events in Medical Time-Series Data [18.92202613147342]
早期事象予測(EEP)システムは、臨床意思決定を支援するための患者の差し迫ったリスクを継続的に見積もる。
本稿では,マルチモーダル入力EHR,ECG波形,臨床テキストを用いたEEPベンチマークであるCAREBenchを紹介する。
本稿では,患者ごとの短期変動を定量化し,局所リプシッツ定数に基づいて急激な振動をペナリゼーションする安定性指標を提案する。
論文 参考訳(メタデータ) (2025-10-16T04:16:54Z) - Pretraining with random noise for uncertainty calibration [0.0]
多くのモデルは、誤った信頼のために幻覚(自信があるが不正確な反応)を示す。
発達神経科学にインスパイアされた本手法は,ランダムなノイズとラベルでネットワークを事前学習することでこの問題に対処する。
論文 参考訳(メタデータ) (2024-12-23T09:22:00Z) - Provably Reliable Conformal Prediction Sets in the Presence of Data Poisoning [53.42244686183879]
コンフォーマル予測は、モデルに依存しない、分布のない不確実性定量化を提供する。
しかし、敵が訓練データと校正データを操作した場合の毒殺攻撃では、共形予測は信頼性が低い。
信頼性予測セット (RPS): 汚染下での信頼性保証を証明可能な共形予測セットを構築するための最初の効率的な方法を提案する。
論文 参考訳(メタデータ) (2024-10-13T15:37:11Z) - Selective Learning: Towards Robust Calibration with Dynamic Regularization [79.92633587914659]
ディープラーニングにおけるミススキャリブレーションとは、予測された信頼とパフォーマンスの間には相違がある、という意味である。
トレーニング中に何を学ぶべきかを学ぶことを目的とした動的正規化(DReg)を導入し、信頼度調整のトレードオフを回避する。
論文 参考訳(メタデータ) (2024-02-13T11:25:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。