論文の概要: Similarity-as-Evidence: Calibrating Overconfident VLMs for Interpretable and Label-Efficient Medical Active Learning
- arxiv url: http://arxiv.org/abs/2602.18867v1
- Date: Sat, 21 Feb 2026 15:21:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-24 17:42:02.366108
- Title: Similarity-as-Evidence: Calibrating Overconfident VLMs for Interpretable and Label-Efficient Medical Active Learning
- Title(参考訳): 類似性・証拠:医療能動学習における過信VLMの校正
- Authors: Zhuofan Xie, Zishan Lin, Jinliang Lin, Jie Qi, Shaohua Hong, Shuo Li,
- Abstract要約: 類似性証拠(SaE)は、類似性証拠ヘッド(SEH)を導入してテキスト画像の類似性を校正する
SaEは、最先端のマクロ平均精度を、20%のラベル予算で、医療画像データセット上で82.57%の精度で達成している。
- 参考スコア(独自算出の注目度): 10.264467364282865
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Active Learning (AL) reduces annotation costs in medical imaging by selecting only the most informative samples for labeling, but suffers from cold-start when labeled data are scarce. Vision-Language Models (VLMs) address the cold-start problem via zero-shot predictions, yet their temperature-scaled softmax outputs treat text-image similarities as deterministic scores while ignoring inherent uncertainty, leading to overconfidence. This overconfidence misleads sample selection, wasting annotation budgets on uninformative cases. To overcome these limitations, the Similarity-as-Evidence (SaE) framework calibrates text-image similarities by introducing a Similarity Evidence Head (SEH), which reinterprets the similarity vector as evidence and parameterizes a Dirichlet distribution over labels. In contrast to a standard softmax that enforces confident predictions even under weak signals, the Dirichlet formulation explicitly quantifies lack of evidence (vacuity) and conflicting evidence (dissonance), thereby mitigating overconfidence caused by rigid softmax normalization. Building on this, SaE employs a dual-factor acquisition strategy: high-vacuity samples (e.g., rare diseases) are prioritized in early rounds to ensure coverage, while high-dissonance samples (e.g., ambiguous diagnoses) are prioritized later to refine boundaries, providing clinically interpretable selection rationales. Experiments on ten public medical imaging datasets with a 20% label budget show that SaE attains state-of-the-art macro-averaged accuracy of 82.57%. On the representative BTMRI dataset, SaE also achieves superior calibration, with a negative log-likelihood (NLL) of 0.425.
- Abstract(参考訳): アクティブラーニング(AL)は、ラベル付けのための最も情報性の高いサンプルのみを選択することで、医用画像のアノテーションコストを削減するが、ラベル付きデータが不足すると、コールドスタートに悩まされる。
VLM(Vision-Language Models)はゼロショット予測によるコールドスタート問題に対処するが、その温度スケールのソフトマックス出力は、テキストイメージの類似性を決定論的スコアとして扱い、固有の不確実性を無視し、自信過剰につながる。
この過信はサンプルの選択を誤解させ、非形式的ケースのアノテーション予算を浪費する。
これらの制限を克服するために、Simisity-as-Evidence (SaE)フレームワークは、Simisity Evidence Head (SEH)を導入してテキスト-画像類似性を校正し、類似性ベクトルをエビデンスとして再解釈し、ラベル上のディリクレ分布をパラメータ化する。
弱い信号の下でも確実な予測を強制する標準ソフトマックスとは対照的に、ディリクレの定式化は、証拠の欠如(空白)と矛盾する証拠(不協和)を明確に定量化し、したがって堅固なソフトマックス正規化による過信を緩和する。
高空洞検体(例:レアな疾患)を早期ラウンドで優先し、高不協和性検体(例:曖昧な診断)を後日境界を洗練させ、臨床的に解釈可能な選択論理を提供する。
20%の予算で10の公開医療画像データセットの実験により、SaEは最先端のマクロ平均精度が82.57%に達した。
代表的なBTMRIデータセットでは、SaEはより優れたキャリブレーションを達成しており、負の対数類似度(NLL)は0.425である。
関連論文リスト
- LATA: Laplacian-Assisted Transductive Adaptation for Conformal Uncertainty in Medical VLMs [61.06744611795341]
医用視覚言語モデル(VLM)は医用画像の強力なゼロショット認識器である。
本研究では,ラプラシアン支援トランスダクティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ(texttttextbfLATA,ラプラシアン支援トランスダクティブ・アダプティブ・アダプティブ・アダプティブ)を提案する。
texttttextbfLATAは交換性を損なうことなくゼロショット予測をシャープにする。
論文 参考訳(メタデータ) (2026-02-19T16:45:38Z) - X-Mark: Saliency-Guided Robust Dataset Ownership Verification for Medical Imaging [67.85884025186755]
高品質な医用画像データセットは深層学習モデルの訓練には不可欠であるが、その無許可の使用は重大な著作権と倫理的懸念を提起する。
医用画像は、自然画像用に設計された既存のデータセットの所有権検証方法に固有の課題を示す。
胸部X線著作権保護のためのサンプル特異的クリーンラベル透かし法であるX-Markを提案する。
論文 参考訳(メタデータ) (2026-02-10T00:03:43Z) - Boundary-Aware Adversarial Filtering for Reliable Diagnosis under Extreme Class Imbalance [1.2948544197525087]
AF-SMOTEは、まず少数点を合成し、逆微分器と境界効用モデルによりフィルタする数学的動機付け強化フレームワークである。
決定境界の滑らかさとクラス条件密度を軽度に仮定すると、フィルタリングステップはF_betaのサロゲートを単調に改善する。
MIMIC-IVプロキシラベル予測と標準不正検出ベンチマークでは、AF-SMOTEは強いオーバーサンプリングベースラインよりも高いリコールと平均精度を実現している。
論文 参考訳(メタデータ) (2025-11-19T02:15:58Z) - Label Uncertainty for Ultrasound Segmentation [25.682215047694168]
医用画像では、放射線医の間でのサーバ間変動は、しばしばラベルの不確実性をもたらす。
我々は、専門家が供給する画素ごとの信頼度値を用いて、AIモデルのラベル付けとトレーニングの両方に新しいアプローチを導入する。
論文 参考訳(メタデータ) (2025-08-21T15:00:21Z) - SURE-Med: Systematic Uncertainty Reduction for Enhanced Reliability in Medical Report Generation [2.2185034594788164]
視覚, 分布, 文脈の3つの重要な次元における不確実性を体系的に低減する統合フレームワークSURE-Medを提案する。
視覚的不確実性を軽減するため、Frontal-Aware View Resamplingモジュールはビューアノテーションエラーを修正し、補足ビューから情報的特徴を適応的に選択する。
ラベル分布の不確実性に対処するために,批判的診断文のモデリングを促進させるToken Sensitive Learningの目標を提案する。
文脈不確実性を低減するため、文脈証拠フィルタは、現在の画像と整合する事前情報を検証し、選択的に組み込んで、幻覚を効果的に抑制する。
論文 参考訳(メタデータ) (2025-08-03T09:52:30Z) - Conservative Prediction via Data-Driven Confidence Minimization [70.93946578046003]
機械学習の安全性クリティカルな応用においては、モデルが保守的であることが望ましいことが多い。
本研究では,不確実性データセットに対する信頼性を最小化するデータ駆動信頼性最小化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-08T07:05:36Z) - Towards Reliable Medical Image Segmentation by Modeling Evidential Calibrated Uncertainty [57.023423137202485]
医用画像のセグメンテーションの信頼性に関する懸念が臨床医の間で続いている。
本稿では,医療画像セグメンテーションネットワークにシームレスに統合可能な,実装が容易な基礎モデルであるDEviSを紹介する。
主観的論理理論を活用することで、医用画像分割の確率と不確実性を明示的にモデル化する。
論文 参考訳(メタデータ) (2023-01-01T05:02:46Z) - Improving group robustness under noisy labels using predictive
uncertainty [0.9449650062296823]
ノイズラベル下での最悪のグループ精度を改善するために,モデルの予測不確実性を利用する。
本稿では,モデルがノイズラベルに頑健でありながら,刺激的な手がかりを学習するのを防ぐ,新しいEntropy based Debiasing(END)フレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-14T04:40:50Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。