Fugu-MT 論文翻訳(概要): Similarity-as-Evidence: Calibrating Overconfident VLMs for Interpretable and Label-Efficient Medical Active Learning

論文の概要: Similarity-as-Evidence: Calibrating Overconfident VLMs for Interpretable and Label-Efficient Medical Active Learning

arxiv url: http://arxiv.org/abs/2602.18867v1
Date: Sat, 21 Feb 2026 15:21:54 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-24 17:42:02.366108
Title: Similarity-as-Evidence: Calibrating Overconfident VLMs for Interpretable and Label-Efficient Medical Active Learning
Title（参考訳）: 類似性・証拠:医療能動学習における過信VLMの校正
Authors: Zhuofan Xie, Zishan Lin, Jinliang Lin, Jie Qi, Shaohua Hong, Shuo Li,
Abstract要約: 類似性証拠(SaE)は、類似性証拠ヘッド(SEH)を導入してテキスト画像の類似性を校正する SaEは、最先端のマクロ平均精度を、20%のラベル予算で、医療画像データセット上で82.57%の精度で達成している。
参考スコア（独自算出の注目度）: 10.264467364282865
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Active Learning (AL) reduces annotation costs in medical imaging by selecting only the most informative samples for labeling, but suffers from cold-start when labeled data are scarce. Vision-Language Models (VLMs) address the cold-start problem via zero-shot predictions, yet their temperature-scaled softmax outputs treat text-image similarities as deterministic scores while ignoring inherent uncertainty, leading to overconfidence. This overconfidence misleads sample selection, wasting annotation budgets on uninformative cases. To overcome these limitations, the Similarity-as-Evidence (SaE) framework calibrates text-image similarities by introducing a Similarity Evidence Head (SEH), which reinterprets the similarity vector as evidence and parameterizes a Dirichlet distribution over labels. In contrast to a standard softmax that enforces confident predictions even under weak signals, the Dirichlet formulation explicitly quantifies lack of evidence (vacuity) and conflicting evidence (dissonance), thereby mitigating overconfidence caused by rigid softmax normalization. Building on this, SaE employs a dual-factor acquisition strategy: high-vacuity samples (e.g., rare diseases) are prioritized in early rounds to ensure coverage, while high-dissonance samples (e.g., ambiguous diagnoses) are prioritized later to refine boundaries, providing clinically interpretable selection rationales. Experiments on ten public medical imaging datasets with a 20% label budget show that SaE attains state-of-the-art macro-averaged accuracy of 82.57%. On the representative BTMRI dataset, SaE also achieves superior calibration, with a negative log-likelihood (NLL) of 0.425.
Abstract（参考訳）: アクティブラーニング(AL)は、ラベル付けのための最も情報性の高いサンプルのみを選択することで、医用画像のアノテーションコストを削減するが、ラベル付きデータが不足すると、コールドスタートに悩まされる。 VLM(Vision-Language Models)はゼロショット予測によるコールドスタート問題に対処するが、その温度スケールのソフトマックス出力は、テキストイメージの類似性を決定論的スコアとして扱い、固有の不確実性を無視し、自信過剰につながる。この過信はサンプルの選択を誤解させ、非形式的ケースのアノテーション予算を浪費する。これらの制限を克服するために、Simisity-as-Evidence (SaE)フレームワークは、Simisity Evidence Head (SEH)を導入してテキスト-画像類似性を校正し、類似性ベクトルをエビデンスとして再解釈し、ラベル上のディリクレ分布をパラメータ化する。弱い信号の下でも確実な予測を強制する標準ソフトマックスとは対照的に、ディリクレの定式化は、証拠の欠如(空白)と矛盾する証拠(不協和)を明確に定量化し、したがって堅固なソフトマックス正規化による過信を緩和する。高空洞検体(例:レアな疾患)を早期ラウンドで優先し、高不協和性検体(例:曖昧な診断)を後日境界を洗練させ、臨床的に解釈可能な選択論理を提供する。 20%の予算で10の公開医療画像データセットの実験により、SaEは最先端のマクロ平均精度が82.57%に達した。代表的なBTMRIデータセットでは、SaEはより優れたキャリブレーションを達成しており、負の対数類似度(NLL)は0.425である。

関連論文リスト

From Calibration to Refinement: Seeking Certainty via Probabilistic Evidence Propagation for Noisy-Label Person Re-Identification [40.73759251488672]
既存のノイズロスのある人物Re-ID法は、ソフトマックス出力を用いた損失補正やサンプル選択方式に依存している。本稿では,キャリブレーションからリファインメントへ伝播する確率的証拠を通じて確実性を求める2段階フレームワークであるCARE法を提案する。精製段階では, クリーン試料とノイズ試料をより正確に識別できるエビデンス伝搬精製法(EPR)を設計する。
論文参考訳（メタデータ） (2026-02-26T15:50:15Z)
LATA: Laplacian-Assisted Transductive Adaptation for Conformal Uncertainty in Medical VLMs [61.06744611795341]
医用視覚言語モデル(VLM)は医用画像の強力なゼロショット認識器である。本研究では,ラプラシアン支援トランスダクティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ(texttttextbfLATA,ラプラシアン支援トランスダクティブ・アダプティブ・アダプティブ・アダプティブ)を提案する。 texttttextbfLATAは交換性を損なうことなくゼロショット予測をシャープにする。
論文参考訳（メタデータ） (2026-02-19T16:45:38Z)
X-Mark: Saliency-Guided Robust Dataset Ownership Verification for Medical Imaging [67.85884025186755]
高品質な医用画像データセットは深層学習モデルの訓練には不可欠であるが、その無許可の使用は重大な著作権と倫理的懸念を提起する。医用画像は、自然画像用に設計された既存のデータセットの所有権検証方法に固有の課題を示す。胸部X線著作権保護のためのサンプル特異的クリーンラベル透かし法であるX-Markを提案する。
論文参考訳（メタデータ） (2026-02-10T00:03:43Z)
Boundary-Aware Adversarial Filtering for Reliable Diagnosis under Extreme Class Imbalance [1.2948544197525087]
AF-SMOTEは、まず少数点を合成し、逆微分器と境界効用モデルによりフィルタする数学的動機付け強化フレームワークである。決定境界の滑らかさとクラス条件密度を軽度に仮定すると、フィルタリングステップはF_betaのサロゲートを単調に改善する。 MIMIC-IVプロキシラベル予測と標準不正検出ベンチマークでは、AF-SMOTEは強いオーバーサンプリングベースラインよりも高いリコールと平均精度を実現している。
論文参考訳（メタデータ） (2025-11-19T02:15:58Z)
Label Uncertainty for Ultrasound Segmentation [25.682215047694168]
医用画像では、放射線医の間でのサーバ間変動は、しばしばラベルの不確実性をもたらす。我々は、専門家が供給する画素ごとの信頼度値を用いて、AIモデルのラベル付けとトレーニングの両方に新しいアプローチを導入する。
論文参考訳（メタデータ） (2025-08-21T15:00:21Z)
SURE-Med: Systematic Uncertainty Reduction for Enhanced Reliability in Medical Report Generation [2.2185034594788164]
視覚, 分布, 文脈の3つの重要な次元における不確実性を体系的に低減する統合フレームワークSURE-Medを提案する。視覚的不確実性を軽減するため、Frontal-Aware View Resamplingモジュールはビューアノテーションエラーを修正し、補足ビューから情報的特徴を適応的に選択する。ラベル分布の不確実性に対処するために,批判的診断文のモデリングを促進させるToken Sensitive Learningの目標を提案する。文脈不確実性を低減するため、文脈証拠フィルタは、現在の画像と整合する事前情報を検証し、選択的に組み込んで、幻覚を効果的に抑制する。
論文参考訳（メタデータ） (2025-08-03T09:52:30Z)
Conservative Prediction via Data-Driven Confidence Minimization [70.93946578046003]
機械学習の安全性クリティカルな応用においては、モデルが保守的であることが望ましいことが多い。本研究では,不確実性データセットに対する信頼性を最小化するデータ駆動信頼性最小化フレームワークを提案する。
論文参考訳（メタデータ） (2023-06-08T07:05:36Z)
Towards Reliable Medical Image Segmentation by Modeling Evidential Calibrated Uncertainty [57.023423137202485]
医用画像のセグメンテーションの信頼性に関する懸念が臨床医の間で続いている。本稿では,医療画像セグメンテーションネットワークにシームレスに統合可能な,実装が容易な基礎モデルであるDEviSを紹介する。主観的論理理論を活用することで、医用画像分割の確率と不確実性を明示的にモデル化する。
論文参考訳（メタデータ） (2023-01-01T05:02:46Z)
Improving group robustness under noisy labels using predictive uncertainty [0.9449650062296823]
ノイズラベル下での最悪のグループ精度を改善するために,モデルの予測不確実性を利用する。本稿では,モデルがノイズラベルに頑健でありながら,刺激的な手がかりを学習するのを防ぐ,新しいEntropy based Debiasing(END)フレームワークを提案する。
論文参考訳（メタデータ） (2022-12-14T04:40:50Z)
Taming Overconfident Prediction on Unlabeled Data from Hindsight [50.9088560433925]
ラベルのないデータに対する予測の不確実性を最小化することは、半教師付き学習において優れた性能を達成するための鍵となる要素である。本稿では,アダプティブシャーニング(Adaptive Sharpening, ADS)と呼ばれる2つのメカニズムを提案する。 ADSは、プラグインにすることで最先端のSSLメソッドを大幅に改善する。
論文参考訳（メタデータ） (2021-12-15T15:17:02Z)
Weakly-Supervised Cross-Domain Adaptation for Endoscopic Lesions Segmentation [79.58311369297635]
異なるデータセットにまたがるトランスファー可能なドメイン不変知識を探索できる,新しい弱い教師付き病巣移動フレームワークを提案する。 wasserstein quantified transferability frameworkは、広い範囲の転送可能なコンテキスト依存性を強調するために開発されている。新規な自己監督型擬似ラベル生成器は、送信困難かつ転送容易なターゲットサンプルの両方に対して、確実な擬似ピクセルラベルを等しく提供するように設計されている。
論文参考訳（メタデータ） (2020-12-08T02:26:03Z)
Semi-supervised Medical Image Classification with Relation-driven Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文参考訳（メタデータ） (2020-05-15T06:57:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。