論文の概要: T-DuMpRa: Teacher-guided Dual-path Multi-prototype Retrieval Augmented framework for fine-grained medical image classification
- arxiv url: http://arxiv.org/abs/2604.17360v1
- Date: Sun, 19 Apr 2026 10:13:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.487044
- Title: T-DuMpRa: Teacher-guided Dual-path Multi-prototype Retrieval Augmented framework for fine-grained medical image classification
- Title(参考訳): T-DuMpRa:きめ細かな医用画像分類のための教師誘導デュアルパス多目的検索フレームワーク
- Authors: Zixuan Tang, Shen Zhao,
- Abstract要約: T-DuMpRaは教師向けデュアルパスマルチプロトタイプ検索拡張フレームワークである。
本稿では,T-DuMpRaを提案する。
本法では5種類の背骨に対して0.68%-0.21%,0.44%-2.69%の改善が得られた。
- 参考スコア(独自算出の注目度): 9.53765398422759
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Fine-grained medical image classification is challenged by subtle inter-class variations and visually ambiguous cases, where confidence estimates often exhibit uncertainty rather than being overconfident. In such scenarios, purely discriminative classifiers may achieve high overall accuracy yet still fail to distinguish between highly similar categories, leading to miscalibrated predictions. We propose T-DuMpRa, a teacher-guided dual-path multi-prototype retrieval-augmented framework, where discriminative classification and multi-prototype retrieval jointly drive both training and prediction. During training, we jointly optimize cross-entropy and supervised contrastive objectives to learn a cosine-compatible embedding geometry for reliable prototype matching. We further employ an exponential moving average (EMA) teacher to obtain smoother representations and build a multi-prototype memory bank by clustering teacher embeddings in the teacher embedding space. Our framework is plug-and-play: it can be easily integrated into existing classification models by constructing a compact prototype bank, thereby improving performance on visually ambiguous cases. At inference, we combine the classifier's predicted distribution with a similarity-based distribution computed via cosine matching to prototypes, and apply a conservative confidence-gated fusion that activates retrieval only when the classifier's prediction is uncertain and the retrieval evidence is decisive and conflicting, otherwise keeping confident predictions unchanged. On HAM10000 and ISIC2019, our method yields 0.68%-0.21% and 0.44%-2.69% improvements on 5 different backbones. And visualization analysis proves our model can enhance the model's ability to handle visually ambiguous cases.
- Abstract(参考訳): 微細な医用画像分類は、微妙なクラス間変異と視覚的不明瞭なケースによって挑戦され、信頼度推定は過度に信頼されるよりも不確実性を示すことが多い。
このようなシナリオでは、純粋に識別的分類器は高い全体的な精度を達成できるが、非常に類似したカテゴリの区別に失敗し、誤った予測をもたらす。
T-DuMpRa,T-DuMpRa,T-DuMpRa,T-DuMpRa,T-DuMpRa,T-DuMpRa,T-DuMpRa,T-DuMpRa,T-DuMpRa。
トレーニング中、我々はクロスエントロピーと教師付きコントラスト目標を共同で最適化し、信頼できるプロトタイプマッチングのためのコサイン互換な埋め込み幾何学を学習する。
さらに、指数移動平均(EMA)教師を用いて、スムーズな表現を得るとともに、教師埋め込み空間に教師埋め込みをクラスタリングすることで、マルチプロトタイプメモリバンクを構築する。
我々のフレームワークはプラグアンドプレイであり、コンパクトなプロトタイプバンクを構築することで既存の分類モデルに容易に統合することができ、視覚的にあいまいなケースの性能を向上させることができる。
推定では,分類器の予測分布と,原型と一致するコサインを用いて計算した類似性に基づく分布とを組み合わせ,分類器の予測が不確実であり,検証証拠が決定的かつ矛盾している場合にのみ,検索を活性化する保守的信頼制御融合を適用する。
HAM10000とISIC2019では、5つの異なるバックボーンに対して0.68%-0.21%と0.44%-2.69%の改善が得られた。
そして、可視化分析により、我々のモデルは、視覚的に曖昧なケースを扱うモデルの能力を高めることができることを示す。
関連論文リスト
- Efficient Credal Prediction through Decalibration [27.17944683306638]
本稿では, 相対的可能性の概念を基礎として, 断裂予測を効率的に行う方法を提案する。
提案手法は, 多様なタスクにまたがって, 高い性能でクレーダル集合を生成することを示す。
特に,TabPFNやCLIPなどのモデルに対して,致命的な予測を示す。
論文 参考訳(メタデータ) (2026-03-09T15:30:10Z) - Multi-Classification using One-versus-One Deep Learning Strategy with
Joint Probability Estimates [0.0]
提案モデルは他の最先端モデルよりも一般的に高い分類精度が得られる。
異なる応用における数値実験により,提案モデルが他の最先端モデルよりも一般的に高い分類精度を達成できることが示されている。
論文 参考訳(メタデータ) (2023-06-16T07:54:15Z) - Birds of a Feather Trust Together: Knowing When to Trust a Classifier
via Adaptive Neighborhood Aggregation [30.34223543030105]
我々は、NeighborAggがアダプティブ近隣アグリゲーションを介して2つの重要な情報を利用する方法を示す。
また, 誤り検出の密接な関連課題へのアプローチを拡張し, 偽陰性境界に対する理論的カバレッジを保証する。
論文 参考訳(メタデータ) (2022-11-29T18:43:15Z) - Parametric Classification for Generalized Category Discovery: A Baseline
Study [70.73212959385387]
Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。
パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。
エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文 参考訳(メタデータ) (2022-11-21T18:47:11Z) - Trusted Multi-View Classification with Dynamic Evidential Fusion [73.35990456162745]
信頼型マルチビュー分類(TMC)と呼ばれる新しいマルチビュー分類アルゴリズムを提案する。
TMCは、様々な視点をエビデンスレベルで動的に統合することで、マルチビュー学習のための新しいパラダイムを提供する。
理論的および実験的結果は、精度、堅牢性、信頼性において提案されたモデルの有効性を検証した。
論文 参考訳(メタデータ) (2022-04-25T03:48:49Z) - Contrastive Learning for Fair Representations [50.95604482330149]
訓練された分類モデルは、意図せずバイアスのある表現や予測につながる可能性がある。
対戦訓練のような既存の分類モデルのデバイアス化手法は、訓練に高価であり、最適化が困難であることが多い。
比較学習を取り入れたバイアス軽減手法を提案し、同じクラスラベルを共有するインスタンスに類似した表現を推奨する。
論文 参考訳(メタデータ) (2021-09-22T10:47:51Z) - Trusted Multi-View Classification [76.73585034192894]
本稿では,信頼された多視点分類と呼ばれる新しい多視点分類手法を提案する。
さまざまなビューをエビデンスレベルで動的に統合することで、マルチビュー学習のための新しいパラダイムを提供する。
提案アルゴリズムは,分類信頼性とロバスト性の両方を促進するために,複数のビューを併用する。
論文 参考訳(メタデータ) (2021-02-03T13:30:26Z) - Learning and Evaluating Representations for Deep One-class
Classification [59.095144932794646]
ディープワンクラス分類のための2段階フレームワークを提案する。
まず,一級データから自己教師付き表現を学習し,学習した表現に基づいて一級分類器を構築する。
実験では、視覚領域の1クラス分類ベンチマークで最先端の性能を示す。
論文 参考訳(メタデータ) (2020-11-04T23:33:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。