論文の概要: Hierarchical Vision-Language Learning for Medical Out-of-Distribution Detection
- arxiv url: http://arxiv.org/abs/2508.17667v1
- Date: Mon, 25 Aug 2025 04:55:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-26 18:43:45.638216
- Title: Hierarchical Vision-Language Learning for Medical Out-of-Distribution Detection
- Title(参考訳): 医用アウト・オブ・ディストリビューション検出のための階層型ビジョンランゲージ学習
- Authors: Runhe Lai, Xinhua Lu, Kanghao Chen, Qichao Chen, Wei-Shi Zheng, Ruixuan Wang,
- Abstract要約: 視覚言語モデル(VLM)に基づく新しいOOD検出フレームワークを提案する。
複数スケールからの視覚的埋め込みを両立させるために, クロススケールなビジュアルフュージョン戦略を提案する。
OOD検出を最大化するために, クロススケールな擬似ODサンプル生成戦略を提案する。
- 参考スコア(独自算出の注目度): 42.73509543934366
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In trustworthy medical diagnosis systems, integrating out-of-distribution (OOD) detection aims to identify unknown diseases in samples, thereby mitigating the risk of misdiagnosis. In this study, we propose a novel OOD detection framework based on vision-language models (VLMs), which integrates hierarchical visual information to cope with challenging unknown diseases that resemble known diseases. Specifically, a cross-scale visual fusion strategy is proposed to couple visual embeddings from multiple scales. This enriches the detailed representation of medical images and thus improves the discrimination of unknown diseases. Moreover, a cross-scale hard pseudo-OOD sample generation strategy is proposed to benefit OOD detection maximally. Experimental evaluations on three public medical datasets support that the proposed framework achieves superior OOD detection performance compared to existing methods. The source code is available at https://openi.pcl.ac.cn/OpenMedIA/HVL.
- Abstract(参考訳): 信頼できる医療診断システムにおいて、アウト・オブ・ディストリビューション(OOD)検出の統合は、サンプル中の未知の疾患を特定し、誤診のリスクを軽減することを目的としている。
本研究では,視覚言語モデル(VLM)に基づく新しいOOD検出フレームワークを提案する。
具体的には、複数のスケールから視覚的埋め込みを分離するために、クロススケールなビジュアルフュージョン戦略を提案する。
これにより、医用画像の詳細な表現が強化され、未知の疾患の識別が向上する。
さらに,OOD検出を最大化するために,クロススケールな擬似ODサンプル生成戦略を提案する。
提案手法が既存の方法よりも優れたOOD検出性能を実現することを支援する3つの公開医療データセットの実験評価を行った。
ソースコードはhttps://openi.pcl.ac.cn/OpenMedIA/HVLで入手できる。
関連論文リスト
- NERO: Explainable Out-of-Distribution Detection with Neuron-level Relevance [13.36825494924134]
機能層におけるニューロンレベルの関連性を利用した新しいOODスコアリング機構NEROを提案する。
具体的には、各分布内(ID)クラスに対するニューロンレベルの関連性をクラスタリングし、代表的なセントロイドを形成する。
バイアス項にスケールした関連性を取り入れ、特徴ノルムを組み合わせることで性能を向上する。
論文 参考訳(メタデータ) (2025-06-18T12:22:17Z) - Unsupervised Out-of-Distribution Detection in Medical Imaging Using Multi-Exit Class Activation Maps and Feature Masking [15.899277292315995]
医用画像における深層学習モデルの信頼性確保には,アウト・オブ・ディストリビューション(OOD)検出が不可欠である。
この研究は、クラスアクティベーションマップ(CAM)が、通常、モデルの予測に非常に関係のある領域を強調しているという観察に動機づけられている。
マルチエクイットCAMと特徴マスキングを活用した,新しい教師なしOOD検出フレームワークであるMulti-Exit Class Activation Map (MECAM)を導入する。
論文 参考訳(メタデータ) (2025-05-13T14:18:58Z) - Delving into Out-of-Distribution Detection with Medical Vision-Language Models [14.286027727962104]
医用視覚言語モデルのOOD検出能に関する最初の系統的研究を行った。
実世界の課題を正確に反映するために,フルスペクトルOOD検出のためのクロスモーダル評価ベンチマークパイプラインを導入する。
OOD検出性能を大幅に向上させる新しい階層的プロンプトベース手法を提案する。
論文 参考訳(メタデータ) (2025-03-02T21:09:51Z) - Optimizing Skin Lesion Classification via Multimodal Data and Auxiliary
Task Integration [54.76511683427566]
本研究は, スマートフォンで撮影した画像と本質的な臨床および人口統計情報を統合することで, 皮膚病変を分類する新しいマルチモーダル手法を提案する。
この手法の特徴は、超高解像度画像予測に焦点を当てた補助的なタスクの統合である。
PAD-UFES20データセットを用いて,様々なディープラーニングアーキテクチャを用いて実験を行った。
論文 参考訳(メタデータ) (2024-02-16T05:16:20Z) - Exploring Large Language Models for Multi-Modal Out-of-Distribution
Detection [67.68030805755679]
大きな言語モデル(LLM)は豊富な世界の知識をエンコードし、クラスごとに記述的な特徴を生成するよう促すことができる。
本稿では,LLMの選択的生成によるOOD検出性能向上のための世界知識の適用を提案する。
論文 参考訳(メタデータ) (2023-10-12T04:14:28Z) - DIAGNOSE: Avoiding Out-of-distribution Data using Submodular Information
Measures [13.492292022589918]
類似性と相似性を共同でモデル化できる,新しいアクティブラーニングフレームワークであるDiagnoseを提案する。
本実験は, 医用画像の複数の領域にまたがる最先端AL法に対する診断の優位性を検証するものである。
論文 参考訳(メタデータ) (2022-10-04T11:07:48Z) - Confidence-based Out-of-Distribution Detection: A Comparative Study and
Analysis [17.398553230843717]
我々は、信頼度に基づくOOD検出のための様々な最先端手法の能力を評価する。
まず,コンピュータビジョンベンチマークを用いて複数のOOD検出手法を再現・比較する。
次に,胸部X線を用いた疾患分類の課題に対して,その能力を評価する。
論文 参考訳(メタデータ) (2021-07-06T12:10:09Z) - Malignancy Prediction and Lesion Identification from Clinical
Dermatological Images [65.1629311281062]
臨床皮膚画像から機械学習に基づく悪性度予測と病変の同定を検討する。
まず, サブタイプや悪性度に関わらず画像に存在するすべての病変を同定し, その悪性度を推定し, 凝集により, 画像レベルの悪性度も生成する。
論文 参考訳(メタデータ) (2021-04-02T20:52:05Z) - Variational Knowledge Distillation for Disease Classification in Chest
X-Rays [102.04931207504173]
我々は,X線に基づく疾患分類のための新しい確率的推論フレームワークである反復的知識蒸留(VKD)を提案する。
提案手法の有効性を,X線画像とEHRを用いた3つの公開ベンチマークデータセットに示す。
論文 参考訳(メタデータ) (2021-03-19T14:13:56Z) - An Interpretable Multiple-Instance Approach for the Detection of
referable Diabetic Retinopathy from Fundus Images [72.94446225783697]
基礎画像における参照糖尿病網膜症検出のための機械学習システムを提案する。
画像パッチから局所情報を抽出し,アテンション機構により効率的に組み合わせることで,高い分類精度を実現することができる。
我々は,現在入手可能な網膜画像データセットに対するアプローチを評価し,最先端の性能を示す。
論文 参考訳(メタデータ) (2021-03-02T13:14:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。