論文の概要: UltraAD: Fine-Grained Ultrasound Anomaly Classification via Few-Shot CLIP Adaptation
- arxiv url: http://arxiv.org/abs/2506.19694v1
- Date: Tue, 24 Jun 2025 15:00:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-25 19:48:23.688834
- Title: UltraAD: Fine-Grained Ultrasound Anomaly Classification via Few-Shot CLIP Adaptation
- Title(参考訳): UltraAD:Few-Shot CLIP Adaptationによる微細超音波異常分類
- Authors: Yue Zhou, Yuan Bi, Wenjuan Tong, Wei Wang, Nassir Navab, Zhongliang Jiang,
- Abstract要約: 視覚言語モデル(VLM)に基づく,異常な局所化ときめ細かい分類のためのアプローチであるUltraADを提案する。
UltraADは乳房の3つのデータセットで広く評価されており、病変のデータセットと微細な医学的分類の両方において最先端の手法よりも優れている。
- 参考スコア(独自算出の注目度): 39.48115172323913
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Precise anomaly detection in medical images is critical for clinical decision-making. While recent unsupervised or semi-supervised anomaly detection methods trained on large-scale normal data show promising results, they lack fine-grained differentiation, such as benign vs. malignant tumors. Additionally, ultrasound (US) imaging is highly sensitive to devices and acquisition parameter variations, creating significant domain gaps in the resulting US images. To address these challenges, we propose UltraAD, a vision-language model (VLM)-based approach that leverages few-shot US examples for generalized anomaly localization and fine-grained classification. To enhance localization performance, the image-level token of query visual prototypes is first fused with learnable text embeddings. This image-informed prompt feature is then further integrated with patch-level tokens, refining local representations for improved accuracy. For fine-grained classification, a memory bank is constructed from few-shot image samples and corresponding text descriptions that capture anatomical and abnormality-specific features. During training, the stored text embeddings remain frozen, while image features are adapted to better align with medical data. UltraAD has been extensively evaluated on three breast US datasets, outperforming state-of-the-art methods in both lesion localization and fine-grained medical classification. The code will be released upon acceptance.
- Abstract(参考訳): 医療画像の高精度な異常検出は臨床的意思決定に不可欠である。
大規模な正常なデータに基づいて訓練された非教師なしまたは半教師付き異常検出法は有望な結果を示すが、良性腫瘍と悪性腫瘍などの微細な分化は欠如している。
さらに、超音波(US)イメージングはデバイスに非常に敏感で、取得パラメータのばらつきがあり、その結果のUS画像に大きな領域ギャップが生じる。
これらの課題に対処するために、一般化された異常な局所化ときめ細かい分類のために、数ショットのUS例を活用する視覚言語モデル(VLM)ベースのアプローチであるUltraADを提案する。
ローカライズ性能を高めるために、クエリビジュアルプロトタイプの画像レベルトークンは、まず学習可能なテキスト埋め込みと融合する。
この画像インフォームドプロンプト機能はパッチレベルのトークンとさらに統合され、ローカル表現を精細化して精度を向上させる。
微粒な分類のために、メモリバンクは、小ショットの画像サンプルと、解剖学的および異常に特有の特徴をキャプチャする対応するテキスト記述から構築される。
トレーニング中、保存されたテキストの埋め込みは凍結状態のままであり、画像の特徴は医療データとの整合性に適応している。
UltraADは乳房の3つのデータセットで広く評価されており、病変の局在と微細な医学的分類において最先端の手法よりも優れている。
コードは受理時にリリースされます。
関連論文リスト
- Crane: Context-Guided Prompt Learning and Attention Refinement for Zero-Shot Anomaly Detections [50.343419243749054]
異常検出(AD)は、通常のデータ分布から逸脱を識別する。
本稿では,視覚エンコーダから抽出した画像コンテキストに基づいて,テキストエンコーダのプロンプトを条件付ける手法を提案する。
提案手法は,14のデータセットにおいて,各メトリクスに対して2%から29%の性能向上を実現している。
論文 参考訳(メタデータ) (2025-04-15T10:42:25Z) - Trustworthy image-to-image translation: evaluating uncertainty calibration in unpaired training scenarios [0.0]
マンモグラフィスクリーニングは乳がんの検出に有効な方法であり、早期診断を容易にする。
ディープニューラルネットワークはいくつかの研究で有効であることが示されているが、その傾向は一般化と誤診のリスクをかなり残している。
汎用性を向上させるために、未ペア型ニューラルスタイル転送モデルに基づくデータ拡張スキームが提案されている。
3つのオープンアクセスマンモグラフィーデータセットと1つの非医療画像データセットから解析した画像パッチを用いて、それらの性能を評価する。
論文 参考訳(メタデータ) (2025-01-29T11:09:50Z) - Spatial-aware Attention Generative Adversarial Network for Semi-supervised Anomaly Detection in Medical Image [63.59114880750643]
本稿では,一級半教師付き健康画像生成のための空間意識生成ネットワーク(SAGAN)について紹介する。
SAGANは、正常な画像の復元と擬似異常画像の復元によって導かれる、ラベルのないデータに対応する高品質な健康画像を生成する。
3つの医学データセットに対する大規模な実験は、提案されたSAGANが最先端の手法よりも優れていることを示した。
論文 参考訳(メタデータ) (2024-05-21T15:41:34Z) - Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。
提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。
医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-03-19T09:28:19Z) - AnoDODE: Anomaly Detection with Diffusion ODE [0.0]
異常検出は、データセットの大部分から著しく逸脱する非定型的なデータサンプルを特定するプロセスである。
医用画像から抽出した特徴量の密度を推定し,拡散モードに基づく新しい異常検出手法を提案する。
提案手法は異常を識別するだけでなく,画像レベルと画素レベルでの解釈性も提供する。
論文 参考訳(メタデータ) (2023-10-10T08:44:47Z) - Voice-assisted Image Labelling for Endoscopic Ultrasound Classification
using Neural Networks [48.732863591145964]
本稿では,臨床医が提示した生音声からのEUS画像にラベルを付けるマルチモーダル畳み込みニューラルネットワークアーキテクチャを提案する。
その結果,5つのラベルを持つデータセットにおいて,画像レベルでの予測精度は76%であった。
論文 参考訳(メタデータ) (2021-10-12T21:22:24Z) - Constrained Contrastive Distribution Learning for Unsupervised Anomaly
Detection and Localisation in Medical Images [23.79184121052212]
UAD(Unsupervised Anomaly Detection)は、通常の(すなわち健康的な)画像でのみ1クラスの分類器を学習する。
異常検出のための制約コントラスト分布学習(Constrained Contrastive Distribution Learning for Anomaly Detection, CCD)を提案する。
本手法は,3種類の大腸内視鏡および底部検診データセットにおいて,最先端のUADアプローチよりも優れている。
論文 参考訳(メタデータ) (2021-03-05T01:56:58Z) - Improved Slice-wise Tumour Detection in Brain MRIs by Computing
Dissimilarities between Latent Representations [68.8204255655161]
磁気共鳴画像(MRI)の異常検出は教師なし手法で行うことができる。
本研究では,変分オートエンコーダの潜伏空間における相似関数の計算に基づいて,腫瘍検出のためのスライスワイズ半教師法を提案する。
本研究では,高解像度画像上でのモデルをトレーニングし,再現の質を向上させることにより,異なるベースラインに匹敵する結果が得られることを示す。
論文 参考訳(メタデータ) (2020-07-24T14:02:09Z) - Anomaly Detection in Medical Imaging with Deep Perceptual Autoencoders [1.7277957019593995]
画像異常検出の新しい強力な手法を提案する。
これは、再設計されたトレーニングパイプラインを備えた古典的なオートエンコーダアプローチに依存している。
複雑な医用画像解析タスクにおける最先端のアプローチよりも優れています。
論文 参考訳(メタデータ) (2020-06-23T18:45:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。