論文の概要: Forgetting-Resistant and Lesion-Aware Source-Free Domain Adaptive Fundus Image Analysis with Vision-Language Model
- arxiv url: http://arxiv.org/abs/2602.19471v1
- Date: Mon, 23 Feb 2026 03:29:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-24 17:42:02.660972
- Title: Forgetting-Resistant and Lesion-Aware Source-Free Domain Adaptive Fundus Image Analysis with Vision-Language Model
- Title(参考訳): ビジョンランゲージモデルを用いたフォールディング抵抗・病変対応型ドメイン適応基底画像解析
- Authors: Zheang Huai, Hui Tang, Hualiang Wang, Xiaomeng Li,
- Abstract要約: ソースフリードメイン適応(source-free domain adapt, SFDA)は、ソースドメインでトレーニングされたモデルをターゲットドメインで正常に動作させるために適応することを目的としている。
ViL モデルを用いた眼底画像診断のための新しい FRLA ( forgetting-resistant and lesion-aware) 法を提案する。
- 参考スコア(独自算出の注目度): 21.25064785724836
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Source-free domain adaptation (SFDA) aims to adapt a model trained in the source domain to perform well in the target domain, with only unlabeled target domain data and the source model. Taking into account that conventional SFDA methods are inevitably error-prone under domain shift, recently greater attention has been directed to SFDA assisted with off-the-shelf foundation models, e.g., vision-language (ViL) models. However, existing works of leveraging ViL models for SFDA confront two issues: (i) Although mutual information is exploited to consider the joint distribution between the predictions of ViL model and the target model, we argue that the forgetting of some superior predictions of the target model still occurs, as indicated by the decline of the accuracies of certain classes during adaptation; (ii) Prior research disregards the rich, fine-grained knowledge embedded in the ViL model, which offers detailed grounding for fundus image diagnosis. In this paper, we introduce a novel forgetting-resistant and lesion-aware (FRLA) method for SFDA of fundus image diagnosis with ViL model. Specifically, a forgetting-resistant adaptation module explicitly preserves the confident predictions of the target model, and a lesion-aware adaptation module yields patch-wise predictions from ViL model and employs them to help the target model be aware of the lesion areas and leverage the ViL model's fine-grained knowledge. Extensive experiments show that our method not only significantly outperforms the vision-language model, but also achieves consistent improvements over the state-of-the-art methods. Our code will be released.
- Abstract(参考訳): ソースフリードメイン適応(SFDA)は、未ラベルのターゲットドメインデータとソースモデルのみを使用して、ソースドメインでトレーニングされたモデルがターゲットドメインでうまく機能するように適応することを目的としている。
従来のSFDA法は、ドメインシフト時に必然的にエラーを起こしやすいことを考慮し、最近では、市販の基盤モデル、例えば視覚言語(ViL)モデルの支援により、SFDAに注目が向けられている。
しかし、SFDAにViLモデルを活用するための既存の研究は、以下の2つの課題に直面している。
一 相互情報は、ViLモデルの予測と目標モデルの合同分布を考えるために利用されるが、適応中の特定のクラスの精度の低下により示されるように、目標モデルの優れた予測を忘れることは依然として発生すると論じる。
(II) 基礎画像診断のための詳細な基盤を提供するViLモデルに埋め込まれた、豊かできめ細かな知識を無視した先行研究。
本稿では,VelL モデルを用いた眼底画像診断のための新規なDreakting-resistant and lesion-aware (FRLA) 法を提案する。
具体的には、忘れやすい適応モジュールは、ターゲットモデルの確実な予測を明示的に保持し、病変認識適応モジュールは、ViLモデルからパッチワイズ予測を出力し、ターゲットモデルが病変領域を認識し、ViLモデルのきめ細かい知識を活用するのを助ける。
広汎な実験により,本手法は視覚言語モデルよりも優れるだけでなく,最先端の手法よりも一貫した改善が達成されることがわかった。
私たちのコードは解放されます。
関連論文リスト
- Did Models Sufficient Learn? Attribution-Guided Training via Subset-Selected Counterfactual Augmentation [61.248535801314375]
Subset-Selected Counterfactual Augmentation (SS-CA)
我々は,モデル予測を選択的に変更可能な最小空間領域集合を識別するために,対実的LIMAを開発した。
実験により,SS-CAは分布内テストデータ(ID)の一般化を改善し,分布外ベンチマーク(OOD)において優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2025-11-15T08:39:22Z) - ViLAaD: Enhancing "Attracting and Dispersing'' Source-Free Domain Adaptation with Vision-and-Language Model [0.9831489366502302]
Source-Free Domain Adaptation (SFDA)は、トレーニング済みのソースモデルを、ソースデータにアクセスすることなく、異なるドメインからターゲットデータセットに適応することを目的としている。
視覚と言語(ViL)モデルを用いて既存のFDAフレームワークを拡張して補助情報を組み込む新しい手法を提案する。
我々のアプローチは ViL-enhanced AaD (ViLAaD) と呼ばれ、AaD フレームワークのシンプルさと柔軟性を保ちながら、適応性能を大幅に向上させるために ViL モデルを活用している。
論文 参考訳(メタデータ) (2025-03-30T17:22:55Z) - Model Inversion Attacks Through Target-Specific Conditional Diffusion Models [54.69008212790426]
モデル反転攻撃(MIA)は、ターゲット分類器のトレーニングセットからプライベートイメージを再構築することを目的としており、それによってAIアプリケーションにおけるプライバシー上の懸念が高まる。
従来のGANベースのMIAは、GANの固有の欠陥と潜伏空間における最適化の偏りにより、劣った遺伝子的忠実度に悩まされる傾向にある。
これらの問題を緩和するために拡散モデル反転(Diff-MI)攻撃を提案する。
論文 参考訳(メタデータ) (2024-07-16T06:38:49Z) - Proxy Denoising for Source-Free Domain Adaptation [42.696235010327726]
Source-Free Domain Adaptation (SFDA)は、トレーニング済みのソースモデルを、ソースデータにアクセスせずにラベルなしのターゲットドメインに適応することを目的としている。
本稿では,ViL の予測を正すために Proxy Denoising (ProDe) アプローチを提案する。
論文 参考訳(メタデータ) (2024-06-03T17:36:36Z) - Source-Free Domain Adaptation with Frozen Multimodal Foundation Model [42.19262809313472]
Source-Free Domain Adaptation (SFDA)は、ターゲットドメインにソースモデルを適用することを目的としている。
ヘテロジニアス知識を生かしながら、リッチな市販の視覚言語(ViL)マルチモーダルモデルの可能性を探る。
本稿では,新しいDIFOアポローチモデルを提案する。
論文 参考訳(メタデータ) (2023-11-27T12:58:02Z) - Phasic Content Fusing Diffusion Model with Directional Distribution
Consistency for Few-Shot Model Adaption [73.98706049140098]
本稿では,方向分布の整合性を損なう少数ショット拡散モデルを用いた新しいファシックコンテンツを提案する。
具体的には、ファシックコンテンツ融合を用いたファシックトレーニング戦略を設計し、tが大きければ、モデルがコンテンツやスタイル情報を学ぶのに役立てる。
最後に、ドメイン適応時の構造整合性を高めるクロスドメイン構造ガイダンス戦略を提案する。
論文 参考訳(メタデータ) (2023-09-07T14:14:11Z) - Latent Code Augmentation Based on Stable Diffusion for Data-free Substitute Attacks [47.84143701817491]
ブラックボックス代替攻撃では対象モデルのトレーニングデータが利用できないため、近年のスキームではGANを用いて代替モデルのトレーニングデータを生成する。
本稿では,SD(Stable Diffusion)に基づくデータフリー代替攻撃方式を提案する。
論文 参考訳(メタデータ) (2023-07-24T15:10:22Z) - Confidence Attention and Generalization Enhanced Distillation for
Continuous Video Domain Adaptation [62.458968086881555]
連続ビデオドメイン適応(CVDA、Continuous Video Domain Adaptation)は、ソースモデルが個々の変更対象ドメインに適応する必要があるシナリオである。
CVDAの課題に対処するため,遺伝子組み換え型自己知識解離(CART)を用いた信頼性保証ネットワークを提案する。
論文 参考訳(メタデータ) (2023-03-18T16:40:10Z) - Uncertainty-guided Source-free Domain Adaptation [77.3844160723014]
ソースフリードメイン適応(SFDA)は、事前訓練されたソースモデルのみを使用することで、未ラベルのターゲットデータセットに分類器を適応させることを目的としている。
本稿では、ソースモデル予測の不確実性を定量化し、ターゲット適応の導出に利用することを提案する。
論文 参考訳(メタデータ) (2022-08-16T08:03:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。