論文の概要: Rethinking the Need for Source Models: Source-Free Domain Adaptation from Scratch Guided by a Vision-Language Model
- arxiv url: http://arxiv.org/abs/2605.02604v1
- Date: Mon, 04 May 2026 13:51:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.316148
- Title: Rethinking the Need for Source Models: Source-Free Domain Adaptation from Scratch Guided by a Vision-Language Model
- Title(参考訳): ソースモデルの必要性を再考する:ビジョンランゲージモデルによるスクラッチからのソースフリードメイン適応
- Authors: Zhou Bingtao, Xiang Mian, Ning Qian,
- Abstract要約: Source-Free Domain Adaptation (SFDA)はソースデータにアクセスせず、プライバシや送信の問題に対処することなく、ソースモデルをターゲットドメインに適応させる。
最近の研究は、適応プロセスのガイドとなるViLモデルを導入している。
ViL-Only Domain Adaptation (VODA)を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Source-Free Domain Adaptation (SFDA) adapts source models to target domains without accessing source data, addressing privacy and transmission issues. However, existing methods still initialize from a source pre-trained model and thus are not truly source-free. Recent works have introduced Vision-Language (ViL) models to guide the adaptation process, in these methods, we observe that for the same target domain, different source models yield minimal variation in final results, indicating the source model itself has limited impact. Motivated by this, we propose ViL-Only Domain Adaptation (VODA) , a stricter setting that eliminates all dependencies on source domain, relying solely on a randomly initialized model, a ViL model, and unlabeled target data. We analyze the adaptation dynamics of VODA and introduce Two-Stage Denoised-Region Distillation (TS-DRD) , a two-stage framework that first warms up the model with ViL guidance, then seek a Denoised-Region inherent in both the ViL and adapting model, yielding cleaner supervision for distillation. Experiments on Office-Home, VisDA, and DomainNet-126 show that under VODA, TS-DRD achieves competitive or superior performance to existing SFDA methods that still use source models, demonstrating its effectiveness and the potential of the VODA setting.
- Abstract(参考訳): Source-Free Domain Adaptation (SFDA)はソースデータにアクセスせず、プライバシや送信の問題に対処することなく、ソースモデルをターゲットドメインに適応させる。
しかし、既存のメソッドは、まだソース事前訓練されたモデルから初期化されているため、真のソースフリーではない。
最近の研究は、適応過程を導くためにViLモデルを導入しており、これらの手法では、同じ対象領域において、異なるソースモデルが最終結果に最小限のばらつきをもたらすことが観察されており、ソースモデル自体に限られた影響があることが示されている。
そこで本研究では,VL-Only Domain Adaptation (VODA)を提案する。VLモデルとラベル付けされていないターゲットデータのみに依存して,ソースドメインへの依存をなくす,より厳密な設定である。
VODAの適応力学を解析し、2段階脱臭蒸留(TS-DRD)を導入し、まずVL誘導でモデルを温め、VLと適応モデルの両方に固有の脱臭反応を探索し、蒸留のよりクリーンな監督を行う。
Office-Home、VisDA、DomainNet-126の実験では、VODAの下では、TS-DRDは、まだソースモデルを使っている既存のSFDAメソッドと競合または優れた性能を示し、その効果とVODA設定の可能性を示している。
関連論文リスト
- Dual-Teacher Distillation with Subnetwork Rectification for Black-Box Domain Adaptation [69.7036779439312]
ブラックボックスドメイン適応は、非常に実用的で非常に困難な設定である。
ブラックボックスソースモデルに埋め込まれた特定の知識を活用するサブネットワーク整合モデル(DDSR)を用いた二重蒸留法を提案する。
我々の手法は、ソースデータやモデルの使用を含む、最先端の手法に対する一貫した改善を実証する。
論文 参考訳(メタデータ) (2026-03-24T07:54:19Z) - Forgetting-Resistant and Lesion-Aware Source-Free Domain Adaptive Fundus Image Analysis with Vision-Language Model [21.25064785724836]
ソースフリードメイン適応(source-free domain adapt, SFDA)は、ソースドメインでトレーニングされたモデルをターゲットドメインで正常に動作させるために適応することを目的としている。
ViL モデルを用いた眼底画像診断のための新しい FRLA ( forgetting-resistant and lesion-aware) 法を提案する。
論文 参考訳(メタデータ) (2026-02-23T03:29:54Z) - DAM: Dual Active Learning with Multimodal Foundation Model for Source-Free Domain Adaptation [53.323488295994395]
ソースフリーアクティブドメイン適応(SFADA)は、アクティブラーニングによって選択された限られた手動ラベルを用いて、ソースモデルから未ラベルのターゲットドメインへの知識伝達を強化する。
マルチモーダル・ファンデーション・モデルを用いたデュアルアクティブ・ラーニング(DAM)を提案する。
大規模な実験では、DAMは既存のメソッドを一貫して上回り、複数のSFADAベンチマークとアクティブな学習戦略で新しい最先端の手法を設定できる。
論文 参考訳(メタデータ) (2025-09-29T15:06:56Z) - ViLAaD: Enhancing "Attracting and Dispersing'' Source-Free Domain Adaptation with Vision-and-Language Model [0.9831489366502302]
Source-Free Domain Adaptation (SFDA)は、トレーニング済みのソースモデルを、ソースデータにアクセスすることなく、異なるドメインからターゲットデータセットに適応することを目的としている。
視覚と言語(ViL)モデルを用いて既存のFDAフレームワークを拡張して補助情報を組み込む新しい手法を提案する。
我々のアプローチは ViL-enhanced AaD (ViLAaD) と呼ばれ、AaD フレームワークのシンプルさと柔軟性を保ちながら、適応性能を大幅に向上させるために ViL モデルを活用している。
論文 参考訳(メタデータ) (2025-03-30T17:22:55Z) - Source-Free Domain Adaptation with Frozen Multimodal Foundation Model [42.19262809313472]
Source-Free Domain Adaptation (SFDA)は、ターゲットドメインにソースモデルを適用することを目的としている。
ヘテロジニアス知識を生かしながら、リッチな市販の視覚言語(ViL)マルチモーダルモデルの可能性を探る。
本稿では,新しいDIFOアポローチモデルを提案する。
論文 参考訳(メタデータ) (2023-11-27T12:58:02Z) - The Unreasonable Effectiveness of Large Language-Vision Models for
Source-free Video Domain Adaptation [56.61543110071199]
Source-Free Video Unsupervised Domain Adaptation (SFVUDA)タスクは、ラベル付きソースデータセットでトレーニングされたアクション認識モデルを、ラベル付きターゲットデータセットに適応させることによって構成される。
従来のアプローチでは、ターゲットデータ自体から派生した自己スーパービジョンを活用してSFVUDAに対処しようと試みてきた。
我々は、LLVMがドメインシフトに対して驚くほど堅牢になる前に、リッチな世界を含むという理論によって、LLVM(Large Language-Vision Models)から"web-supervision"を利用するアプローチを取る。
論文 参考訳(メタデータ) (2023-08-17T18:12:05Z) - RAIN: RegulArization on Input and Network for Black-Box Domain
Adaptation [80.03883315743715]
ソースのないドメイン適応は、ソースデータを公開することなく、ソース訓練されたモデルをターゲットドメインに転送する。
このパラダイムは、ソースモデルに対する敵対的な攻撃のため、データ漏洩のリスクがある。
そこで我々は,入力レベルとネットワークレベルの両方の正規化からブラックボックスドメインを適応させる新しい手法であるRAIN(RegulArization on Input and Network)を提案する。
論文 参考訳(メタデータ) (2022-08-22T18:18:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。