論文の概要: Semantic Relation-Enhanced CLIP Adapter for Domain Adaptive Zero-Shot Learning
- arxiv url: http://arxiv.org/abs/2510.21808v1
- Date: Tue, 21 Oct 2025 09:03:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 17:41:21.903864
- Title: Semantic Relation-Enhanced CLIP Adapter for Domain Adaptive Zero-Shot Learning
- Title(参考訳): ドメイン適応型ゼロショット学習のための意味関係強化CLIPアダプタ
- Authors: Jiaao Yu, Mingjie Han, Jinkun Jiang, Junyu Dong, Tao Gong, Man Lan,
- Abstract要約: 既存のパラダイムは、クロスドメイン転送とクロスカテゴリの一般化のバランスが取れない。
本稿ではセマンティック・リレーショナル・アライメント・ストラテジーとセマンティック・リレーショナル・アライメント・ストラテジーを統合したセマンティック・リレーショナル・エンハンスメント・CLIP(SRE-CLIP)アダプタ・フレームワークを提案する。
最初のCLIPベースのDAZSL法として、SRE-CLIPはI2AwAおよびI2WebVベンチマークで最先端のパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 38.82458153083585
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The high cost of data annotation has spurred research on training deep learning models in data-limited scenarios. Existing paradigms, however, fail to balance cross-domain transfer and cross-category generalization, giving rise to the demand for Domain-Adaptive Zero-Shot Learning (DAZSL). Although vision-language models (e.g., CLIP) have inherent advantages in the DAZSL field, current studies do not fully exploit their potential. Applying CLIP to DAZSL faces two core challenges: inefficient cross-category knowledge transfer due to the lack of semantic relation guidance, and degraded cross-modal alignment during target domain fine-tuning. To address these issues, we propose a Semantic Relation-Enhanced CLIP (SRE-CLIP) Adapter framework, integrating a Semantic Relation Structure Loss and a Cross-Modal Alignment Retention Strategy. As the first CLIP-based DAZSL method, SRE-CLIP achieves state-of-the-art performance on the I2AwA and I2WebV benchmarks, significantly outperforming existing approaches.
- Abstract(参考訳): データアノテーションの高コストは、データ限定シナリオでディープラーニングモデルをトレーニングする研究を刺激している。
しかし、既存のパラダイムはクロスドメイン転送とクロスカテゴリの一般化のバランスが取れず、ドメイン適応型ゼロショット学習(DAZSL)の需要が高まった。
視覚言語モデル(例えばCLIP)はDAZSL分野に固有の利点があるが、現在の研究ではその可能性を十分に活用していない。
CLIPをDAZSLに適用することは、意味的関係ガイダンスの欠如による非効率なクロスカテゴリ知識伝達と、ターゲットドメインの微調整中に劣化したクロスモーダルアライメントの2つの課題に直面する。
これらの課題に対処するため,セマンティック・リレーショナル・エンハンスメント・CLIP (SRE-CLIP) 適応フレームワークを提案し,セマンティック・リレーショナル・ストラクチャー・ロスとクロスモーダルアライメント・リテンション・ストラテジーを統合した。
最初のCLIPベースのDAZSL法として、SRE-CLIPはI2AwAとI2WebVベンチマークで最先端のパフォーマンスを達成し、既存のアプローチよりも大幅に優れている。
関連論文リスト
- Connecting Domains and Contrasting Samples: A Ladder for Domain Generalization [52.52838658375592]
本稿では,ドメイン間の概念的接続性を高めるために,ドメイン接続型コントラスト学習(DCCL)を提案する。
データ側では、クラス内の接続性を改善するために、よりアグレッシブなデータ拡張とクロスドメインの陽性サンプルが導入されている。
その結果、DCCLはドメインの監督なしに最先端のベースラインを上回ることが確認された。
論文 参考訳(メタデータ) (2025-10-19T04:13:29Z) - Causal Disentanglement and Cross-Modal Alignment for Enhanced Few-Shot Learning [11.752632557524969]
Causal CLIP Adapter(CCA)は、CLIPから抽出された視覚的特徴を明示的に分離する新しいフレームワークである。
本手法は, 分散シフトに対する数ショット性能とロバスト性の観点から, 常に最先端の手法より優れる。
論文 参考訳(メタデータ) (2025-08-05T05:30:42Z) - SemiDAViL: Semi-supervised Domain Adaptation with Vision-Language Guidance for Semantic Segmentation [9.311853182451289]
セマンティックセグメンテーションのための言語誘導半教師付きドメイン適応(SSDA)設定を提案する。
我々は、視覚言語モデル(VLM)に固有の意味一般化機能を活用して、相乗的枠組みを確立する。
提案手法は, 現代の SoTA (State-of-the-art) 手法に比較して, 大幅な性能向上を示す。
論文 参考訳(メタデータ) (2025-04-08T19:14:34Z) - Generalized Few-Shot Continual Learning with Contrastive Mixture of
Adapters [59.82088750033897]
我々は,クラスおよびドメインインクリメンタルな状況を含む汎用FSCL (GFSCL) プロトコルを構築した。
一般的な連続学習手法は、目に見えない領域に一般化能力が乏しいことが判明した。
このようにして、視覚変換器(ViT)に基づくリハーサルフリーフレームワークであるContrastive Mixture of Adapters(CMoA)を提案する。
論文 参考訳(メタデータ) (2023-02-12T15:18:14Z) - Contour-Aware Equipotential Learning for Semantic Segmentation [35.09077032446148]
本研究では,意味的境界を学習し,推論するための等角的学習法を提案する。
本稿では,フィールド回帰と輪郭学習による境界セグメンテーション問題に対処するための最初の試みである。
提案するEPLモジュールは,セマンティック境界領域を認識する際に,既製の完全畳み込みネットワークモデルに有効である。
論文 参考訳(メタデータ) (2022-10-01T08:45:44Z) - Transferrable Contrastive Learning for Visual Domain Adaptation [108.98041306507372]
Transferrable Contrastive Learning (TCL) はドメイン適応に適した自己教師型学習パラダイムである。
TCLは、クリーンで斬新な対照的な損失を通じて、ソースとターゲット間のドメイン内ドメイン間の相違を罰する。
無料のランチは、対照的な学習が組み込まれているため、TCLは、ターゲットデータのための擬似ラベルの時間的にアンサンブルされたバージョンを自然に達成する、移動平均キーエンコーダに依存している。
論文 参考訳(メタデータ) (2021-12-14T16:23:01Z) - Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。
SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T06:11:16Z) - Source-Free Open Compound Domain Adaptation in Semantic Segmentation [99.82890571842603]
SF-OCDAでは、ターゲットモデルを学習するために、ソース事前訓練されたモデルとターゲットデータのみが利用可能である。
そこで我々は,Cross-Patch Style Swap (CPSS)を提案する。
提案手法は,C-Drivingデータセット上で最先端の結果を生成する。
論文 参考訳(メタデータ) (2021-06-07T08:38:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。