論文の概要: Text-Phase Synergy Network with Dual Priors for Unsupervised Cross-Domain Image Retrieval
- arxiv url: http://arxiv.org/abs/2603.12711v1
- Date: Fri, 13 Mar 2026 06:46:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-16 17:38:11.950864
- Title: Text-Phase Synergy Network with Dual Priors for Unsupervised Cross-Domain Image Retrieval
- Title(参考訳): 教師なしクロスドメイン画像検索のための二元優先型テキスト合成ネットワーク
- Authors: Jing Yang, Hui Xue, Shipeng Zhu, Pengfei Fang,
- Abstract要約: 本稿では,2つの優先順位を持つテキスト・モデル・シナジー・ネットワークを提案する。
TPSNet は UCDIR ベンチマークで最先端の手法を大幅に上回っている。
- 参考スコア(独自算出の注目度): 26.746383581727514
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper studies unsupervised cross-domain image retrieval (UCDIR), which aims to retrieve images of the same category across different domains without relying on labeled data. Existing methods typically utilize pseudo-labels, derived from clustering algorithms, as supervisory signals for intra-domain representation learning and cross-domain feature alignment. However, these discrete pseudo-labels often fail to provide accurate and comprehensive semantic guidance. Moreover, the alignment process frequently overlooks the entanglement between domain-specific and semantic information, leading to semantic degradation in the learned representations and ultimately impairing retrieval performance. This paper addresses the limitations by proposing a Text-Phase Synergy Network with Dual Priors(TPSNet). Specifically, we first employ CLIP to generate a set of class-specific prompts per domain, termed as domain prompt, serving as a text prior that offers more precise semantic supervision. In parallel, we further introduce a phase prior, represented by domain-invariant phase features, which is integrated into the original image representations to bridge the domain distribution gaps while preserving semantic integrity. Leveraging the synergy of these dual priors, TPSNet significantly outperforms state-of-the-art methods on UCDIR benchmarks.
- Abstract(参考訳): 本稿では,ラベル付きデータに頼ることなく,異なる領域にまたがる同一カテゴリの画像を検索することを目的とした,教師なしクロスドメイン画像検索(UCDIR)について検討する。
既存の手法では、クラスタリングアルゴリズムから派生した擬似ラベルを、ドメイン内表現学習とクロスドメイン特徴アライメントのための監視信号として利用するのが一般的である。
しかし、これらの離散的な擬似ラベルはしばしば正確で包括的な意味指導を提供しない。
さらに、アライメントプロセスは、ドメイン固有情報と意味情報の絡み合いをしばしば見落とし、学習した表現のセマンティックな劣化を招き、最終的には検索性能を損なう。
本稿では、TPSNet(Text-Phase Synergy Network with Dual Priors)を提案する。
具体的には、まずCLIPを使用してドメインごとのクラス固有のプロンプトを生成します。
並行して、ドメイン不変位相特徴に代表される位相前処理を導入し、元の画像表現に統合して、意味的整合性を保ちながら領域分布ギャップをブリッジする。
TPSNetは、これらの二重先行のシナジーを利用して、UCDIRベンチマークにおける最先端の手法を著しく上回っている。
関連論文リスト
- Prototype-Based Semantic Consistency Alignment for Domain Adaptive Retrieval [30.96614100772607]
Prototype-Based Semantic Consistency Alignment (PSCA) は、効果的なドメイン適応検索のための2段階のフレームワークである。
PSCAはクラスレベルのセマンティック接続を確立し、クラス内のサンプルを収集しながらクラス間のセパビリティを最大化する。
第2段階では、ドメイン固有の量子化関数が相互近似制約の下で再構成された特徴を処理し、ドメイン間で統一されたバイナリハッシュコードを生成する。
論文 参考訳(メタデータ) (2025-12-04T07:16:42Z) - Semantic-enhanced Co-attention Prompt Learning for Non-overlapping Cross-Domain Recommendation [41.344637383515504]
非重複クロスドメインシークエンシャルレコメンデーション(NCSR)は、重複エンティティを使わずにドメイン知識の伝達に焦点を当てるタスクである。
本稿では,MNCSR(Multi-to-one Non-overlapping Cross-domain Sequential Recommendation)の即時学習手法を提案する。
具体的には、IDではなくテキストで項目を表現し、自然言語を活用してドメイン間の知識伝達を促進することで意味的意味を捉える。
論文 参考訳(メタデータ) (2025-05-25T10:45:19Z) - Domain-Agnostic Mutual Prompting for Unsupervised Domain Adaptation [27.695825570272874]
従来のUnsupervised Domain Adaptation (UDA)は、ドメイン間の分散の差を最小限にしようと努力している。
ドメイン非依存型Multual Prompting (DAMP) を提案する。
3つのUDAベンチマークの実験は、最先端のアプローチよりもDAMPの方が優れていることを示した。
論文 参考訳(メタデータ) (2024-03-05T12:06:48Z) - Adaptive Betweenness Clustering for Semi-Supervised Domain Adaptation [108.40945109477886]
分類領域アライメントを実現するために,G-ABC (Adaptive Betweenness Clustering) と呼ばれる新しいSSDA手法を提案する。
提案手法は従来のSSDA手法よりも優れており,提案したG-ABCアルゴリズムの優位性を示している。
論文 参考訳(メタデータ) (2024-01-21T09:57:56Z) - Unsupervised Domain Adaptation for Semantic Segmentation using One-shot
Image-to-Image Translation via Latent Representation Mixing [9.118706387430883]
超高解像度画像のセマンティックセグメンテーションのための新しい教師なし領域適応法を提案する。
潜在コンテンツ表現をドメイン間で混合するエンコーダ・デコーダの原理に基づいて,画像から画像への変換パラダイムを提案する。
都市間比較実験により,提案手法は最先端領域適応法より優れていることが示された。
論文 参考訳(メタデータ) (2022-12-07T18:16:17Z) - DecoupleNet: Decoupled Network for Domain Adaptive Semantic Segmentation [78.30720731968135]
セマンティックセグメンテーションにおける教師なしドメイン適応は、高価なピクセル単位のアノテーションへの依存を軽減するために提起されている。
我々は、ソースドメインのオーバーフィットを軽減し、最終的なモデルをセグメント化タスクに集中できるようにするDecoupleNetを提案する。
我々はまた、自己識別(SD)を推進し、擬似ラベルでより識別可能なターゲットドメイン特徴を学習するための補助分類器を導入した。
論文 参考訳(メタデータ) (2022-07-20T15:47:34Z) - Domain-Agnostic Prior for Transfer Semantic Segmentation [197.9378107222422]
教師なしドメイン適応(UDA)はコンピュータビジョンコミュニティにおいて重要なトピックである。
ドメインに依存しない事前学習(DAP)を用いてドメイン間表現学習を規則化する機構を提案する。
我々の研究は、UDAがより良いプロキシ、おそらく他のデータモダリティの恩恵を受けていることを明らかにしている。
論文 参考訳(メタデータ) (2022-04-06T09:13:25Z) - Unsupervised Domain Adaptation with Semantic Consistency across
Heterogeneous Modalities for MRI Prostate Lesion Segmentation [19.126306953075275]
セマンティック一貫性を促進する2つの新しい損失関数を導入する。
特に,高度な拡散強調画像技術であるVERDICT-MRIの性能向上の課題に対処する。
論文 参考訳(メタデータ) (2021-09-19T17:33:26Z) - Structured Latent Embeddings for Recognizing Unseen Classes in Unseen
Domains [108.11746235308046]
本稿では,異なる領域からの画像を投影することで,ドメインに依存しない遅延埋め込みを学習する手法を提案する。
挑戦的なDomainNetとDomainNet-LSベンチマークの実験は、既存のメソッドよりもアプローチの方が優れていることを示している。
論文 参考訳(メタデータ) (2021-07-12T17:57:46Z) - Cross-domain Contrastive Learning for Unsupervised Domain Adaptation [108.63914324182984]
教師なしドメイン適応(Unsupervised domain adapt、UDA)は、完全にラベル付けされたソースドメインから異なるラベル付けされていないターゲットドメインに学習した知識を転送することを目的としている。
対照的な自己教師型学習に基づいて、トレーニングとテストセット間のドメインの相違を低減するために、機能を整列させます。
論文 参考訳(メタデータ) (2021-06-10T06:32:30Z) - AFAN: Augmented Feature Alignment Network for Cross-Domain Object
Detection [90.18752912204778]
オブジェクト検出のための教師なしドメイン適応は、多くの現実世界のアプリケーションにおいて難しい問題である。
本稿では、中間領域画像生成とドメイン・アドバイザリー・トレーニングを統合した新しい機能アライメント・ネットワーク(AFAN)を提案する。
提案手法は、類似および異種ドメイン適応の双方において、標準ベンチマークにおける最先端の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2021-06-10T05:01:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。