Fugu-MT 論文翻訳(概要): HCVP: Leveraging Hierarchical Contrastive Visual Prompt for Domain Generalization

論文の概要: HCVP: Leveraging Hierarchical Contrastive Visual Prompt for Domain Generalization

arxiv url: http://arxiv.org/abs/2401.09716v1
Date: Thu, 18 Jan 2024 04:23:21 GMT
ステータス: 翻訳完了
システム内更新日: 2024-01-19 17:58:55.232960
Title: HCVP: Leveraging Hierarchical Contrastive Visual Prompt for Domain Generalization
Title（参考訳）: HCVP: ドメイン一般化のための階層的コントラストビジュアルプロンプトの活用
Authors: Guanglin Zhou and Zhongyi Han and Shiming Chen and Biwei Huang and Liming Zhu and Tongliang Liu and Lina Yao and Kun Zhang
Abstract要約: ドメイン一般化(DG)は、不変の機能を学ぶことによって、目に見えないシナリオに優れた機械学習モデルを作成するための取り組みである。モデルにドメインレベルとタスク固有の特性を補足する新しい手法を提案する。このアプローチは、特定の特徴から不変な特徴をより効果的に分離し、一般化を促進することを目的としている。
参考スコア（独自算出の注目度）: 69.33162366130887
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Domain Generalization (DG) endeavors to create machine learning models that excel in unseen scenarios by learning invariant features. In DG, the prevalent practice of constraining models to a fixed structure or uniform parameterization to encapsulate invariant features can inadvertently blend specific aspects. Such an approach struggles with nuanced differentiation of inter-domain variations and may exhibit bias towards certain domains, hindering the precise learning of domain-invariant features. Recognizing this, we introduce a novel method designed to supplement the model with domain-level and task-specific characteristics. This approach aims to guide the model in more effectively separating invariant features from specific characteristics, thereby boosting the generalization. Building on the emerging trend of visual prompts in the DG paradigm, our work introduces the novel \textbf{H}ierarchical \textbf{C}ontrastive \textbf{V}isual \textbf{P}rompt (HCVP) methodology. This represents a significant advancement in the field, setting itself apart with a unique generative approach to prompts, alongside an explicit model structure and specialized loss functions. Differing from traditional visual prompts that are often shared across entire datasets, HCVP utilizes a hierarchical prompt generation network enhanced by prompt contrastive learning. These generative prompts are instance-dependent, catering to the unique characteristics inherent to different domains and tasks. Additionally, we devise a prompt modulation network that serves as a bridge, effectively incorporating the generated visual prompts into the vision transformer backbone. Experiments conducted on five DG datasets demonstrate the effectiveness of HCVP, outperforming both established DG algorithms and adaptation protocols.
Abstract（参考訳）: ドメイン一般化(DG)は、不変の機能を学ぶことによって、目に見えないシナリオに優れた機械学習モデルを作成するための取り組みである。 DGでは、不変な特徴をカプセル化する固定構造や一様パラメータ化にモデルを制約する一般的な実践は、特定の側面を不注意にブレンドすることができる。このようなアプローチはドメイン間変異の微妙な分化に苦慮し、特定のドメインに対する偏見を示し、ドメイン不変の特徴の正確な学習を妨げる可能性がある。そこで本研究では,モデルにドメインレベルとタスク固有の特性を補う新しい手法を提案する。このアプローチは、特定の特徴から不変特徴をより効果的に分離し、一般化を促進することを目的としている。 DGパラダイムにおける視覚的プロンプトの出現傾向に基づいて、我々の研究は、新しい \textbf{H}ierarchical \textbf{C}ontrastive \textbf{V}isual \textbf{P}rompt (HCVP) 方法論を導入する。これは、プロンプトに対するユニークな生成的アプローチと、明示的なモデル構造と特別な損失関数とを分離して、この分野における重要な進歩を示している。 HCVPは、データセット全体で頻繁に共有される従来の視覚的プロンプトとは違い、即時コントラスト学習によって強化された階層的なプロンプト生成ネットワークを使用している。これらの生成プロンプトはインスタンスに依存し、異なるドメインとタスクに固有のユニークな特徴に対応します。さらに,視覚トランスフォーマーバックボーンに生成された視覚プロンプトを効果的に組み込むことで,ブリッジとして機能するプロンプト変調ネットワークを考案する。 5つのDGデータセットで実施された実験は、HCVPの有効性を示し、確立されたDGアルゴリズムと適応プロトコルの両方より優れている。

関連論文リスト

Prompt Disentanglement via Language Guidance and Representation Alignment for Domain Generalization [75.88719716002014]
ドメイン一般化 (Domain Generalization, DG) は、目に見えないターゲットドメインに対して効果的に機能する汎用モデルの開発を目指している。 VFM(Pre-trained Visual Foundation Models)の最近の進歩は、ディープラーニングモデルの一般化能力を向上する大きな可能性を示している。 VFMの制御可能で柔軟な言語プロンプトを活用することで,この問題に対処することを提案する。
論文参考訳（メタデータ） (2025-07-03T03:52:37Z)
Generative Classifier for Domain Generalization [84.92088101715116]
ドメインの一般化は、分散シフトに対するコンピュータビジョンモデルの一般化性を目的としている。生成駆動型ドメイン一般化(GCDG)を提案する。 GCDGは3つの重要なモジュールから構成される: 異種性学習(HLC)、純粋相関(SCB)、横成分バランス(DCB)。
論文参考訳（メタデータ） (2025-04-03T04:38:33Z)
Object Style Diffusion for Generalized Object Detection in Urban Scene [69.04189353993907]
本稿では,GoDiffという新しい単一ドメインオブジェクト検出一般化手法を提案する。擬似ターゲットドメインデータとソースドメインデータを統合することで、トレーニングデータセットを多様化する。実験により,本手法は既存の検出器の一般化能力を高めるだけでなく,他の単一領域一般化手法のプラグ・アンド・プレイ拡張として機能することが示された。
論文参考訳（メタデータ） (2024-12-18T13:03:00Z)
Boundless Across Domains: A New Paradigm of Adaptive Feature and Cross-Attention for Domain Generalization in Medical Image Segmentation [1.93061220186624]
ドメイン不変表現学習は、ドメイン一般化の強力な方法である。従来のアプローチでは、高い計算要求、トレーニングの不安定性、高次元データによる限られた有効性といった課題に直面していた。本研究では,分布空間を探索しながら分布外サンプルを生成する適応的特徴ブレンディング(AFB)手法を提案する。
論文参考訳（メタデータ） (2024-11-22T12:06:24Z)
Enhancing Domain Adaptation through Prompt Gradient Alignment [16.618313165111793]
我々は、ドメイン不変性と特定の特徴の両方を学ぶために、素早い学習に基づく一連の作品を開発する。我々は、UDAを、各目的がドメイン損失で表される多重目的最適化問題とみなした。提案手法は,異なるUDAベンチマークにおいて,他のプロンプトベースベースラインをはるかに上回っている。
論文参考訳（メタデータ） (2024-06-13T17:40:15Z)
Causality-inspired Latent Feature Augmentation for Single Domain Generalization [13.735443005394773]
単一ドメインの一般化(Single-DG)は、単一のトレーニングドメインのみを持つ一般化可能なモデルを開発し、他の未知のターゲットドメインでうまく機能させることを目的としている。ドメイン・ハングリー構成の下で、ソース・ドメインのカバレッジを拡大し、異なる分布にまたがる固有の因果的特徴を見つける方法がモデルの一般化能力を高める鍵となる。本稿では、因果学習と介入に基づく特徴レベルの変換のメタ知識を学習することで、単一DGの因果性に着想を得た潜在機能拡張手法を提案する。
論文参考訳（メタデータ） (2024-06-10T02:42:25Z)
CFPL-FAS: Class Free Prompt Learning for Generalizable Face Anti-spoofing [66.6712018832575]
ドメイン一般化 (DG) ベースの Face Anti-Spoofing (FAS) は、目に見えないドメインにおけるモデルの性能を改善することを目的としている。私たちはCLIPのような大規模VLMを利用し、テキスト機能を利用して分類器の重みを動的に調整し、一般化可能な視覚的特徴を探索する。
論文参考訳（メタデータ） (2024-03-21T11:58:50Z)
Memory-Efficient Prompt Tuning for Incremental Histopathology Classification [69.46798702300042]
本稿では,経済的なメモリコストのモデル一般化ポテンシャルを育成するための,メモリ効率の良いプロンプトチューニングフレームワークを提案する。乳癌転移分類と上皮間質組織分類の2つの病理組織学的タスクにより,我々の枠組みを広く評価した。
論文参考訳（メタデータ） (2024-01-22T03:24:45Z)
TeG-DG: Textually Guided Domain Generalization for Face Anti-Spoofing [8.830873674673828]
既存の方法は、様々な訓練領域からドメイン不変の特徴を抽出することを目的としている。抽出された特徴は、必然的に残差スタイルの特徴バイアスを含んでおり、その結果、一般化性能が劣る。本稿では,テキスト情報をドメイン間アライメントに有効活用するテキストガイド型ドメイン一般化フレームワークを提案する。
論文参考訳（メタデータ） (2023-11-30T10:13:46Z)
Towards Domain-Specific Features Disentanglement for Domain Generalization [23.13095840134744]
そこで本研究では,見過ごされがちな領域特化特徴を生かした,新しいコントラッシブ・ベース・ディコンタンジメント法CDDGを提案する。具体的には、CDDGは、潜在空間においてそれらを活用することによって、固有の排他的特徴を分離することを学ぶ。各種ベンチマークデータセットを用いて行った実験は,他の最先端手法と比較して,本手法の優位性を示した。
論文参考訳（メタデータ） (2023-10-04T17:51:02Z)
Randomized Adversarial Style Perturbations for Domain Generalization [49.888364462991234]
本稿では,RASP(Randomized Adversarial Style Perturbation)と呼ばれる新しい領域一般化手法を提案する。提案アルゴリズムは, ランダムに選択されたクラスに対して, 対角方向の特徴のスタイルを乱し, 予期せぬ対象領域で観測される予期せぬスタイルに誤解されないよう, モデルを学習させる。提案アルゴリズムは,様々なベンチマークによる広範な実験により評価され,特に大規模ベンチマークにおいて,領域一般化性能が向上することを示す。
論文参考訳（メタデータ） (2023-04-04T17:07:06Z)
Domain generalization Person Re-identification on Attention-aware multi-operation strategery [8.90472129039969]
ドメイン一般化者再識別(DG Re-ID)は、ソースドメイン上でトレーニングされたモデルを、十分に一般化された未確認対象ドメインに直接デプロイすることを目的としている。既存のDG Re-ID法では、不変演算は領域一般化特徴の抽出に有効である。 DG Re-IDのための注意型マルチオペレーティングストラテジ(AMS)を提案し,より一般化された特徴を抽出した。
論文参考訳（メタデータ） (2022-10-19T09:18:46Z)
Style Interleaved Learning for Generalizable Person Re-identification [69.03539634477637]
DG ReIDトレーニングのための新しいスタイルインターリーブラーニング(IL)フレームワークを提案する。従来の学習戦略とは異なり、ILには2つの前方伝播と1つの後方伝播が組み込まれている。我々のモデルはDG ReIDの大規模ベンチマークにおいて最先端の手法を一貫して上回ることを示す。
論文参考訳（メタデータ） (2022-07-07T07:41:32Z)
TAL: Two-stream Adaptive Learning for Generalizable Person Re-identification [115.31432027711202]
我々は、ドメイン固有性とドメイン不変性の両方が、re-idモデルの一般化能力の向上に不可欠であると主張する。これら2種類の情報を同時にモデル化するために,2ストリーム適応学習 (TAL) を命名した。我々のフレームワークは、単一ソースとマルチソースの両方のドメイン一般化タスクに適用できる。
論文参考訳（メタデータ） (2021-11-29T01:27:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。