論文の概要: Structured Latent Embeddings for Recognizing Unseen Classes in Unseen
Domains
- arxiv url: http://arxiv.org/abs/2107.05622v1
- Date: Mon, 12 Jul 2021 17:57:46 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-13 17:29:05.146959
- Title: Structured Latent Embeddings for Recognizing Unseen Classes in Unseen
Domains
- Title(参考訳): unseenドメインにおけるunseenクラス認識のための構造化潜在埋め込み
- Authors: Shivam Chandhok, Sanath Narayan, Hisham Cholakkal, Rao Muhammad Anwer,
Vineeth N Balasubramanian, Fahad Shahbaz Khan, Ling Shao
- Abstract要約: 本稿では,異なる領域からの画像を投影することで,ドメインに依存しない遅延埋め込みを学習する手法を提案する。
挑戦的なDomainNetとDomainNet-LSベンチマークの実験は、既存のメソッドよりもアプローチの方が優れていることを示している。
- 参考スコア(独自算出の注目度): 108.11746235308046
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The need to address the scarcity of task-specific annotated data has resulted
in concerted efforts in recent years for specific settings such as zero-shot
learning (ZSL) and domain generalization (DG), to separately address the issues
of semantic shift and domain shift, respectively. However, real-world
applications often do not have constrained settings and necessitate handling
unseen classes in unseen domains -- a setting called Zero-shot Domain
Generalization, which presents the issues of domain and semantic shifts
simultaneously. In this work, we propose a novel approach that learns
domain-agnostic structured latent embeddings by projecting images from
different domains as well as class-specific semantic text-based representations
to a common latent space. In particular, our method jointly strives for the
following objectives: (i) aligning the multimodal cues from visual and
text-based semantic concepts; (ii) partitioning the common latent space
according to the domain-agnostic class-level semantic concepts; and (iii)
learning a domain invariance w.r.t the visual-semantic joint distribution for
generalizing to unseen classes in unseen domains. Our experiments on the
challenging DomainNet and DomainNet-LS benchmarks show the superiority of our
approach over existing methods, with significant gains on difficult domains
like quickdraw and sketch.
- Abstract(参考訳): タスク固有のアノテートデータの不足に対処する必要性は、近年、ゼロショット学習(zsl)やドメイン一般化(dg)といった特定の設定において、それぞれセマンティックシフトとドメインシフトの問題を別々に扱うための取り組みが相まってきています。
しかし、現実のアプリケーションは、しばしば制約のある設定を持たず、目に見えないドメインで見えないクラスを扱う必要がある -- Zero-shot Domain Generalizationと呼ばれる設定で、ドメインとセマンティックシフトの問題を同時に提示する。
本研究では,異なる領域からのイメージとクラス固有のセマンティックテキストベース表現を共通潜在空間に投影することにより,ドメインに依存しないラテント埋め込みを学習する手法を提案する。
特に,本手法は, 視覚的, テキスト的意味概念からの多モード的手がかりの整合性, ドメインに依存しないクラスレベルの意味概念による共通潜在空間の分割, および, ドメインの不変性を学習すること, および, 視覚的意味的関節分布を用いて, 目に見えないドメインのクラスに一般化する。
挑戦的なDomainNetとDomainNet-LSベンチマークに関する我々の実験は、我々のアプローチが既存のメソッドよりも優れていることを示している。
関連論文リスト
- In the Era of Prompt Learning with Vision-Language Models [1.060608983034705]
ドメイン一般化のためのドメインに依存しない新しい学習戦略であるtextscStyLIP を紹介する。
StyLIPは、スタイルプロジェクタを使用してドメイン固有のプロンプトトークンを学習することで、CLIPsビジョンエンコーダの視覚スタイルとコンテンツを切り離す。
また,CLIPの凍結視覚バックボーンを利用した非教師なし領域適応(DA)のためのAD-CLIPを提案する。
論文 参考訳(メタデータ) (2024-11-07T17:31:21Z) - Domain-Agnostic Mutual Prompting for Unsupervised Domain Adaptation [27.695825570272874]
従来のUnsupervised Domain Adaptation (UDA)は、ドメイン間の分散の差を最小限にしようと努力している。
ドメイン非依存型Multual Prompting (DAMP) を提案する。
3つのUDAベンチマークの実験は、最先端のアプローチよりもDAMPの方が優れていることを示した。
論文 参考訳(メタデータ) (2024-03-05T12:06:48Z) - Domain Adaptive Few-Shot Open-Set Learning [36.39622440120531]
本稿では,DA-FSOS(Domain Adaptive Few-Shot Open Set Recognition)を提案する。
我々のトレーニングアプローチは、DAFOS-NETがターゲットドメインの新しいシナリオにうまく適応できるようにします。
本稿では,Office-Home,mini-ImageNet/CUB,DomainNetデータセットに基づくDA-FSOSの3つのベンチマークを示す。
論文 参考訳(メタデータ) (2023-09-22T12:04:47Z) - Domain Generalization for Domain-Linked Classes [8.738092015092207]
実世界では、クラスはドメインリンクされ、すなわち特定のドメインでのみ表現される。
本稿では,ドメインリンクDG,FONDのためのFair and cONtrastive feature-space regularizationアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-06-01T16:39:50Z) - Compound Domain Generalization via Meta-Knowledge Encoding [55.22920476224671]
マルチモーダル分布を再正規化するために,スタイル駆動型ドメイン固有正規化(SDNorm)を導入する。
組込み空間における関係モデリングを行うために,プロトタイプ表現,クラスセントロイドを利用する。
4つの標準ドメイン一般化ベンチマークの実験により、COMENはドメインの監督なしに最先端のパフォーマンスを上回ることが判明した。
論文 参考訳(メタデータ) (2022-03-24T11:54:59Z) - Unsupervised Domain Generalization by Learning a Bridge Across Domains [78.855606355957]
Unsupervised Domain Generalization (UDG) のセットアップでは、ソースもターゲットドメインもトレーニングの監督は行わない。
本手法は,各トレーニング領域からBrADへの視覚的(イメージ間)マッピングを保存したセマンティクスのセットを伴って,補助的なブリッジドメインであるBrAD(Bridge Across Domains)の自己教師型学習に基づいている。
我々は,エッジレギュラー化したBrADを用いて,UDG,Few-shot UDA,マルチドメインデータセット間の教師なし一般化など,複数のベンチマークやタスクにまたがる大幅な向上を実現する方法を示す。
論文 参考訳(メタデータ) (2021-12-04T10:25:45Z) - AFAN: Augmented Feature Alignment Network for Cross-Domain Object
Detection [90.18752912204778]
オブジェクト検出のための教師なしドメイン適応は、多くの現実世界のアプリケーションにおいて難しい問題である。
本稿では、中間領域画像生成とドメイン・アドバイザリー・トレーニングを統合した新しい機能アライメント・ネットワーク(AFAN)を提案する。
提案手法は、類似および異種ドメイン適応の双方において、標準ベンチマークにおける最先端の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2021-06-10T05:01:20Z) - Cluster, Split, Fuse, and Update: Meta-Learning for Open Compound Domain
Adaptive Semantic Segmentation [102.42638795864178]
セマンティックセグメンテーションのための原則的メタラーニングに基づくOCDAアプローチを提案する。
対象ドメインを複数のサブターゲットドメインに,教師なしの方法で抽出した画像スタイルでクラスタリングする。
その後、メタラーニングがデプロイされ、スタイルコードに条件付きでサブターゲットドメイン固有の予測を融合するように学習される。
モデルに依存しないメタラーニング(MAML)アルゴリズムにより,モデルをオンライン更新することを学び,一般化をさらに改善する。
論文 参考訳(メタデータ) (2020-12-15T13:21:54Z) - Cross-Domain Grouping and Alignment for Domain Adaptive Semantic
Segmentation [74.3349233035632]
深層畳み込みニューラルネットワーク(CNN)内のソースドメインとターゲットドメインにセマンティックセグメンテーションネットワークを適用する既存の技術は、対象ドメイン自身や推定カテゴリ内のクラス間変異を考慮していない。
学習可能なクラスタリングモジュールと、クロスドメイングルーピングとアライメントと呼ばれる新しいドメイン適応フレームワークを導入する。
本手法はセマンティクスセグメンテーションにおける適応性能を一貫して向上させ,様々なドメイン適応設定において最先端を上回っている。
論文 参考訳(メタデータ) (2020-12-15T11:36:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。