論文の概要: Domain-Aware Continual Zero-Shot Learning
- arxiv url: http://arxiv.org/abs/2112.12989v3
- Date: Tue, 12 Mar 2024 14:47:47 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-14 02:43:13.094352
- Title: Domain-Aware Continual Zero-Shot Learning
- Title(参考訳): ドメイン対応連続ゼロショット学習
- Authors: Kai Yi, Paul Janson, Wenxuan Zhang, Mohamed Elhoseiny
- Abstract要約: ドメイン対応連続ゼロショット学習(DACZSL)は、連続的に変化するドメインにおいて、目に見えないカテゴリの画像を認識するタスクである。
そこで本研究では,ドメインシフトのための因子化特徴を学習するためのドメイン不変ネットワーク(DIN)を提案し,未知のクラスに対するテキスト表現を改善した。
以上の結果から,DINは既存のベースラインよりも高調波精度で5%以上,後方転送で1%以上優れていた。
- 参考スコア(独自算出の注目度): 52.349332188116975
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modern visual systems have a wide range of potential applications in vision
tasks for natural science research, such as aiding in species discovery,
monitoring animals in the wild, and so on. However, real-world vision tasks may
experience changes in environmental conditions, leading to shifts in how
captured images are presented. To address this issue, we introduce Domain-Aware
Continual Zero-Shot Learning (DACZSL), a task to recognize images of unseen
categories in continuously changing domains. Accordingly, we propose a
Domain-Invariant Network (DIN) to learn factorized features for shifting
domains and improved textual representation for unseen classes. DIN continually
learns a global shared network for domain-invariant and task-invariant
features, and per-task private networks for task-specific features.
Furthermore, we enhance the dual network with class-wise learnable prompts to
improve class-level text representation, thereby improving zero-shot prediction
of future unseen classes. To evaluate DACZSL, we introduce two benchmarks,
DomainNet-CZSL and iWildCam-CZSL. Our results show that DIN significantly
outperforms existing baselines by over 5% in harmonic accuracy and over 1% in
backward transfer and achieves a new SoTA.
- Abstract(参考訳): 現代の視覚系は、種発見の支援、野生動物のモニタリングなど、自然科学研究のための視覚タスクに幅広い可能性を持っている。
しかし、現実の視覚タスクは環境条件の変化を経験し、キャプチャ画像の提示方法に変化をもたらす可能性がある。
この問題に対処するために,連続的に変化する領域において,未知のカテゴリの画像を認識するタスクであるdaczsl(domain-aware continual zero-shot learning)を導入する。
そこで本研究では,ドメインシフトのための因子化特徴を学習するためのドメイン不変ネットワーク(DIN)を提案する。
DINは、ドメイン不変およびタスク不変の機能のためのグローバル共有ネットワークと、タスク固有の機能のためのタスクごとのプライベートネットワークを継続的に学習する。
さらに,クラスレベルで学習可能なプロンプトによるデュアルネットワークを強化し,クラスレベルのテキスト表現を改善し,将来の未認識クラスのゼロショット予測を改善した。
DACZSLを評価するために、DomainNet-CZSLとiWildCam-CZSLの2つのベンチマークを導入する。
以上の結果から,DINは既存のベースラインを5%以上の高調波精度で,1%以上の後方転送を達成し,新たなSoTAを実現している。
関連論文リスト
- In the Era of Prompt Learning with Vision-Language Models [1.060608983034705]
ドメイン一般化のためのドメインに依存しない新しい学習戦略であるtextscStyLIP を紹介する。
StyLIPは、スタイルプロジェクタを使用してドメイン固有のプロンプトトークンを学習することで、CLIPsビジョンエンコーダの視覚スタイルとコンテンツを切り離す。
また,CLIPの凍結視覚バックボーンを利用した非教師なし領域適応(DA)のためのAD-CLIPを提案する。
論文 参考訳(メタデータ) (2024-11-07T17:31:21Z) - Grounding Stylistic Domain Generalization with Quantitative Domain Shift Measures and Synthetic Scene Images [63.58800688320182]
ドメインの一般化は機械学習において難しい課題である。
現在の方法論は、スタイリスティック領域におけるシフトに関する定量的な理解を欠いている。
これらのリスクに対処する新しいDGパラダイムを導入する。
論文 参考訳(メタデータ) (2024-05-24T22:13:31Z) - Domain-Controlled Prompt Learning [49.45309818782329]
既存の素早い学習方法はドメイン認識やドメイン転送機構を欠いていることが多い。
特定のドメインに対するtextbfDomain-Controlled Prompt Learningを提案する。
本手法は,特定の領域画像認識データセットにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2023-09-30T02:59:49Z) - Multi-Scale and Multi-Layer Contrastive Learning for Domain Generalization [5.124256074746721]
深部畳み込みニューラルネットワークの一般化能力は、ネットワークの多層的および多スケール的表現を活用することで向上できると論じる。
画像分類器の領域一般化を目的とした,低レベル特徴と高レベル特徴を複数スケールで組み合わせたフレームワークを提案する。
我々のモデルは従来のDG手法よりも優れており、全てのデータセットにおいて競争力と最先端の結果を連続的に生成できることを示す。
論文 参考訳(メタデータ) (2023-08-28T08:54:27Z) - Using Language to Extend to Unseen Domains [81.37175826824625]
ビジョンモデルがデプロイ時に遭遇する可能性のあるすべてのドメインのトレーニングデータを集めることは、費用がかかる。
トレーニングドメインと拡張したいが、堅牢性を改善するためのデータを持っていないドメインを、いかに単純に言葉で表現するかを考えます。
共同画像と言語埋め込み空間を備えたマルチモーダルモデルを用いて、LADSはトレーニング領域から各未確認テスト領域への画像埋め込みの変換を学習する。
論文 参考訳(メタデータ) (2022-10-18T01:14:02Z) - Domain Invariant Masked Autoencoders for Self-supervised Learning from
Multi-domains [73.54897096088149]
マルチドメインからの自己教師型学習のためのドメイン不変のMasked AutoEncoder (DiMAE)を提案する。
中心となる考え方は、入力画像を異なるドメインからのスタイルノイズで拡張し、拡張イメージの埋め込みからイメージを再構築することである。
PACSとDomainNetの実験は、最近の最先端の手法と比較して、DiMAEがかなりの利益を得ていることを示している。
論文 参考訳(メタデータ) (2022-05-10T09:49:40Z) - Towards Recognizing Unseen Categories in Unseen Domains [74.29101415077523]
CuMixはZSL(Zero-Shot Learning)、ドメイン適応とドメイン一般化(Domain Adaptation and Domain Generalization、DG)、ZSL+DG(ZSL+DG)に取り組むための総合的なアルゴリズムである。
CuMixのキーとなるアイデアは、トレーニング中に使用可能な、目に見えないドメインやカテゴリからの画像と機能を使用して、テスト時のドメインとセマンティックシフトをシミュレートすることだ。
DomainNetベンチマークを用いた標準SLおよびDGデータセットとZSL+DGの結果から,本手法の有効性が示された。
論文 参考訳(メタデータ) (2020-07-23T21:09:28Z) - Learning to adapt class-specific features across domains for semantic
segmentation [36.36210909649728]
本論文では,クラス情報毎に考慮し,ドメイン間の特徴を適応させることを学習する新しいアーキテクチャを提案する。
我々は最近導入されたStarGANアーキテクチャを画像翻訳のバックボーンとして採用している。
論文 参考訳(メタデータ) (2020-01-22T23:51:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。