論文の概要: Spectral Unsupervised Domain Adaptation for Visual Recognition
- arxiv url: http://arxiv.org/abs/2106.06112v1
- Date: Fri, 11 Jun 2021 01:31:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-15 05:01:43.104441
- Title: Spectral Unsupervised Domain Adaptation for Visual Recognition
- Title(参考訳): スペクトル非教師なし領域適応による視覚認識
- Authors: Jingyi Zhang, Jiaxing Huang and Shijian Lu
- Abstract要約: 教師なしドメイン適応(UDA)は、1つまたは複数の関連するソースドメインからラベル付きデータを活用することにより、ラベルなしのターゲットドメインで十分にパフォーマンスの高いモデルを学ぶことを目的としている。
本稿では、スペクトル空間で機能し、検出、分類、セグメンテーションにおいて様々な視覚認識タスクにまたがる、効率的かつ効率的なUDA技術であるSpectral UDA(SUDA)を提案する。
- 参考スコア(独自算出の注目度): 43.04467182860468
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Unsupervised domain adaptation (UDA) aims to learn a well-performed model in
an unlabeled target domain by leveraging labeled data from one or multiple
related source domains. It remains a great challenge due to 1) the lack of
annotations in the target domain and 2) the rich discrepancy between the
distributions of source and target data. We propose Spectral UDA (SUDA), an
efficient yet effective UDA technique that works in the spectral space and is
generic across different visual recognition tasks in detection, classification
and segmentation. SUDA addresses UDA challenges from two perspectives. First,
it mitigates inter-domain discrepancies by a spectrum transformer (ST) that
maps source and target images into spectral space and learns to enhance
domain-invariant spectra while suppressing domain-variant spectra
simultaneously. To this end, we design novel adversarial multi-head spectrum
attention that leverages contextual information to identify domain-variant and
domain-invariant spectra effectively. Second, it mitigates the lack of
annotations in target domain by introducing multi-view spectral learning which
aims to learn comprehensive yet confident target representations by maximizing
the mutual information among multiple ST augmentations capturing different
spectral views of each target sample. Extensive experiments over different
visual tasks (e.g., detection, classification and segmentation) show that SUDA
achieves superior accuracy and it is also complementary with state-of-the-art
UDA methods with consistent performance boosts but little extra computation.
- Abstract(参考訳): unsupervised domain adaptation (uda) は、1つまたは複数の関連するソースドメインのラベル付きデータを活用することで、ラベルなしのターゲットドメインでうまく表現されたモデルを学ぶことを目的としている。
1) 対象領域におけるアノテーションの欠如,2) ソースとターゲットデータの分布のばらつきが豊富であるため,依然として大きな課題である。
本稿では、スペクトル空間で機能し、検出、分類、セグメンテーションにおいて様々な視覚認識タスクにまたがる、効率的かつ効率的なUDA技術であるSpectral UDA(SUDA)を提案する。
SuDAは2つの観点からUDAの課題に対処する。
まず、ソース画像とターゲット画像をスペクトル空間にマッピングし、ドメイン不変スペクトルを同時に抑制しながらドメイン不変スペクトルを強化するスペクトル変換器(ST)によりドメイン間不一致を緩和する。
この目的のために、コンテキスト情報を利用してドメイン不変およびドメイン不変のスペクトルを効果的に識別する新しい逆多重ヘッドスペクトルアテンションを設計する。
第2に、多視点スペクトル学習を導入し、各対象試料の異なるスペクトルビューをキャプチャする複数のSTオーグメンテーション間の相互情報を最大化し、包括的かつ確実なターゲット表現を学習することを目的とする。
異なる視覚的タスク(例えば、検出、分類、セグメンテーション)に対する広範囲な実験は、SUDAが優れた精度を達成し、一貫した性能向上と余分な計算の少ない最先端のUDA手法と相補的であることを示している。
関連論文リスト
- Improving Anomaly Segmentation with Multi-Granularity Cross-Domain
Alignment [17.086123737443714]
異常セグメンテーションは、画像中の非定型物体を識別する上で重要な役割を担っている。
既存の手法は合成データに顕著な結果を示すが、合成データドメインと実世界のデータドメインの相違を考慮できないことが多い。
シーンと個々のサンプルレベルの両方で、ドメイン間の機能を調和させるのに適した、マルチグラニュラリティ・クロスドメインアライメントフレームワークを導入します。
論文 参考訳(メタデータ) (2023-08-16T22:54:49Z) - Enhancing Visual Domain Adaptation with Source Preparation [5.287588907230967]
ドメイン適応技術は、ソースドメイン自体の特性を考慮できません。
本稿では,ソース領域バイアスを軽減する手法であるソース準備(SP)を提案する。
また,ベースライン上のmIoUでは最大40.64%の改善が見られた。
論文 参考訳(メタデータ) (2023-06-16T18:56:44Z) - Robust Domain Adaptive Object Detection with Unified Multi-Granularity
Alignment [73.51219388590161]
ドメイン適応検出は、ターゲットドメイン上の検出器の一般化を改善することを目的としている。
近年のアプローチは、異なる粒度の特徴アライメントを通じて、逆学習を通じてドメイン適応を実現する。
ドメイン不変な特徴学習のための統合多重粒度アライメント(MGA)に基づく検出フレームワークを提案する。
論文 参考訳(メタデータ) (2023-01-01T08:38:07Z) - Joint Attention-Driven Domain Fusion and Noise-Tolerant Learning for
Multi-Source Domain Adaptation [2.734665397040629]
マルチソースUnsupervised Domain Adaptationはラベル付きデータを持つ複数のソースドメインからラベル付きターゲットドメインに知識を転送する。
異なるドメインとターゲットドメイン内のノイズの多い擬似ラベル間の分散の相違は、どちらもパフォーマンスのボトルネックにつながる。
本稿では,意識駆動型ドメイン融合(ADNT)と雑音耐性学習(ADNT)を統合し,上記の2つの問題に対処するアプローチを提案する。
論文 参考訳(メタデータ) (2022-08-05T01:08:41Z) - Frequency Spectrum Augmentation Consistency for Domain Adaptive Object
Detection [107.52026281057343]
周波数スペクトル拡張整合(FSAC)フレームワークを4種類の低周波フィルタで構成する。
最初の段階では、オリジナルおよび拡張されたソースデータを全て利用して、オブジェクト検出器を訓練する。
第2段階では、予測一貫性のための自己学習を行うために、擬似ラベル付き拡張現実とターゲットデータを採用する。
論文 参考訳(メタデータ) (2021-12-16T04:07:01Z) - AFAN: Augmented Feature Alignment Network for Cross-Domain Object
Detection [90.18752912204778]
オブジェクト検出のための教師なしドメイン適応は、多くの現実世界のアプリケーションにおいて難しい問題である。
本稿では、中間領域画像生成とドメイン・アドバイザリー・トレーニングを統合した新しい機能アライメント・ネットワーク(AFAN)を提案する。
提案手法は、類似および異種ドメイン適応の双方において、標準ベンチマークにおける最先端の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2021-06-10T05:01:20Z) - Adversarial Dual Distinct Classifiers for Unsupervised Domain Adaptation [67.83872616307008]
Unversarial Domain adaptation (UDA)は、異なる分散されたラベル付きソースドメインから学習モデルを構築することで、ラベルなしのターゲットサンプルを認識しようとする。
本稿では,タスク固有のカテゴリ境界に一致するソースとターゲット領域のデータ分布を同時に整合させる新しいアドリラルデュアル・ディスタンス・ネットワーク(AD$2$CN)を提案する。
具体的には、ドメイン不変の特徴発生器を利用して、識別的クロスドメインアライメントのガイダンスにより、ソースとターゲットデータを潜在共通空間に埋め込む。
論文 参考訳(メタデータ) (2020-08-27T01:29:10Z) - Multi-source Domain Adaptation for Visual Sentiment Classification [92.53780541232773]
マルチソース・ドメイン適応(MDA)手法をMSGAN(Multi-source Sentiment Generative Adversarial Network)と呼ぶ。
複数のソースドメインからのデータを扱うために、MSGANはソースドメインとターゲットドメインの両方のデータが同じ分布を共有する、統一された感情潜在空間を見つけることを学ぶ。
4つのベンチマークデータセットで実施された大規模な実験により、MSGANは視覚的感情分類のための最先端のMDAアプローチよりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2020-01-12T08:37:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。