論文の概要: Multi-Source Domain Adaptation for Object Detection with Prototype-based
Mean-teacher
- arxiv url: http://arxiv.org/abs/2309.14950v1
- Date: Tue, 26 Sep 2023 14:08:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-27 13:35:20.567675
- Title: Multi-Source Domain Adaptation for Object Detection with Prototype-based
Mean-teacher
- Title(参考訳): プロトタイプベース平均教師によるオブジェクト検出のためのマルチソースドメイン適応
- Authors: Atif Belal, Akhil Meethal, Francisco Perdigon Romero, Marco Pedersoli,
Eric Granger
- Abstract要約: 本稿では,プロトタイプベース平均教師(PMT)と呼ばれる新しいMSDA手法を提案する。
PMTはドメイン固有情報を保存するためにドメイン固有情報の代わりにクラスプロトタイプを使用する。
プロトタイプの使用により,本手法のパラメータサイズは,ソースドメイン数によって大きくは増加しない。
- 参考スコア(独自算出の注目度): 12.462709547836289
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Adapting visual object detectors to operational target domains is a
challenging task, commonly achieved using unsupervised domain adaptation (UDA)
methods. When the labeled dataset is coming from multiple source domains,
treating them as separate domains and performing a multi-source domain
adaptation (MSDA) improves the accuracy and robustness over mixing these source
domains and performing a UDA, as observed by recent studies in MSDA. Existing
MSDA methods learn domain invariant and domain-specific parameters (for each
source domain) for the adaptation. However, unlike single-source UDA methods,
learning domain-specific parameters makes them grow significantly proportional
to the number of source domains used. This paper proposes a novel MSDA method
called Prototype-based Mean-Teacher (PMT), which uses class prototypes instead
of domain-specific subnets to preserve domain-specific information. These
prototypes are learned using a contrastive loss, aligning the same categories
across domains and separating different categories far apart. Because of the
use of prototypes, the parameter size of our method does not increase
significantly with the number of source domains, thus reducing memory issues
and possible overfitting. Empirical studies show PMT outperforms
state-of-the-art MSDA methods on several challenging object detection datasets.
- Abstract(参考訳): 視覚オブジェクト検出器を操作対象領域に適応させることは難しい課題であり、一般には教師なし領域適応(UDA)法を用いて達成される。
ラベル付きデータセットが複数のソースドメインから来て、別々のドメインとして扱い、マルチソースドメイン適応(MSDA)を実行すると、MSDAの最近の研究で見られるように、これらのソースドメインを混合し、UDAを実行するよりも精度と堅牢性が向上する。
既存のmsdaメソッドは、適応のためにドメイン不変およびドメイン固有パラメータ(各ソースドメイン)を学習する。
しかし、単一ソースのUDAメソッドとは異なり、ドメイン固有のパラメータを学習することで、使用するソースドメインの数に比例して大きく成長する。
本稿では,ドメイン固有サブネットの代わりにクラスプロトタイプを用いてドメイン固有情報を保存する,プロトタイプベース平均教師(PMT)と呼ばれる新しいMSDA手法を提案する。
これらのプロトタイプは対照的な損失を用いて学習され、ドメイン間で同じカテゴリを整列させ、異なるカテゴリを遠くに分離する。
プロトタイプの使用により,提案手法のパラメータサイズはソースドメイン数によって大きくは増加せず,メモリ問題が少なくなり,オーバーフィッティングが可能となった。
実験的な研究により、PMTはいくつかの困難なオブジェクト検出データセットにおいて最先端のMSDA法より優れていることが示された。
関連論文リスト
- More is Better: Deep Domain Adaptation with Multiple Sources [34.26271755493111]
マルチソースドメイン適応(MDA)は、ラベル付きデータを異なる分布を持つ複数のソースから収集できる、強力で実用的な拡張である。
本調査では,まず様々なMDA戦略を定義し,その後,異なる視点から,深層学習時代の現代MDA手法を体系的に要約し,比較する。
論文 参考訳(メタデータ) (2024-05-01T03:37:12Z) - Subject-Based Domain Adaptation for Facial Expression Recognition [51.10374151948157]
ディープラーニングモデルを特定の対象個人に適用することは、難しい表情認識タスクである。
本稿では、FERにおける主観的ドメイン適応のための新しいMSDA手法を提案する。
複数の情報源からの情報を効率的に利用して、ディープFERモデルを単一のターゲット個人に適応させる。
論文 参考訳(メタデータ) (2023-12-09T18:40:37Z) - Noisy Universal Domain Adaptation via Divergence Optimization for Visual
Recognition [30.31153237003218]
ラベル付きソースドメインからラベル付きターゲットドメインに知識を転送する、Noisy UniDAという新しいシナリオが提案されている。
ノイズUniDAで直面するすべての課題に同時に対処するために、マルチヘッド畳み込みニューラルネットワークフレームワークが提案されている。
論文 参考訳(メタデータ) (2023-04-20T14:18:38Z) - Dynamic Instance Domain Adaptation [109.53575039217094]
教師なしのドメイン適応に関するほとんどの研究は、各ドメインのトレーニングサンプルがドメインラベルを伴っていると仮定している。
適応的な畳み込みカーネルを持つ動的ニューラルネットワークを開発し、各インスタンスにドメインに依存しない深い特徴を適応させるために、インスタンス適応残差を生成する。
我々のモデルはDIDA-Netと呼ばれ、複数の一般的な単一ソースおよび複数ソースのUDAデータセット上で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-03-09T20:05:54Z) - Multi-source Few-shot Domain Adaptation [26.725145982321287]
マルチソースドメイン適応(MDA)は、複数の完全ラベルのソースドメインから未ラベルのターゲットドメインに予測モデルを転送することを目的としている。
本稿では,Multi-source Few-shot Domain Adaptation (MFDA)について検討する。
本稿では,MSFAN(Multi-Source Few-shot Adaptation Network)と呼ばれる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-25T15:54:01Z) - Unsupervised Multi-Source Domain Adaptation for Person Re-Identification [39.817734080890695]
unsupervised domain adaptation (uda) method for person re-idification (re-id) ラベル付きソースデータからラベル付きターゲットデータへの再id知識の転送を目的としている。
マルチソースの概念を UDA person re-ID フィールドに導入し、トレーニング中に複数のソースデータセットを使用する。
提案手法は,最先端のuda person re-idメソッドを高いマージンで上回り,後処理手法を使わずに教師付きアプローチに匹敵する性能を実現する。
論文 参考訳(メタデータ) (2021-04-27T03:33:35Z) - Dynamic Transfer for Multi-Source Domain Adaptation [82.54405157719641]
モデルパラメータがサンプルに適合する領域の競合に対処するために動的転送を提案する。
ソースドメインの障壁を壊し、マルチソースドメインを単一ソースドメインに変換する。
実験の結果, ドメインラベルを使わずに, 動的移動は最先端の手法よりも3%以上優れていた。
論文 参考訳(メタデータ) (2021-03-19T01:22:12Z) - Multi-source Domain Adaptation in the Deep Learning Era: A Systematic
Survey [53.656086832255944]
マルチソースドメイン適応(MDA)は、ラベル付きデータを複数のソースから収集できる強力な拡張である。
MDAは学術と産業の両方で注目を集めている。
論文 参考訳(メタデータ) (2020-02-26T08:07:58Z) - MADAN: Multi-source Adversarial Domain Aggregation Network for Domain
Adaptation [58.38749495295393]
ドメイン適応は、あるラベル付きソースドメインと、わずかにラベル付けまたはラベル付けされていないターゲットドメインの間のドメインシフトをブリッジするために、転送可能なモデルを学ぶことを目的としています。
近年のマルチソース領域適応法(MDA)では,ソースとターゲット間の画素レベルのアライメントは考慮されていない。
これらの課題に対処するための新しいMDAフレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-19T21:22:00Z) - Multi-source Domain Adaptation for Visual Sentiment Classification [92.53780541232773]
マルチソース・ドメイン適応(MDA)手法をMSGAN(Multi-source Sentiment Generative Adversarial Network)と呼ぶ。
複数のソースドメインからのデータを扱うために、MSGANはソースドメインとターゲットドメインの両方のデータが同じ分布を共有する、統一された感情潜在空間を見つけることを学ぶ。
4つのベンチマークデータセットで実施された大規模な実験により、MSGANは視覚的感情分類のための最先端のMDAアプローチよりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2020-01-12T08:37:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。