論文の概要: Multi-Source Domain Adaptation for Object Detection with Prototype-based
Mean-teacher
- arxiv url: http://arxiv.org/abs/2309.14950v2
- Date: Fri, 15 Dec 2023 21:00:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-19 20:09:57.925461
- Title: Multi-Source Domain Adaptation for Object Detection with Prototype-based
Mean-teacher
- Title(参考訳): プロトタイプベース平均教師によるオブジェクト検出のためのマルチソースドメイン適応
- Authors: Atif Belal, Akhil Meethal, Francisco Perdigon Romero, Marco Pedersoli,
Eric Granger
- Abstract要約: 視覚オブジェクト検出器を操作対象領域に適応させることは難しい課題であり、一般には教師なし領域適応(UDA)法を用いて達成される。
近年の研究では、ラベル付きデータセットが複数のソースドメインから来ると、それらを別々のドメインとして扱うことで、これらのソースドメインをブレンドしてUDAを実行するよりも正確性と堅牢性を向上させることが示されている。
本稿では,ドメイン特化情報の代わりにクラスプロトタイプを用いてドメイン特化情報をエンコードする,プロトタイプベース平均教師(PMT)と呼ばれる新しいMSDA手法を提案する。
- 参考スコア(独自算出の注目度): 12.462709547836289
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Adapting visual object detectors to operational target domains is a
challenging task, commonly achieved using unsupervised domain adaptation (UDA)
methods. Recent studies have shown that when the labeled dataset comes from
multiple source domains, treating them as separate domains and performing a
multi-source domain adaptation (MSDA) improves the accuracy and robustness over
blending these source domains and performing a UDA. For adaptation, existing
MSDA methods learn domain-invariant and domain-specific parameters (for each
source domain). However, unlike single-source UDA methods, learning
domain-specific parameters makes them grow significantly in proportion to the
number of source domains. This paper proposes a novel MSDA method called
Prototype-based Mean Teacher (PMT), which uses class prototypes instead of
domain-specific subnets to encode domain-specific information. These prototypes
are learned using a contrastive loss, aligning the same categories across
domains and separating different categories far apart. Given the use of
prototypes, the number of parameters required for our PMT method does not
increase significantly with the number of source domains, thus reducing memory
issues and possible overfitting. Empirical studies indicate that PMT
outperforms state-of-the-art MSDA methods on several challenging object
detection datasets. Our code is available at
https://github.com/imatif17/Prototype-Mean-Teacher.
- Abstract(参考訳): 視覚オブジェクト検出器を操作対象領域に適応させることは難しい課題であり、一般には教師なし領域適応(UDA)法を用いて達成される。
最近の研究では、ラベル付きデータセットが複数のソースドメインから来ている場合、それらを別々のドメインとして扱い、マルチソースドメイン適応(MSDA)を実行することで、これらのソースドメインをブレンドしてUDAを実行するよりも正確性と堅牢性を向上させることが示されている。
適応のために、既存のMSDAメソッドはドメイン不変およびドメイン固有パラメータ(各ソースドメイン)を学ぶ。
しかし、単一ソースのUDAメソッドとは異なり、ドメイン固有のパラメータを学習することで、ソースドメインの数に比例して大きく成長する。
本稿では,プロトタイプベース平均教師(pmt)と呼ばれる,ドメイン固有サブネットではなくクラスプロトタイプを用いて,ドメイン固有情報をエンコードする新しいmsda手法を提案する。
これらのプロトタイプは対照的な損失を用いて学習され、ドメイン間で同じカテゴリを整列させ、異なるカテゴリを遠くに分離する。
プロトタイプの使用を考えると、PMT法に必要なパラメータの数はソースドメインの数によって大きくは増加しないため、メモリの問題が少なくなり、オーバーフィッティングが可能となる。
実証研究により、PMTはいくつかの挑戦的なオブジェクト検出データセットにおいて最先端のMSDA法より優れていることが示された。
私たちのコードはhttps://github.com/imatif17/Prototype-Mean-Teacherで利用可能です。
関連論文リスト
- More is Better: Deep Domain Adaptation with Multiple Sources [34.26271755493111]
マルチソースドメイン適応(MDA)は、ラベル付きデータを異なる分布を持つ複数のソースから収集できる、強力で実用的な拡張である。
本調査では,まず様々なMDA戦略を定義し,その後,異なる視点から,深層学習時代の現代MDA手法を体系的に要約し,比較する。
論文 参考訳(メタデータ) (2024-05-01T03:37:12Z) - Subject-Based Domain Adaptation for Facial Expression Recognition [51.10374151948157]
ディープラーニングモデルを特定の対象個人に適用することは、難しい表情認識タスクである。
本稿では、FERにおける主観的ドメイン適応のための新しいMSDA手法を提案する。
複数の情報源からの情報を効率的に利用して、ディープFERモデルを単一のターゲット個人に適応させる。
論文 参考訳(メタデータ) (2023-12-09T18:40:37Z) - Noisy Universal Domain Adaptation via Divergence Optimization for Visual
Recognition [30.31153237003218]
ラベル付きソースドメインからラベル付きターゲットドメインに知識を転送する、Noisy UniDAという新しいシナリオが提案されている。
ノイズUniDAで直面するすべての課題に同時に対処するために、マルチヘッド畳み込みニューラルネットワークフレームワークが提案されている。
論文 参考訳(メタデータ) (2023-04-20T14:18:38Z) - Dynamic Instance Domain Adaptation [109.53575039217094]
教師なしのドメイン適応に関するほとんどの研究は、各ドメインのトレーニングサンプルがドメインラベルを伴っていると仮定している。
適応的な畳み込みカーネルを持つ動的ニューラルネットワークを開発し、各インスタンスにドメインに依存しない深い特徴を適応させるために、インスタンス適応残差を生成する。
我々のモデルはDIDA-Netと呼ばれ、複数の一般的な単一ソースおよび複数ソースのUDAデータセット上で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-03-09T20:05:54Z) - Multi-source Few-shot Domain Adaptation [26.725145982321287]
マルチソースドメイン適応(MDA)は、複数の完全ラベルのソースドメインから未ラベルのターゲットドメインに予測モデルを転送することを目的としている。
本稿では,Multi-source Few-shot Domain Adaptation (MFDA)について検討する。
本稿では,MSFAN(Multi-Source Few-shot Adaptation Network)と呼ばれる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-25T15:54:01Z) - Unsupervised Multi-Source Domain Adaptation for Person Re-Identification [39.817734080890695]
unsupervised domain adaptation (uda) method for person re-idification (re-id) ラベル付きソースデータからラベル付きターゲットデータへの再id知識の転送を目的としている。
マルチソースの概念を UDA person re-ID フィールドに導入し、トレーニング中に複数のソースデータセットを使用する。
提案手法は,最先端のuda person re-idメソッドを高いマージンで上回り,後処理手法を使わずに教師付きアプローチに匹敵する性能を実現する。
論文 参考訳(メタデータ) (2021-04-27T03:33:35Z) - Dynamic Transfer for Multi-Source Domain Adaptation [82.54405157719641]
モデルパラメータがサンプルに適合する領域の競合に対処するために動的転送を提案する。
ソースドメインの障壁を壊し、マルチソースドメインを単一ソースドメインに変換する。
実験の結果, ドメインラベルを使わずに, 動的移動は最先端の手法よりも3%以上優れていた。
論文 参考訳(メタデータ) (2021-03-19T01:22:12Z) - Multi-source Domain Adaptation in the Deep Learning Era: A Systematic
Survey [53.656086832255944]
マルチソースドメイン適応(MDA)は、ラベル付きデータを複数のソースから収集できる強力な拡張である。
MDAは学術と産業の両方で注目を集めている。
論文 参考訳(メタデータ) (2020-02-26T08:07:58Z) - MADAN: Multi-source Adversarial Domain Aggregation Network for Domain
Adaptation [58.38749495295393]
ドメイン適応は、あるラベル付きソースドメインと、わずかにラベル付けまたはラベル付けされていないターゲットドメインの間のドメインシフトをブリッジするために、転送可能なモデルを学ぶことを目的としています。
近年のマルチソース領域適応法(MDA)では,ソースとターゲット間の画素レベルのアライメントは考慮されていない。
これらの課題に対処するための新しいMDAフレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-19T21:22:00Z) - Multi-source Domain Adaptation for Visual Sentiment Classification [92.53780541232773]
マルチソース・ドメイン適応(MDA)手法をMSGAN(Multi-source Sentiment Generative Adversarial Network)と呼ぶ。
複数のソースドメインからのデータを扱うために、MSGANはソースドメインとターゲットドメインの両方のデータが同じ分布を共有する、統一された感情潜在空間を見つけることを学ぶ。
4つのベンチマークデータセットで実施された大規模な実験により、MSGANは視覚的感情分類のための最先端のMDAアプローチよりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2020-01-12T08:37:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。