論文の概要: Unbiased Mean Teacher for Cross-domain Object Detection
- arxiv url: http://arxiv.org/abs/2003.00707v2
- Date: Wed, 23 Jun 2021 00:53:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-27 05:25:20.578398
- Title: Unbiased Mean Teacher for Cross-domain Object Detection
- Title(参考訳): クロスドメインオブジェクト検出のための無バイアス平均教師
- Authors: Jinhong Deng, Wen Li, Yuhua Chen, Lixin Duan
- Abstract要約: オブジェクト検出モデルはデータ分散に弱いことが多いため、ドメイン間のオブジェクト検出は困難である。
クロスドメインオブジェクト検出のためのUnbiased Mean Teacher (UMT)モデルを提案する。
我々のUTTモデルは、ベンチマークデータセット上で44.1%、58.1%、41.7%、43.1%のmAPを達成している。
- 参考スコア(独自算出の注目度): 46.75177193771992
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cross-domain object detection is challenging, because object detection model
is often vulnerable to data variance, especially to the considerable domain
shift between two distinctive domains. In this paper, we propose a new Unbiased
Mean Teacher (UMT) model for cross-domain object detection. We reveal that
there often exists a considerable model bias for the simple mean teacher (MT)
model in cross-domain scenarios, and eliminate the model bias with several
simple yet highly effective strategies. In particular, for the teacher model,
we propose a cross-domain distillation method for MT to maximally exploit the
expertise of the teacher model. Moreover, for the student model, we alleviate
its bias by augmenting training samples with pixel-level adaptation. Finally,
for the teaching process, we employ an out-of-distribution estimation strategy
to select samples that most fit the current model to further enhance the
cross-domain distillation process. By tackling the model bias issue with these
strategies, our UMT model achieves mAPs of 44.1%, 58.1%, 41.7%, and 43.1% on
benchmark datasets Clipart1k, Watercolor2k, Foggy Cityscapes, and Cityscapes,
respectively, which outperforms the existing state-of-the-art results in
notable margins. Our implementation is available at
https://github.com/kinredon/umt.
- Abstract(参考訳): オブジェクト検出モデルはデータ分散、特に2つの異なるドメイン間のかなりの領域シフトに対して脆弱であることが多いため、ドメイン間のオブジェクト検出は困難である。
本稿では,ドメイン間オブジェクト検出のためのUnbiased Mean Teacher (UMT)モデルを提案する。
我々は、ドメイン横断シナリオにおいて、単純な平均教師(MT)モデルに対してかなりのモデルバイアスが存在することを明らかにする。
特に,教師モデルにおいて,教師モデルの専門知識を最大限活用するためのMTのクロスドメイン蒸留法を提案する。
さらに,学生モデルでは,画素レベルの適応でトレーニングサンプルを増強することにより,バイアスを軽減する。
最後に, 現状モデルに最も適合する試料を選別し, クロスドメイン蒸留プロセスをさらに強化するために, アウト・オブ・ディストリビューション推定手法を用いる。
これらの戦略でモデルバイアスの問題に取り組むことで、我々のumtモデルは、ベンチマークデータセットであるclipart1k、watercolor2k、fogggy cityscapes、cityscapes上で44.1%、58.1%、41.7%、43.1%のマップをそれぞれ達成し、既存の最先端の成果を上回っている。
私たちの実装はhttps://github.com/kinredon/umtで利用可能です。
関連論文リスト
- COFT-AD: COntrastive Fine-Tuning for Few-Shot Anomaly Detection [19.946344683965425]
FSADの課題に対処する新しい手法を提案する。
重みをモデル化するために、大規模なソースデータセットで事前トレーニングされたモデルを使用します。
提案手法の有効性を示すために,3つの制御されたADタスクと4つの実世界のADタスクに対して,数発の異常検出を行った。
論文 参考訳(メタデータ) (2024-02-29T09:48:19Z) - Variational Continual Test-Time Adaptation [25.262385466354253]
事前のドリフトは、ラベルのないテストデータのみを使用するCTTA(Continuous Test-Time Adaptation)メソッドにおいて重要である。
我々はCTTAにおける不確実性を測定するための変分ベイズ的アプローチであるVCoTTAを紹介する。
3つのデータセットによる実験結果から, ドリフト前の緩和効果が示された。
論文 参考訳(メタデータ) (2024-02-13T02:41:56Z) - Mitigate Domain Shift by Primary-Auxiliary Objectives Association for
Generalizing Person ReID [39.98444065846305]
ReIDモデルは、インスタンス分類の目的に関するトレーニングを通じてのみドメイン不変表現を学ぶのに苦労します。
本稿では,弱いラベル付き歩行者唾液度検出のための補助学習目標を用いて,プライマリReIDインスタンス分類目標のモデル学習を指導する手法を提案する。
我々のモデルは、最近のテストタイムダイアグラムで拡張してPAOA+を形成し、補助的な目的に対してオンザフライ最適化を行うことができる。
論文 参考訳(メタデータ) (2023-10-24T15:15:57Z) - Phasic Content Fusing Diffusion Model with Directional Distribution
Consistency for Few-Shot Model Adaption [73.98706049140098]
本稿では,方向分布の整合性を損なう少数ショット拡散モデルを用いた新しいファシックコンテンツを提案する。
具体的には、ファシックコンテンツ融合を用いたファシックトレーニング戦略を設計し、tが大きければ、モデルがコンテンツやスタイル情報を学ぶのに役立てる。
最後に、ドメイン適応時の構造整合性を高めるクロスドメイン構造ガイダンス戦略を提案する。
論文 参考訳(メタデータ) (2023-09-07T14:14:11Z) - Universal Domain Adaptation from Foundation Models: A Baseline Study [58.51162198585434]
基礎モデルを用いた最先端UniDA手法の実証的研究を行った。
CLIPモデルからターゲット知識を抽出するためのパラメータフリーな手法であるtextitCLIP 蒸留を導入する。
単純な手法ではあるが、ほとんどのベンチマークタスクでは従来の手法よりも優れている。
論文 参考訳(メタデータ) (2023-05-18T16:28:29Z) - Investigating Ensemble Methods for Model Robustness Improvement of Text
Classifiers [66.36045164286854]
既存のバイアス機能を分析し、すべてのケースに最適なモデルが存在しないことを実証します。
適切なバイアスモデルを選択することで、より洗練されたモデル設計でベースラインよりもロバスト性が得られる。
論文 参考訳(メタデータ) (2022-10-28T17:52:10Z) - Adapting the Mean Teacher for keypoint-based lung registration under
geometric domain shifts [75.51482952586773]
ディープニューラルネットワークは一般的に、ラベル付きトレーニングデータが多く必要であり、トレーニングデータとテストデータの間のドメインシフトに弱い。
本稿では,ラベル付きソースからラベル付きターゲットドメインへのモデルの適用により,画像登録のための幾何学的領域適応手法を提案する。
本手法は,ベースラインモデルの精度を目標データに適合させながら,ベースラインモデルの50%/47%を継続的に改善する。
論文 参考訳(メタデータ) (2022-07-01T12:16:42Z) - Anomaly Detection via Reverse Distillation from One-Class Embedding [2.715884199292287]
教師エンコーダと生徒デコーダからなる新しいT-Sモデルを提案する。
生画像を直接受信する代わりに、学生ネットワークは教師モデルの1クラス埋め込みを入力として取り込む。
さらに、T-Sモデルにトレーニング可能な1クラスボトルネック埋め込みモジュールを導入する。
論文 参考訳(メタデータ) (2022-01-26T01:48:37Z) - Contrastive Neighborhood Alignment [81.65103777329874]
本稿では,学習特徴のトポロジを維持するための多様体学習手法であるContrastive Neighborhood Alignment(CNA)を提案する。
対象モデルは、対照的な損失を用いて、ソース表現空間の局所構造を模倣することを目的としている。
CNAは3つのシナリオで説明される: 多様体学習、モデルが元のデータの局所的なトポロジーを次元還元された空間で維持する、モデル蒸留、小さな学生モデルがより大きな教師を模倣するために訓練される、レガシーモデル更新、より強力なモデルに置き換えられる、という3つのシナリオである。
論文 参考訳(メタデータ) (2022-01-06T04:58:31Z) - Cross-Domain Object Detection via Adaptive Self-Training [45.48690932743266]
適応的無バイアス教師(AUT)という自己学習フレームワークを提案する。
AUTは、ドメインシフトに対処するために、逆学習と弱い強度データ拡張を使用する。
私たちは、AUTが既存のすべてのアプローチやOracle(完全に監督された)モデルよりも大きなマージンで優れていることを示しています。
論文 参考訳(メタデータ) (2021-11-25T18:50:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。