論文の概要: Cross-Domain Object Detection with Mean-Teacher Transformer
- arxiv url: http://arxiv.org/abs/2205.01643v1
- Date: Tue, 3 May 2022 17:11:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-04 14:50:01.274699
- Title: Cross-Domain Object Detection with Mean-Teacher Transformer
- Title(参考訳): 平均教師変換器を用いたクロスドメイン物体検出
- Authors: Jinze Yu, Jiaming Liu, Xiaobao Wei, Haoyi Zhou, Yohei Nakata, Denis
Gudovskiy, Tomoyuki Okuno, Jianxin Li, Kurt Keutzer, Shanghang Zhang
- Abstract要約: 平均教師知識伝達(MTKT)に基づくエンドツーエンドのクロスドメイン検出変換器を提案する。
本稿では,ドメインクエリベースの特徴アライメント (DQFA) やバイレベルグラフベースのプロトタイプアライメント (BGPA) ,トークンワイド画像特徴アライメント (TIFA) など,トランスフォーマーのアーキテクチャに基づく3つのレベルの特徴アライメント戦略を設計する。
特にSim10kからCityscapesのシナリオは52.6mAPから57.9mAPに大幅に改善されている。
- 参考スコア(独自算出の注目度): 43.486392965014105
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, DEtection TRansformer (DETR), an end-to-end object detection
pipeline, has achieved promising performance. However, it requires large-scale
labeled data and suffers from domain shift, especially when no labeled data is
available in the target domain. To solve this problem, we propose an end-to-end
cross-domain detection transformer based on the mean teacher knowledge transfer
(MTKT), which transfers knowledge between domains via pseudo labels. To improve
the quality of pseudo labels in the target domain, which is a crucial factor
for better domain adaptation, we design three levels of source-target feature
alignment strategies based on the architecture of the Transformer, including
domain query-based feature alignment (DQFA), bi-level-graph-based prototype
alignment (BGPA), and token-wise image feature alignment (TIFA). These three
levels of feature alignment match the global, local, and instance features
between source and target, respectively. With these strategies, more accurate
pseudo labels can be obtained, and knowledge can be better transferred from
source to target, thus improving the cross-domain capability of the detection
transformer. Extensive experiments demonstrate that our proposed method
achieves state-of-the-art performance on three domain adaptation scenarios,
especially the result of Sim10k to Cityscapes scenario is remarkably improved
from 52.6 mAP to 57.9 mAP. Code will be released.
- Abstract(参考訳): 近年,エンドツーエンドのオブジェクト検出パイプラインであるDetection TRansformer (DETR) が有望な性能を達成した。
しかし、大規模なラベル付きデータが必要であり、特にターゲットドメインでラベル付きデータが利用できない場合、ドメインシフトに苦しむ。
この問題を解決するために,擬似ラベルを用いてドメイン間で知識を伝達する平均教師知識伝達(MTKT)に基づくエンドツーエンドのクロスドメイン検出変換器を提案する。
対象領域における擬似ラベルの品質を向上させるため,我々は,ドメインクエリに基づく機能アライメント (dqfa),bi-level-graph-based prototype alignment (bgpa),token-wise image feature alignment (tifa) という,トランスフォーマのアーキテクチャに基づく3段階のソースターゲット機能アライメント戦略を設計する。
これら3つのレベルの機能アライメントは、それぞれソースとターゲットのグローバル、ローカル、インスタンスの特徴にマッチする。
これらの戦略により、より正確な擬似ラベルを得ることができ、知識をソースからターゲットへよりよく転送できるため、検出トランスのクロスドメイン能力が向上する。
広範な実験により,提案手法が3つのドメイン適応シナリオにおいて最先端の性能を実現することを実証した。特にシム10kのシティスケープシナリオの結果は,52.6マップから57.9マップに著しく向上した。
コードはリリースされる。
関連論文リスト
- DATR: Unsupervised Domain Adaptive Detection Transformer with Dataset-Level Adaptation and Prototypical Alignment [7.768332621617199]
我々は、オブジェクト検出の教師なし領域適応のために、ドメイン適応検出TRansformer(DATR)と呼ばれる強力なDETRベースの検出器を導入する。
提案するDATRは,教師モデルによって生成された擬似ラベルを用いて,平均教師に基づく自己学習フレームワークを組み込んで,ドメインバイアスをさらに緩和する。
複数のドメイン適応シナリオにおいて,提案したDATRの性能と一般化性を示す実験を行った。
論文 参考訳(メタデータ) (2024-05-20T03:48:45Z) - Exploring Consistency in Cross-Domain Transformer for Domain Adaptive
Semantic Segmentation [51.10389829070684]
ドメインギャップは、自己注意の相違を引き起こす可能性がある。
このギャップのため、変圧器は、ターゲット領域の精度を低下させる刺激領域または画素に付随する。
ドメイン横断の注意層を持つアテンションマップに適応する。
論文 参考訳(メタデータ) (2022-11-27T02:40:33Z) - CA-UDA: Class-Aware Unsupervised Domain Adaptation with Optimal
Assignment and Pseudo-Label Refinement [84.10513481953583]
教師なしドメイン適応(Unsupervised domain adapt, UDA)は、ターゲットデータに欠けているラベルのサロゲートとして、優れた擬似ラベルの選択に焦点を当てる。
ソースとターゲットドメインの共有ネットワークが通常、擬似ラベルの選択に使用されるため、擬似ラベルを劣化させるソースドメインバイアスは依然として存在する。
本稿では, 擬似ラベルの品質向上のためのCA-UDAを提案し, 最適課題, 擬似ラベル改善戦略, クラス対応ドメインアライメントを提案する。
論文 参考訳(メタデータ) (2022-05-26T18:45:04Z) - Improving Transferability for Domain Adaptive Detection Transformers [34.61314708197079]
本稿では,ドメインシフト設定に基づくDETR型検出器を用いた,シンプルで効果的なベースラインの構築を目的とする。
ひとつは、バックボーン上のドメインシフトを緩和し、デコーダ出力が望ましい結果を得るのに優れていることです。
また、両方の部分における高度なドメインアライメント手法により、パフォーマンスがさらに向上する。
論文 参考訳(メタデータ) (2022-04-29T16:27:10Z) - CDTrans: Cross-domain Transformer for Unsupervised Domain Adaptation [44.06904757181245]
Unsupervised domain adapt (UDA) は、ラベル付きソースドメインから異なるラベル付きターゲットドメインに学習した知識を転送することを目的としている。
カテゴリレベルに基づくUDAの根本的な問題は、ターゲットドメインのサンプル用の擬似ラベルの生成である。
我々は,対象サンプルの擬似ラベルを生成するために,双方向中心認識ラベルアルゴリズムを設計する。
擬似ラベルとともに、ソース/ターゲット特徴学習とソース/ターゲット領域アライメントに自己アテンションとクロスアテンションを適用するために、ウェイトシェアリング・トリプルブランチ・トランスフォーマー・フレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-13T17:59:07Z) - Exploring Sequence Feature Alignment for Domain Adaptive Detection
Transformers [141.70707071815653]
本稿では,検出変圧器の適応に特化して設計された新しいシーケンス特徴アライメント(SFA)法を提案する。
SFAはドメインクエリベースの機能アライメント(DQFA)モジュールとトークンワイド機能アライメント(TDA)モジュールで構成される。
3つの挑戦的なベンチマーク実験により、SFAは最先端のドメイン適応オブジェクト検出方法より優れていることが示された。
論文 参考訳(メタデータ) (2021-07-27T07:17:12Z) - Instance Level Affinity-Based Transfer for Unsupervised Domain
Adaptation [74.71931918541748]
ILA-DAと呼ばれる適応中のソースからターゲットへの転送に対するインスタンス親和性に基づく基準を提案する。
まず、ソースとターゲットをまたいだ類似および異種サンプルを抽出し、マルチサンプルのコントラスト損失を利用してドメインアライメントプロセスを駆動する信頼性が高く効率的な手法を提案する。
ILA-DAの有効性は、様々なベンチマークデータセットに対する一般的なドメイン適応手法よりも精度が一貫した改善を観察することによって検証する。
論文 参考訳(メタデータ) (2021-04-03T01:33:14Z) - Disentanglement-based Cross-Domain Feature Augmentation for Effective
Unsupervised Domain Adaptive Person Re-identification [87.72851934197936]
Unsupervised Domain Adaptive (UDA) Person Re-identification (ReID) は、ラベル付きソースドメインからラベル付きターゲットドメインへ知識を転送することを目的としている。
ひとつの課題は、トレーニング用に信頼できるラベルでターゲットドメインサンプルを生成する方法だ。
ディスタングルメントに基づくクロスドメイン機能拡張戦略を提案する。
論文 参考訳(メタデータ) (2021-03-25T15:28:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。