論文の概要: iFAN: Image-Instance Full Alignment Networks for Adaptive Object
Detection
- arxiv url: http://arxiv.org/abs/2003.04132v1
- Date: Mon, 9 Mar 2020 13:27:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-25 09:11:40.597409
- Title: iFAN: Image-Instance Full Alignment Networks for Adaptive Object
Detection
- Title(参考訳): iFAN: 適応オブジェクト検出のためのイメージインスタンスフルアライメントネットワーク
- Authors: Chenfan Zhuang, Xintong Han, Weilin Huang, Matthew R. Scott
- Abstract要約: iFANは、イメージレベルとインスタンスレベルの両方で、機能の分散を正確に調整することを目的としている。
ソースのみのベースライン上で10%以上のAPで、最先端のメソッドよりも優れています。
- 参考スコア(独自算出の注目度): 48.83883375118966
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Training an object detector on a data-rich domain and applying it to a
data-poor one with limited performance drop is highly attractive in industry,
because it saves huge annotation cost. Recent research on unsupervised domain
adaptive object detection has verified that aligning data distributions between
source and target images through adversarial learning is very useful. The key
is when, where and how to use it to achieve best practice. We propose
Image-Instance Full Alignment Networks (iFAN) to tackle this problem by
precisely aligning feature distributions on both image and instance levels: 1)
Image-level alignment: multi-scale features are roughly aligned by training
adversarial domain classifiers in a hierarchically-nested fashion. 2) Full
instance-level alignment: deep semantic information and elaborate instance
representations are fully exploited to establish a strong relationship among
categories and domains. Establishing these correlations is formulated as a
metric learning problem by carefully constructing instance pairs.
Above-mentioned adaptations can be integrated into an object detector (e.g.
Faster RCNN), resulting in an end-to-end trainable framework where multiple
alignments can work collaboratively in a coarse-tofine manner. In two domain
adaptation tasks: synthetic-to-real (SIM10K->Cityscapes) and normal-to-foggy
weather (Cityscapes->Foggy Cityscapes), iFAN outperforms the state-of-the-art
methods with a boost of 10%+ AP over the source-only baseline.
- Abstract(参考訳): データリッチなドメインでオブジェクト検出器をトレーニングし、パフォーマンスの低下が制限されたデータポアにそれを適用することは、業界において非常に魅力的なことです。
教師なし領域適応オブジェクト検出に関する最近の研究は、逆学習によるソースとターゲット画像間のデータ分布の整合が極めて有用であることを検証している。
重要なのは、いつ、どこで、どのようにベストプラクティスを達成するかです。
画像とインスタンスレベルの特徴分布を正確に整合させることにより、この問題に対処するための画像インスタンスフルアライメントネットワーク(iFAN)を提案する。
1) 画像レベルのアライメント: マルチスケールな特徴は, 階層的な手法で, 敵ドメイン分類器の訓練によって概ね整列する。
2) 完全なインスタンスレベルのアライメント: カテゴリとドメイン間の強い関係を確立するために、深いセマンティック情報と精巧なインスタンス表現が完全に活用される。
これらの相関関係の確立は、インスタンスペアを慎重に構築することにより、計量学習問題として定式化される。
上述の適応をオブジェクト検出器(例えばより高速なRCNN)に統合することで、複数のアライメントが粗い方法で協調動作するエンドツーエンドのトレーニング可能なフレームワークを実現する。
2つのドメイン適応タスク:Synthetic-to-real(SIM10K->Cityscapes)とNormal-to-foggy weather(Cityscapes->Foggy Cityscapes)では、iFANはソースのみのベースライン上で10%以上のAPで最先端の手法より優れている。
関連論文リスト
- DATR: Unsupervised Domain Adaptive Detection Transformer with Dataset-Level Adaptation and Prototypical Alignment [7.768332621617199]
我々は、オブジェクト検出の教師なし領域適応のために、ドメイン適応検出TRansformer(DATR)と呼ばれる強力なDETRベースの検出器を導入する。
提案するDATRは,教師モデルによって生成された擬似ラベルを用いて,平均教師に基づく自己学習フレームワークを組み込んで,ドメインバイアスをさらに緩和する。
複数のドメイン適応シナリオにおいて,提案したDATRの性能と一般化性を示す実験を行った。
論文 参考訳(メタデータ) (2024-05-20T03:48:45Z) - Improving Human-Object Interaction Detection via Virtual Image Learning [68.56682347374422]
人間-物体相互作用(Human-Object Interaction、HOI)は、人間と物体の相互作用を理解することを目的としている。
本稿では,仮想画像学習(Virtual Image Leaning, VIL)による不均衡分布の影響を軽減することを提案する。
ラベルからイメージへの新たなアプローチであるMultiple Steps Image Creation (MUSIC)が提案され、実際の画像と一貫した分布を持つ高品質なデータセットを作成する。
論文 参考訳(メタデータ) (2023-08-04T10:28:48Z) - Seeking Similarities over Differences: Similarity-based Domain Alignment
for Adaptive Object Detection [86.98573522894961]
本研究では,Unsupervised Domain Adaptation (UDA) アルゴリズムが検出に使用するコンポーネントを一般化するフレームワークを提案する。
具体的には、最適な設計選択を生かした新しいUDAアルゴリズムViSGAを提案し、インスタンスレベルの特徴を集約する単純だが効果的な方法を提案する。
類似性に基づくグループ化と対角トレーニングの両方により、モデルでは、ゆるやかに整列されたドメインにまたがるすべてのインスタンスにマッチせざるを得ず、機能グループを粗い整列することに集中することが可能であることが示されています。
論文 参考訳(メタデータ) (2021-10-04T13:09:56Z) - AFAN: Augmented Feature Alignment Network for Cross-Domain Object
Detection [90.18752912204778]
オブジェクト検出のための教師なしドメイン適応は、多くの現実世界のアプリケーションにおいて難しい問題である。
本稿では、中間領域画像生成とドメイン・アドバイザリー・トレーニングを統合した新しい機能アライメント・ネットワーク(AFAN)を提案する。
提案手法は、類似および異種ドメイン適応の双方において、標準ベンチマークにおける最先端の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2021-06-10T05:01:20Z) - PixMatch: Unsupervised Domain Adaptation via Pixelwise Consistency
Training [4.336877104987131]
教師なしドメイン適応はセマンティックセグメンテーションの有望なテクニックである。
対象領域整合性訓練の概念に基づく非監視領域適応のための新しいフレームワークを提案する。
私たちのアプローチはシンプルで、実装が簡単で、トレーニング時にメモリ効率が向上します。
論文 参考訳(メタデータ) (2021-05-17T19:36:28Z) - Surprisingly Simple Semi-Supervised Domain Adaptation with Pretraining
and Consistency [93.89773386634717]
ビジュアルドメイン適応は、異なるソースドメインで利用可能なラベルを使用して、ターゲットのビジュアルドメインからイメージを分類する学習を含む。
いくつかの目標ラベルが存在する場合、(回転予測による)自己スーパービジョンや整合正則化といった単純な手法が、適切な目標分類器を学習するための対角アライメントなしで有効であることを示す。
我々の事前学習と一貫性(PAC)アプローチは、この半教師付きドメイン適応タスクにおいて、複数のデータセットにまたがる複数の対向的なドメインアライメント手法を超越して、技術精度を達成することができる。
論文 参考訳(メタデータ) (2021-01-29T18:40:17Z) - Cross-domain Detection via Graph-induced Prototype Alignment [114.8952035552862]
カテゴリレベルのドメインアライメントを求めるグラフ誘発プロトタイプアライメント(GPA)フレームワークを提案する。
さらに,クラス不均衡がドメイン適応に与える影響を軽減するために,クラス重み付きコントラスト損失を設計する。
我々のアプローチは、既存の手法よりも顕著なマージンで優れています。
論文 参考訳(メタデータ) (2020-03-28T17:46:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。