論文の概要: SimROD: A Simple Adaptation Method for Robust Object Detection
- arxiv url: http://arxiv.org/abs/2107.13389v1
- Date: Wed, 28 Jul 2021 14:28:32 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-29 14:11:13.854366
- Title: SimROD: A Simple Adaptation Method for Robust Object Detection
- Title(参考訳): SimROD:ロバスト物体検出のための簡易適応法
- Authors: Rindra Ramamonjison, Amin Banitalebi-Dehkordi, Xinyu Kang, Xiaolong
Bai, Yong Zhang
- Abstract要約: 本稿では、ロバスト物体検出(SimROD)のための単純で効果的な教師なし適応法を提案する。
本手法は,新たなドメイン中心の強化手法,段階的な自己ラベル適応手順,教師が指導する微調整機構を統合する。
画像の破損や高レベルのクロスドメイン適応ベンチマークに適用した場合,提案手法は従来のベースラインよりも優れていた。
- 参考スコア(独自算出の注目度): 8.307942341807152
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a Simple and effective unsupervised adaptation method for
Robust Object Detection (SimROD). To overcome the challenging issues of domain
shift and pseudo-label noise, our method integrates a novel domain-centric
augmentation method, a gradual self-labeling adaptation procedure, and a
teacher-guided fine-tuning mechanism. Using our method, target domain samples
can be leveraged to adapt object detection models without changing the model
architecture or generating synthetic data. When applied to image corruptions
and high-level cross-domain adaptation benchmarks, our method outperforms prior
baselines on multiple domain adaptation benchmarks. SimROD achieves new
state-of-the-art on standard real-to-synthetic and cross-camera setup
benchmarks. On the image corruption benchmark, models adapted with our method
achieved a relative robustness improvement of 15-25% AP50 on Pascal-C and 5-6%
AP on COCO-C and Cityscapes-C. On the cross-domain benchmark, our method
outperformed the best baseline performance by up to 8% AP50 on Comic dataset
and up to 4% on Watercolor dataset.
- Abstract(参考訳): 本稿では,ロバスト物体検出(SimROD)のための簡易かつ効果的な非教師なし適応手法を提案する。
ドメインシフトと擬似ラベルノイズの課題を克服するため,本手法では,新しいドメイン中心拡張法,段階的自己ラベル適応法,教師誘導微調整機構を統合した。
本手法を用いることで,対象領域のサンプルをモデル構造を変更したり合成データを生成することなくオブジェクト検出モデルに適応させることができる。
画像の破損や高レベルのクロスドメイン適応ベンチマークに適用した場合,本手法は複数のドメイン適応ベンチマークにおいて,事前ベースラインよりも優れる。
SimRODは、標準的なリアルタイム合成およびクロスカメラセットアップベンチマークで新しい最先端を実現する。
画像劣化ベンチマークでは,Pascal-Cで15-25% AP50,COCO-CおよびCityscapes-Cで5-6% AP50,Comicデータセットで最大8%AP50,Watercolorデータセットで最大4%AP50で最高のベースライン性能を示した。
関連論文リスト
- Align and Distill: Unifying and Improving Domain Adaptive Object Detection [16.879446142847392]
ドメイン適応オブジェクト検出(DAOD)手法は近年,この問題に対処する上で大きな成果を上げている。
過去の結果を疑問視し、さらなる進歩を妨げるような、システムベンチマークの落とし穴を特定します。
統一されたベンチマークと実装フレームワークであるAlign and Distill (ALDI)。
新しいベンチマークデータセットであるCFC-DAODは、さまざまな実世界のデータの評価を可能にし、(4)最先端の結果を大きなマージンで達成する新しいメソッドALDI++である。
論文 参考訳(メタデータ) (2024-03-18T17:58:02Z) - What, How, and When Should Object Detectors Update in Continually
Changing Test Domains? [34.13756022890991]
テストデータを推測しながらモデルをオンラインに適応させるテスト時適応アルゴリズムが提案されている。
連続的に変化するテスト領域におけるオブジェクト検出のための新しいオンライン適応手法を提案する。
提案手法は,広く使用されているベンチマークのベースラインを超え,最大4.9%,mAP7.9%の改善を実現している。
論文 参考訳(メタデータ) (2023-12-12T07:13:08Z) - Informative Data Mining for One-Shot Cross-Domain Semantic Segmentation [84.82153655786183]
Informative Data Mining (IDM) と呼ばれる新しいフレームワークを提案し、セマンティックセグメンテーションのための効率的なワンショットドメイン適応を実現する。
IDMは、最も情報性の高いサンプルを特定するために不確実性に基づく選択基準を提供し、迅速に適応し、冗長なトレーニングを減らす。
提案手法は,GTA5/SYNTHIAからCityscapesへの適応タスクにおいて,既存の手法より優れ,56.7%/55.4%の最先端のワンショット性能を実現している。
論文 参考訳(メタデータ) (2023-09-25T15:56:01Z) - AR-TTA: A Simple Method for Real-World Continual Test-Time Adaptation [1.4530711901349282]
本稿では,自律運転のためのデータセット,すなわちCLAD-CとShiFTを用いたテスト時間適応手法の検証を提案する。
現在のテスト時間適応手法は、ドメインシフトの様々な程度を効果的に扱うのに苦労している。
モデル安定性を高めるために、小さなメモリバッファを組み込むことで、確立された自己学習フレームワークを強化する。
論文 参考訳(メタデータ) (2023-09-18T19:34:23Z) - Benchmarking Test-Time Adaptation against Distribution Shifts in Image
Classification [77.0114672086012]
テスト時間適応(TTA)は、予測時にのみラベルのないサンプルを活用することにより、モデルの一般化性能を向上させる技術である。
本稿では,広く使用されている5つの画像分類データセット上で,13のTTA手法とその変種を体系的に評価するベンチマークを提案する。
論文 参考訳(メタデータ) (2023-07-06T16:59:53Z) - Universal Domain Adaptation from Foundation Models: A Baseline Study [58.51162198585434]
基礎モデルを用いた最先端UniDA手法の実証的研究を行った。
CLIPモデルからターゲット知識を抽出するためのパラメータフリーな手法であるtextitCLIP 蒸留を導入する。
単純な手法ではあるが、ほとんどのベンチマークタスクでは従来の手法よりも優れている。
論文 参考訳(メタデータ) (2023-05-18T16:28:29Z) - Few-Shot Adaptation of Pre-Trained Networks for Domain Shift [17.123505029637055]
深層ネットワークは、ソース(トレーニング)データとターゲット(テスト)データの間にドメインシフトがある場合、パフォーマンスが低下する傾向がある。
最近のテスト時間適応手法では,新たなターゲット環境にデプロイされた事前訓練されたソースモデルのバッチ正規化レイヤをストリームデータで更新することで,パフォーマンス劣化を軽減している。
データ効率適応の実践的課題に対処するために,少数ショット領域適応のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2022-05-30T16:49:59Z) - Learning Instance-Specific Adaptation for Cross-Domain Segmentation [79.61787982393238]
クロスドメイン画像セグメンテーションのためのテスト時間適応法を提案する。
テスト時に新しい目に見えないインスタンスが与えられると、インスタンス固有のBatchNormキャリブレーションを実行することで、事前トレーニングされたモデルを適用します。
論文 参考訳(メタデータ) (2022-03-30T17:59:45Z) - Frequency Spectrum Augmentation Consistency for Domain Adaptive Object
Detection [107.52026281057343]
周波数スペクトル拡張整合(FSAC)フレームワークを4種類の低周波フィルタで構成する。
最初の段階では、オリジナルおよび拡張されたソースデータを全て利用して、オブジェクト検出器を訓練する。
第2段階では、予測一貫性のための自己学習を行うために、擬似ラベル付き拡張現実とターゲットデータを採用する。
論文 参考訳(メタデータ) (2021-12-16T04:07:01Z) - Learning Meta Face Recognition in Unseen Domains [74.69681594452125]
メタ顔認識(MFR)というメタラーニングを用いた新しい顔認識手法を提案する。
MFRは、メタ最適化目標を用いてソース/ターゲットドメインシフトを合成する。
一般化顔認識評価のためのベンチマークを2つ提案する。
論文 参考訳(メタデータ) (2020-03-17T14:10:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。