論文の概要: D2DF2WOD: Learning Object Proposals for Weakly-Supervised Object
Detection via Progressive Domain Adaptation
- arxiv url: http://arxiv.org/abs/2212.01376v1
- Date: Fri, 2 Dec 2022 18:58:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-05 17:08:09.926820
- Title: D2DF2WOD: Learning Object Proposals for Weakly-Supervised Object
Detection via Progressive Domain Adaptation
- Title(参考訳): d2df2wod:プログレッシブドメイン適応による弱教師付き物体検出のための学習オブジェクトの提案
- Authors: Yuting Wang, Ricardo Guerrero, Vladimir Pavlovic
- Abstract要約: D2DF2WODは完全な監視対象検出フレームワークである。
自然なイメージターゲットドメインを補うために、正確なオブジェクトローカライゼーションを付加した合成データを使用する。
提案手法は,最先端手法と比較してオブジェクト検出と局所化を一貫して改善する。
- 参考スコア(独自算出の注目度): 25.41133780678981
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Weakly-supervised object detection (WSOD) models attempt to leverage
image-level annotations in lieu of accurate but costly-to-obtain object
localization labels. This oftentimes leads to substandard object detection and
localization at inference time. To tackle this issue, we propose D2DF2WOD, a
Dual-Domain Fully-to-Weakly Supervised Object Detection framework that
leverages synthetic data, annotated with precise object localization, to
supplement a natural image target domain, where only image-level labels are
available. In its warm-up domain adaptation stage, the model learns a
fully-supervised object detector (FSOD) to improve the precision of the object
proposals in the target domain, and at the same time learns
target-domain-specific and detection-aware proposal features. In its main WSOD
stage, a WSOD model is specifically tuned to the target domain. The feature
extractor and the object proposal generator of the WSOD model are built upon
the fine-tuned FSOD model. We test D2DF2WOD on five dual-domain image
benchmarks. The results show that our method results in consistently improved
object detection and localization compared with state-of-the-art methods.
- Abstract(参考訳): 弱教師付きオブジェクト検出(WSOD)モデルは、正確だが高価なオブジェクトローカライゼーションラベルの代わりに画像レベルのアノテーションを活用する。
これはしばしば、サブ標準オブジェクトの検出と推論時のローカライゼーションにつながる。
そこで本稿では,d2df2wodを提案する。d2df2wodは,画像レベルラベルのみが使用可能な自然画像ターゲットドメインを補完するために,合成データを利用した合成オブジェクト検出フレームワークである。
ウォームアップドメイン適応段階において、モデルは完全に教師付きオブジェクト検出器(fsod)を学習し、対象ドメイン内のオブジェクト提案の精度を向上させるとともに、ターゲットドメイン固有かつ検出対応の提案機能を学習する。
メインのWSODステージでは、WSODモデルはターゲットドメインに特別に調整されます。
WSODモデルの特徴抽出器とオブジェクト提案生成器は、細調整されたFSODモデルに基づいて構築される。
d2df2wodを5つのデュアルドメインイメージベンチマークでテストした。
その結果,本手法は最先端手法と比較してオブジェクト検出と局所化を一貫して改善することがわかった。
関連論文リスト
- Cross-Domain Few-Shot Object Detection via Enhanced Open-Set Object Detector [72.05791402494727]
本稿では,CD-FSODを用いたクロスドメイン小ショット検出法について検討する。
最小限のラベル付き例で、新しいドメインのための正確なオブジェクト検出器を開発することを目的としている。
論文 参考訳(メタデータ) (2024-02-05T15:25:32Z) - Detect, Augment, Compose, and Adapt: Four Steps for Unsupervised Domain
Adaptation in Object Detection [7.064953237013352]
教師なし領域適応(Unsupervised domain adapt、UDA)は、アノテートされたデータなしで、ソース学習された検出器を対象領域に適応させる際に、オブジェクト検出において重要な役割を果たす。
自己超越性を活用し,ソースとターゲットデータを同時に訓練する,新しい,効果的な4段階のUDA手法を提案する。
提案手法は最先端性能を実現し,平均精度(mAP)を2%以上向上させる。
論文 参考訳(メタデータ) (2023-08-29T14:48:29Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - STFAR: Improving Object Detection Robustness at Test-Time by
Self-Training with Feature Alignment Regularization [35.16122933158808]
ドメイン適応は、分散シフトを伴うドメインデータをターゲットにするオブジェクト検出モデルを一般化するのに役立ちます。
テスト時,すなわちテスト時適応(TTAOD)におけるオブジェクト検出モデルの適用について検討する。
提案手法は,テスト時間適応オブジェクト検出タスクに最先端を設定できる。
論文 参考訳(メタデータ) (2023-03-31T10:04:44Z) - CLIP the Gap: A Single Domain Generalization Approach for Object
Detection [60.20931827772482]
単一ドメインの一般化(Single Domain Generalization)は、単一のソースドメイン上でモデルをトレーニングすることで、目に見えないターゲットドメインに一般化する問題に取り組む。
本稿では、事前学習された視覚言語モデルを用いて、テキストプロンプトを介して意味領域の概念を導入することを提案する。
本手法は,検出器のバックボーンから抽出した特徴に作用する意味的拡張戦略と,テキストに基づく分類損失によって実現される。
論文 参考訳(メタデータ) (2023-01-13T12:01:18Z) - Cross Domain Object Detection by Target-Perceived Dual Branch
Distillation [49.68119030818388]
クロスドメインオブジェクト検出は、現実的で挑戦的なタスクです。
本稿では,TDD(Target-perceived Dual-branch Distillation)フレームワークを提案する。
私たちのTDDは、すべてのベンチマークで最先端のメソッドよりも大幅に優れています。
論文 参考訳(メタデータ) (2022-05-03T03:51:32Z) - An Unsupervised Domain Adaptive Approach for Multimodal 2D Object
Detection in Adverse Weather Conditions [5.217255784808035]
本稿では、ソースとターゲットドメイン間のドメインギャップを埋めるために、教師なしのドメイン適応フレームワークを提案する。
天候の歪みをシミュレートするデータ拡張方式を用いて、ドメインの混乱を増し、ソースデータへの過度な適合を防止する。
DENSEデータセットで行った実験は、我々の手法がドメインギャップを大幅に軽減できることを示している。
論文 参考訳(メタデータ) (2022-03-07T18:10:40Z) - Weakly Supervised Object Localization as Domain Adaption [19.854125742336688]
弱教師付きオブジェクトローカライゼーション(WSOL)は、画像レベルの分類マスクの監督のみでオブジェクトをローカライズすることに焦点を当てる。
従来のWSOL手法の多くは、MIL(Multi-instance Learning)機構を用いて分類構造に基づいてオブジェクトをローカライズする分類活性化マップ(CAM)に従っている。
この研究は、WSOLをドメイン適応(DA)タスクとしてモデル化する、新しい視点を提供する。そこでは、ソース/イメージドメインでトレーニングされたスコア推定器がターゲット/ピクセルドメイン上でテストされ、オブジェクトを見つける。
論文 参考訳(メタデータ) (2022-03-03T13:50:22Z) - Frequency Spectrum Augmentation Consistency for Domain Adaptive Object
Detection [107.52026281057343]
周波数スペクトル拡張整合(FSAC)フレームワークを4種類の低周波フィルタで構成する。
最初の段階では、オリジナルおよび拡張されたソースデータを全て利用して、オブジェクト検出器を訓練する。
第2段階では、予測一貫性のための自己学習を行うために、擬似ラベル付き拡張現実とターゲットデータを採用する。
論文 参考訳(メタデータ) (2021-12-16T04:07:01Z) - Adaptive Object Detection with Dual Multi-Label Prediction [78.69064917947624]
本稿では,適応オブジェクト検出のための新しいエンド・ツー・エンドの非教師付き深部ドメイン適応モデルを提案する。
モデルはマルチラベル予測を利用して、各画像内の対象カテゴリ情報を明らかにする。
本稿では,オブジェクト検出を支援するための予測整合正則化機構を提案する。
論文 参考訳(メタデータ) (2020-03-29T04:23:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。