論文の概要: Adaptive Object Detection with Dual Multi-Label Prediction
- arxiv url: http://arxiv.org/abs/2003.12943v2
- Date: Tue, 11 Aug 2020 00:25:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-18 13:31:31.085612
- Title: Adaptive Object Detection with Dual Multi-Label Prediction
- Title(参考訳): デュアルマルチラベル予測による適応物体検出
- Authors: Zhen Zhao, Yuhong Guo, Haifeng Shen, Jieping Ye
- Abstract要約: 本稿では,適応オブジェクト検出のための新しいエンド・ツー・エンドの非教師付き深部ドメイン適応モデルを提案する。
モデルはマルチラベル予測を利用して、各画像内の対象カテゴリ情報を明らかにする。
本稿では,オブジェクト検出を支援するための予測整合正則化機構を提案する。
- 参考スコア(独自算出の注目度): 78.69064917947624
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a novel end-to-end unsupervised deep domain
adaptation model for adaptive object detection by exploiting multi-label object
recognition as a dual auxiliary task. The model exploits multi-label prediction
to reveal the object category information in each image and then uses the
prediction results to perform conditional adversarial global feature alignment,
such that the multi-modal structure of image features can be tackled to bridge
the domain divergence at the global feature level while preserving the
discriminability of the features. Moreover, we introduce a prediction
consistency regularization mechanism to assist object detection, which uses the
multi-label prediction results as an auxiliary regularization information to
ensure consistent object category discoveries between the object recognition
task and the object detection task. Experiments are conducted on a few
benchmark datasets and the results show the proposed model outperforms the
state-of-the-art comparison methods.
- Abstract(参考訳): 本稿では,複数ラベルオブジェクト認識を2つの補助タスクとして活用することにより,適応オブジェクト検出のためのエンドツーエンドの非教師付き深部ドメイン適応モデルを提案する。
このモデルはマルチラベル予測を利用して各画像のオブジェクトカテゴリ情報を明らかにし、その予測結果を用いて条件付き逆大域的特徴のアライメントを行い、画像特徴のマルチモーダル構造に取り組み、特徴の識別性を保ちながら、大域的特徴レベルでの領域の多様性を橋渡しする。
さらに,複数ラベル予測結果を補助正規化情報として用い,物体認識タスクと物体検出タスクとの一貫した物体カテゴリ発見を保証する,物体検出を支援する予測一貫性正規化機構を提案する。
いくつかのベンチマークデータセットで実験を行い、提案したモデルが最先端比較法より優れていることを示す。
関連論文リスト
- Counterfactual Reasoning for Multi-Label Image Classification via Patching-Based Training [84.95281245784348]
共起関係の過度な強調は、モデルの過度な問題を引き起こす可能性がある。
本稿では,対象対象物とその共起対象物による相関特性を媒介者とみなすことができることを示す因果推論フレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-09T13:13:24Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - Mutual Information Regularization for Weakly-supervised RGB-D Salient
Object Detection [33.210575826086654]
弱教師付きRGB-Dサルエント物体検出モデルを提案する。
モーダル相互情報正規化による効果的なマルチモーダル表現学習に着目した。
論文 参考訳(メタデータ) (2023-06-06T12:36:57Z) - On the robustness of self-supervised representations for multi-view
object classification [0.0]
インスタンス識別の目的に基づく自己教師型表現は、オブジェクトの視点や視点の変化に対してより堅牢なオブジェクトの表現に繋がることを示す。
自己監督型表現は、オブジェクトの視点に対してより堅牢であり、新しい視点からオブジェクトの認識を促進するオブジェクトに関するより関連する情報をエンコードしているように見える。
論文 参考訳(メタデータ) (2022-07-27T17:24:55Z) - A Study on Self-Supervised Object Detection Pretraining [14.38896715041483]
対象検出モデルの自己教師付き事前学習に対する様々なアプローチについて検討する。
まず、画像から空間的に一貫した密度表現を学習するための一般的なフレームワークを設計する。
ボックス生成,特徴抽出戦略,複数ビューなど,文献における既存の設計選択について検討する。
論文 参考訳(メタデータ) (2022-07-09T03:30:44Z) - Real-World Semantic Grasping Detection [0.34410212782758054]
本稿では,意味認識と把握検出を両立できるエンドツーエンドのセマンティック把握検出モデルを提案する。
また,検出を把握するためのセマンティック情報に基づき,単一のオブジェクトの特徴のみを保持するターゲット特徴フィルタリング機構を設計する。
実験結果から,コーネルグルーピングデータセットの98.38%の精度が得られた。
論文 参考訳(メタデータ) (2021-11-20T05:57:22Z) - Uncertainty-Aware Model Adaptation for Unsupervised Cross-Domain Object
Detection [12.807987076435928]
この研究は、教師なしのクロスドメインオブジェクト検出問題に取り組む。
これは、事前訓練された物体検出器をラベルなしで新しいターゲットドメインに一般化することを目的としている。
論文 参考訳(メタデータ) (2021-08-28T09:37:18Z) - Unsupervised Domain Adaption of Object Detectors: A Survey [87.08473838767235]
近年のディープラーニングの進歩は、様々なコンピュータビジョンアプリケーションのための正確で効率的なモデルの開発につながっている。
高度に正確なモデルを学ぶには、大量の注釈付きイメージを持つデータセットの可用性に依存する。
このため、ラベルスカースデータセットに視覚的に異なる画像がある場合、モデルの性能は大幅に低下する。
論文 参考訳(メタデータ) (2021-05-27T23:34:06Z) - Target-Aware Object Discovery and Association for Unsupervised Video
Multi-Object Segmentation [79.6596425920849]
本稿では,教師なしビデオマルチオブジェクトセグメンテーションの課題について述べる。
より正確で効率的な時間区分のための新しいアプローチを紹介します。
DAVIS$_17$とYouTube-VISに対する提案手法を評価した結果,セグメント化精度と推論速度の両方において最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-04-10T14:39:44Z) - Ensembling object detectors for image and video data analysis [98.26061123111647]
本稿では,複数の物体検出器の出力をアンサンブルすることで,画像データ上の境界ボックスの検出性能と精度を向上させる手法を提案する。
本研究では,2段階追跡に基づく検出精度向上手法を提案することで,映像データに拡張する。
論文 参考訳(メタデータ) (2021-02-09T12:38:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。