論文の概要: PDNet: Towards Better One-stage Object Detection with Prediction
Decoupling
- arxiv url: http://arxiv.org/abs/2104.13876v1
- Date: Wed, 28 Apr 2021 16:48:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2021-04-29 12:44:53.777188
- Title: PDNet: Towards Better One-stage Object Detection with Prediction
Decoupling
- Title(参考訳): PDNet: 予測デカップリングによるワンステージオブジェクト検出の改善を目指す
- Authors: Li Yang, Yan Xu, Shaoru Wang, Chunfeng Yuan, Ziqi Zhang, Bing Li,
Weiming Hu
- Abstract要約: PDNetと呼ばれる予測ターゲット分離検出器を提案し,より柔軟な検出パラダイムを確立する。
バックボーンは1つのResNeXt-64x4d-101で、検出器はシングルスケールテストで48.7 APを達成した。
- 参考スコア(独自算出の注目度): 37.83405509385431
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent one-stage object detectors follow a per-pixel prediction approach that
predicts both the object category scores and boundary positions from every
single grid location. However, the most suitable positions for inferring
different targets, i.e., the object category and boundaries, are generally
different. Predicting all these targets from the same grid location thus may
lead to sub-optimal results. In this paper, we analyze the suitable inference
positions for object category and boundaries, and propose a
prediction-target-decoupled detector named PDNet to establish a more flexible
detection paradigm. Our PDNet with the prediction decoupling mechanism encodes
different targets separately in different locations. A learnable prediction
collection module is devised with two sets of dynamic points, i.e., dynamic
boundary points and semantic points, to collect and aggregate the predictions
from the favorable regions for localization and classification. We adopt a
two-step strategy to learn these dynamic point positions, where the prior
positions are estimated for different targets first, and the network further
predicts residual offsets to the positions with better perceptions of the
object properties. Extensive experiments on the MS COCO benchmark demonstrate
the effectiveness and efficiency of our method. With a single ResNeXt-64x4d-101
as the backbone, our detector achieves 48.7 AP with single-scale testing, which
outperforms the state-of-the-art methods by an appreciable margin under the
same experimental settings. Moreover, our detector is highly efficient as a
one-stage framework. Our code will be public.
- Abstract(参考訳): 最近の1段階オブジェクト検出器は、各グリッドの位置からオブジェクトのカテゴリスコアと境界位置の両方を予測するピクセル単位の予測アプローチに従っている。
しかし、異なる対象、すなわち対象圏と境界を推定するのに最も適した位置は、一般的に異なる。
したがって、同じグリッド位置からこれらのターゲットを予測すれば、準最適結果につながる可能性がある。
本稿では,オブジェクトのカテゴリとバウンダリに適した推論位置を解析し,PDNetと呼ばれる予測対象分離検出器を提案し,よりフレキシブルな検出パラダイムを確立する。
我々のPDNetと予測デカップリング機構は、異なる場所で異なるターゲットを別々に符号化する。
学習可能な予測収集モジュールは、動的境界点と意味点という2つの動的点のセットで考案され、局所化と分類のために好ましい領域から予測を収集し集約する。
まず,これらの動的点位置を2段階の戦略で学習し,先行位置を異なる目標に対して推定し,ネットワークは対象特性をよりよく認識して位置の残差オフセットを更に予測する。
本手法の有効性と有効性を示すため,MS COCOベンチマークの大規模実験を行った。
バックボーンとして1つのResNeXt-64x4d-101を用いると、この検出器は48.7 APを単スケールテストで達成し、同じ実験条件下での精度で最先端の手法より優れている。
さらに,検出器は1段階のフレームワークとして極めて効率的である。
私たちのコードは公開されます。
関連論文リスト
- Parallel Reasoning Network for Human-Object Interaction Detection [53.422076419484945]
並列推論ネットワーク(PR-Net)というトランスフォーマーに基づく新しい手法を提案する。
PR-Netは、インスタンスレベルのローカライゼーションと関係レベルの理解のための2つの独立した予測器を構築する。
我々のPR-NetはHICO-DETとV-COCOベンチマークで競合する結果を得た。
論文 参考訳(メタデータ) (2023-01-09T17:00:34Z) - ConfMix: Unsupervised Domain Adaptation for Object Detection via
Confidence-based Mixing [32.679280923208715]
オブジェクト検出のための教師なしドメイン適応(UDA)は、ソースドメインでトレーニングされたモデルを適用して、アノテーションが利用できない新しいターゲットドメインからインスタンスを検出することを目的としている。
適応型物体検出学習のための領域レベルの検出信頼度に基づくサンプル混合戦略を初めて導入するConfMixを提案する。
論文 参考訳(メタデータ) (2022-10-20T19:16:39Z) - Frequency Spectrum Augmentation Consistency for Domain Adaptive Object
Detection [107.52026281057343]
周波数スペクトル拡張整合(FSAC)フレームワークを4種類の低周波フィルタで構成する。
最初の段階では、オリジナルおよび拡張されたソースデータを全て利用して、オブジェクト検出器を訓練する。
第2段階では、予測一貫性のための自己学習を行うために、擬似ラベル付き拡張現実とターゲットデータを採用する。
論文 参考訳(メタデータ) (2021-12-16T04:07:01Z) - Rethinking Counting and Localization in Crowds:A Purely Point-Based
Framework [59.578339075658995]
そこで本稿では,共同クラウドカウントと個別ローカライゼーションのための純粋にポイントベースのフレームワークを提案する。
我々は、P2PNet(Point to Point Network)と呼ばれる、このフレームワークの下で直感的なソリューションを設計する。
論文 参考訳(メタデータ) (2021-07-27T11:41:50Z) - EPP-Net: Extreme-Point-Prediction-Based Object Detection [9.270523894683278]
本研究では,各画素と4つの極点間の相対変位ベクトルを回帰するアンカーフリーの高密度物体検出器を提案する。
また、極点の2つの群、すなわち、連合上の極端断面積(EIoU)の類似度を測定するための新しい測度も提案する。
MS-COCOデータセットでは,ResNet-50では平均精度が39.3%,ResNeXt-101-DCNでは48.3%である。
論文 参考訳(メタデータ) (2021-04-29T01:01:50Z) - Reformulating HOI Detection as Adaptive Set Prediction [25.44630995307787]
我々は適応セット予測問題としてHOI検出を再構成する。
本稿では,並列インスタンスとインタラクションブランチを備えた適応型セットベースワンステージフレームワーク(as-net)を提案する。
この手法は、人間のポーズや言語的特徴を必要とせず、従来の最先端の手法を上回ります。
論文 参考訳(メタデータ) (2021-03-10T10:40:33Z) - Corner Proposal Network for Anchor-free, Two-stage Object Detection [174.59360147041673]
オブジェクト検出の目標は、画像内のオブジェクトのクラスと位置を決定することである。
本稿では,多数のオブジェクト提案を抽出する新しいアンカーフリー2段階フレームワークを提案する。
この2つの段階が,リコールと精度の向上に有効な解であることを示す。
論文 参考訳(メタデータ) (2020-07-27T19:04:57Z) - Scope Head for Accurate Localization in Object Detection [135.9979405835606]
本研究では,各位置のアンカーを相互依存関係としてモデル化したScopeNetと呼ばれる新しい検出器を提案する。
我々の簡潔で効果的な設計により、提案したScopeNetはCOCOの最先端の成果を達成する。
論文 参考訳(メタデータ) (2020-05-11T04:00:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。