論文の概要: Revisiting the Sibling Head in Object Detector
- arxiv url: http://arxiv.org/abs/2003.07540v1
- Date: Tue, 17 Mar 2020 05:21:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-22 21:22:25.622366
- Title: Revisiting the Sibling Head in Object Detector
- Title(参考訳): オブジェクト検出器におけるシブリングヘッドの再検討
- Authors: Guanglu Song, Yu Liu, Xiaogang Wang
- Abstract要約: 本稿では,兄弟頭部の2つの対象関数間の空間的不整合がトレーニング過程を著しく損なうことを観察する。
分類と回帰を考えると、TSDは2つの非絡み合った提案を生成することによって空間次元からそれらを分離する。
驚いたことに、このシンプルなデザインは、MS COCOとGoogle OpenImageの両方のバックボーンとモデルを、一貫して3%のmAPで強化することができる。
- 参考スコア(独自算出の注目度): 24.784483589579896
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The ``shared head for classification and localization'' (sibling head),
firstly denominated in Fast RCNN~\cite{girshick2015fast}, has been leading the
fashion of the object detection community in the past five years. This paper
provides the observation that the spatial misalignment between the two object
functions in the sibling head can considerably hurt the training process, but
this misalignment can be resolved by a very simple operator called task-aware
spatial disentanglement (TSD). Considering the classification and regression,
TSD decouples them from the spatial dimension by generating two disentangled
proposals for them, which are estimated by the shared proposal. This is
inspired by the natural insight that for one instance, the features in some
salient area may have rich information for classification while these around
the boundary may be good at bounding box regression. Surprisingly, this simple
design can boost all backbones and models on both MS COCO and Google OpenImage
consistently by ~3% mAP. Further, we propose a progressive constraint to
enlarge the performance margin between the disentangled and the shared
proposals, and gain ~1% more mAP. We show the \algname{} breaks through the
upper bound of nowadays single-model detector by a large margin (mAP 49.4 with
ResNet-101, 51.2 with SENet154), and is the core model of our 1st place
solution on the Google OpenImage Challenge 2019.
- Abstract(参考訳): Fast RCNN~\cite{girshick2015fast} で最初にデノマイトされた 'shared head for classification and localization' (兄弟頭)' は、過去5年間、オブジェクト検出コミュニティのファッションをリードしてきた。
本稿では,2つの対象関数間の空間的不整合がトレーニング過程を著しく損なうことを観察するが,この不整合はタスク認識空間不整合(TSD)と呼ばれる非常に単純な演算子によって解決できる。
分類と回帰を考慮すると、TSDは2つの非絡み合った提案を生成して空間次元から分離し、共有提案によって推定する。
これは自然界の洞察に触発され、例えば、ある高度領域の特徴は分類のための豊富な情報を持っているのに対して、境界付近の特徴は境界ボックス回帰(bounding box regression)に適している可能性がある。
驚いたことに、このシンプルなデザインはMS COCOとGoogle OpenImageの両方ですべてのバックボーンとモデルを約3%向上させることができる。
さらに,不整合と共有提案の間の性能マージンを拡大し,mAPを約1%増加させるプログレッシブ制約を提案する。
現在シングルモデル検出器の上限を大きなマージン(resnet-101はmap 49.4、senet154は51.2)で破っており、google openimage challenge 2019における私たちの1位ソリューションのコアモデルです。
関連論文リスト
- Not Just Learning from Others but Relying on Yourself: A New Perspective
on Few-Shot Segmentation in Remote Sensing [14.37799301656178]
Few-shot segmentation (FSS) は、いくつかの注釈付きサンプルで未知のクラスターゲットをセグメンテーションするために提案されている。
我々は、クロスイメージマイニングとセルフマイニングのためのDMNetというデュアルマイニングネットワークを開発した。
Resnet-50のバックボーンを持つ我々のモデルは、1ショットと5ショット設定でiSAID上で49.58%と51.34%のmIoUを達成する。
論文 参考訳(メタデータ) (2023-10-19T04:09:10Z) - Spatial-Aware Token for Weakly Supervised Object Localization [137.0570026552845]
タスク固有の空間認識トークンを,弱教師付き方式で条件定位に提案する。
実験の結果、SATはCUB-200とImageNetの両方で、98.45%と73.13%のGT-known Locで最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2023-03-18T15:38:17Z) - Boosting Few-shot Fine-grained Recognition with Background Suppression
and Foreground Alignment [53.401889855278704]
FS-FGR (Few-shot Fine-fine Recognition) は、限られたサンプルの助けを借りて、新しいきめ細かなカテゴリを認識することを目的としている。
本研究では,背景アクティベーション抑制 (BAS) モジュール,フォアグラウンドオブジェクトアライメント (FOA) モジュール,および局所的局所的(L2L) 類似度測定器からなる2段階の背景アライメントとフォアグラウンドアライメントフレームワークを提案する。
複数のベンチマークで行った実験により,提案手法は既存の最先端技術よりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2022-10-04T07:54:40Z) - Group R-CNN for Weakly Semi-supervised Object Detection with Points [18.720915213798623]
本稿では,グループR-CNNの効率的なポイントツーボックス回帰器を提案する。
グループR-CNNはまず、各ポイントアノテーションに対する提案のグループを生成するために、インスタンスレベルの提案グループを使用する。
我々は,グループR-CNNが先行手法であるポイントDETRの3.9mAPと5%の良好なラベル付き画像より有意に優れていたことを示す。
論文 参考訳(メタデータ) (2022-05-12T07:17:54Z) - Anchor Retouching via Model Interaction for Robust Object Detection in
Aerial Images [15.404024559652534]
本稿では,新しいトレーニングサンプルジェネレータを構築するために,動的拡張アンカー(DEA)ネットワークを提案する。
提案手法は,適度な推論速度とトレーニングの計算オーバーヘッドを伴って,最先端の性能を精度良く達成する。
論文 参考訳(メタデータ) (2021-12-13T14:37:20Z) - Denoised Non-Local Neural Network for Semantic Segmentation [18.84185406522064]
クラス間ノイズとクラス内ノイズをそれぞれ除去するデノナイズド非ローカネットワーク(デノナイズドNL)を提案する。
提案したNLは,都市景観における83.5%,46.69% mIoU,ADE20Kの最先端性能を達成できる。
論文 参考訳(メタデータ) (2021-10-27T06:16:31Z) - Efficient Person Search: An Anchor-Free Approach [86.45858994806471]
パーソンサーチは、クエリーの人物を、リアルで切り刻まれていない画像から、同時にローカライズし、識別することを目的としている。
この目標を達成するために、最先端モデルは通常、Faster R-CNNのような2段階検出器にre-idブランチを追加する。
本研究では,この課題に対処するためのアンカーフリーな手法を提案する。
論文 参考訳(メタデータ) (2021-09-01T07:01:33Z) - Scope Head for Accurate Localization in Object Detection [135.9979405835606]
本研究では,各位置のアンカーを相互依存関係としてモデル化したScopeNetと呼ばれる新しい検出器を提案する。
我々の簡潔で効果的な設計により、提案したScopeNetはCOCOの最先端の成果を達成する。
論文 参考訳(メタデータ) (2020-05-11T04:00:09Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z) - 1st Place Solutions for OpenImage2019 -- Object Detection and Instance
Segmentation [116.25081559037872]
この記事では,2つのチャンピオンチーム,検出トラックのMMfruit'とセグメンテーショントラックのMMfruitSeg'のソリューションについて,OpenImage Challenge 2019で紹介する。
一般に、対象検出器の場合、バックボーンの端の共有特徴は分類と回帰の両方に適さないことが知られている。
自己学習型最適特徴抽出によりオブジェクトの分類と回帰を分離するデカップリングヘッド(DH)を提案する。
論文 参考訳(メタデータ) (2020-03-17T06:45:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。