論文の概要: Object Detection Made Simpler by Eliminating Heuristic NMS
- arxiv url: http://arxiv.org/abs/2101.11782v1
- Date: Thu, 28 Jan 2021 02:38:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-01-31 18:18:31.807654
- Title: Object Detection Made Simpler by Eliminating Heuristic NMS
- Title(参考訳): ヒューリスティックNMSの除去による簡易な物体検出
- Authors: Qiang Zhou and Chaohui Yu and Chunhua Shen and Zhibin Wang and Hao Li
- Abstract要約: 単純なNMSのないエンドツーエンドのオブジェクト検出フレームワークを示す。
検出精度は元の1段検出器と比べて同等か、さらに向上した。
- 参考スコア(独自算出の注目度): 70.93004137521946
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We show a simple NMS-free, end-to-end object detection framework, of which
the network is a minimal modification to a one-stage object detector such as
the FCOS detection model [Tian et al. 2019]. We attain on par or even improved
detection accuracy compared with the original one-stage detector. It performs
detection at almost the same inference speed, while being even simpler in that
now the post-processing NMS (non-maximum suppression) is eliminated during
inference. If the network is capable of identifying only one positive sample
for prediction for each ground-truth object instance in an image, then NMS
would become unnecessary. This is made possible by attaching a compact PSS head
for automatic selection of the single positive sample for each instance (see
Fig. 1). As the learning objective involves both one-to-many and one-to-one
label assignments, there is a conflict in the labels of some training examples,
making the learning challenging. We show that by employing a stop-gradient
operation, we can successfully tackle this issue and train the detector. On the
COCO dataset, our simple design achieves superior performance compared to both
the FCOS baseline detector with NMS post-processing and the recent end-to-end
NMS-free detectors. Our extensive ablation studies justify the rationale of the
design choices.
- Abstract(参考訳): FCOS検出モデル[Tian et al.]のようなワンステージオブジェクト検出器へのネットワーク変更を最小限に抑えた、シンプルなNMSフリーのエンドツーエンドオブジェクト検出フレームワークを紹介します。
2019].
従来の1段検出器と同等かそれ以上に検出精度が向上した。
ほぼ同じ推論速度で検出を行うが、さらに単純化され、推論中に後処理のNMS(non-maximum suppress)が排除される。
ネットワークが画像内の各接地対象インスタンスの予測のために1つの正のサンプルのみを識別することができる場合、NMSは不要になります。
これは、各インスタンスに対して単一の正のサンプルを自動的に選択するためにコンパクトなpssヘッドを取り付けることで可能となる(図参照)。
1).
学習目的は1対1のラベル割り当てと1対1のラベル割り当ての両方を含むため、いくつかのトレーニング例のラベルには矛盾があり、学習を困難にします。
ストップグレード操作を用いることで,この問題に対処し,検出器を訓練できることを示す。
COCOデータセットでは, NMS後処理によるFCOSベースライン検出器と, 最新のエンドツーエンドNMSフリー検出器と比較して, 簡便な設計が優れている。
当社の広範なアブレーション研究は、設計選択の合理性を正当化します。
関連論文リスト
- MutDet: Mutually Optimizing Pre-training for Remote Sensing Object Detection [36.478530086163744]
本研究では,MutDetと呼ばれるリモートセンシングオブジェクト検出のための,Mutally最適化事前学習フレームワークを提案する。
MutDetはオブジェクトの埋め込みを融合し、検出器は最後のエンコーダ層に双方向に機能し、情報インタラクションを強化する。
様々な環境での実験は、新しい最先端の転送性能を示している。
論文 参考訳(メタデータ) (2024-07-13T15:28:15Z) - Label-Efficient Object Detection via Region Proposal Network
Pre-Training [58.50615557874024]
地域提案ネットワーク(RPN)に効果的な事前学習を提供するための簡単な事前学習タスクを提案する。
RPN事前学習のないマルチステージ検出器と比較して,本手法はダウンストリームタスク性能を継続的に改善することができる。
論文 参考訳(メタデータ) (2022-11-16T16:28:18Z) - W2N:Switching From Weak Supervision to Noisy Supervision for Object
Detection [64.10643170523414]
弱い監督からうるさい監督(W2N)に切り替える新しいパラダイムを持つ新しいWSODフレームワークを提案する。
ローカライズ適応モジュールでは、元の擬似接地構造における識別部分の割合を減らすために正規化損失を提案する。
我々のW2Nは、既存の純粋なWSODメソッドや転送学習メソッドよりも優れています。
論文 参考訳(メタデータ) (2022-07-25T12:13:48Z) - SIOD: Single Instance Annotated Per Category Per Image for Object
Detection [67.64774488115299]
画像内の既存のカテゴリ毎に1つのインスタンスアノテーションのみを必要とする単一インスタンスアノテーションオブジェクト検出(SIOD)を提案する。
WSOD(Inter-task)やSSOD(Inter-image)の相違点からイメージ内の相違点に分解されたSIODは、ラベルなしインスタンスの残りをマイニングする上で、より信頼性が高く豊富な事前知識を提供する。
SIOD設定下では、類似性に基づく擬似ラベル生成モジュール(SPLG)と、Pixelレベルのグループコントラスト学習モジュール(PGCL)からなる、シンプルで効果的なフレームワークであるDual-Mining(DMiner)を提案する。
論文 参考訳(メタデータ) (2022-03-29T08:49:51Z) - End-to-End Object Detection with Fully Convolutional Network [71.56728221604158]
エンドツーエンド検出を実現するために,分類のための予測対応ワン・ツー・ワン (POTO) ラベルの割り当てを導入する。
局所領域における畳み込みの判別性を向上させるために, 簡易な3次元maxフィルタ(3dmf)を提案する。
エンドツーエンドのフレームワークは,COCOおよびCrowdHumanデータセット上のNMSを用いて,最先端の多くの検出器と競合する性能を実現する。
論文 参考訳(メタデータ) (2020-12-07T09:14:55Z) - Co-mining: Self-Supervised Learning for Sparsely Annotated Object
Detection [29.683119976550007]
我々は,簡潔な注釈付き物体検出のためのシンプルだが効果的な機構であるCo-miningを提案する。
共同マイニングでは、シームズネットワークの2つのブランチが互いに擬似ラベルセットを予測します。
実験は3つの異なるアノテートされた設定でMSデータセット上で行われる。
論文 参考訳(メタデータ) (2020-12-03T14:23:43Z) - FCOS: A simple and strong anchor-free object detector [111.87691210818194]
物体検出を画素ごとの予測方式で解くために, 完全畳み込み型一段物検出器 (FCOS) を提案する。
RetinaNet、SSD、YOLOv3、Faster R-CNNといった最先端のオブジェクト検出器のほとんどは、事前に定義されたアンカーボックスに依存している。
対照的に、提案した検出器FCOSはアンカーボックスフリーであり、提案はフリーである。
論文 参考訳(メタデータ) (2020-06-14T01:03:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。