論文の概要: End-to-End Object Detection with Fully Convolutional Network
- arxiv url: http://arxiv.org/abs/2012.03544v3
- Date: Fri, 26 Mar 2021 03:38:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-21 02:54:52.986087
- Title: End-to-End Object Detection with Fully Convolutional Network
- Title(参考訳): 完全畳み込みネットワークによる終端物体検出
- Authors: Jianfeng Wang, Lin Song, Zeming Li, Hongbin Sun, Jian Sun, Nanning
Zheng
- Abstract要約: エンドツーエンド検出を実現するために,分類のための予測対応ワン・ツー・ワン (POTO) ラベルの割り当てを導入する。
局所領域における畳み込みの判別性を向上させるために, 簡易な3次元maxフィルタ(3dmf)を提案する。
エンドツーエンドのフレームワークは,COCOおよびCrowdHumanデータセット上のNMSを用いて,最先端の多くの検出器と競合する性能を実現する。
- 参考スコア(独自算出の注目度): 71.56728221604158
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Mainstream object detectors based on the fully convolutional network has
achieved impressive performance. While most of them still need a hand-designed
non-maximum suppression (NMS) post-processing, which impedes fully end-to-end
training. In this paper, we give the analysis of discarding NMS, where the
results reveal that a proper label assignment plays a crucial role. To this
end, for fully convolutional detectors, we introduce a Prediction-aware
One-To-One (POTO) label assignment for classification to enable end-to-end
detection, which obtains comparable performance with NMS. Besides, a simple 3D
Max Filtering (3DMF) is proposed to utilize the multi-scale features and
improve the discriminability of convolutions in the local region. With these
techniques, our end-to-end framework achieves competitive performance against
many state-of-the-art detectors with NMS on COCO and CrowdHuman datasets. The
code is available at https://github.com/Megvii-BaseDetection/DeFCN .
- Abstract(参考訳): 完全畳み込みネットワークに基づく主流の物体検出器は素晴らしい性能を達成している。
それらのほとんどは、完全にエンドツーエンドのトレーニングを妨げる、手作りの非最大抑制(nms)後処理を必要とする。
本稿では, 廃棄されたnmsの分析を行い, 適切なラベル割り当てが重要な役割を担っていることを示す。
そこで本研究では,完全畳み込み検出器に対して,分類のための1対1(poto)ラベル割り当てを導入し,エンドツーエンド検出を可能にし,nmsと同等の性能を得る。
また,マルチスケール特徴を活用し,局所領域における畳み込みの判別性を向上させるため,簡易な3dmaxフィルタ(3dmf)を提案する。
これらの手法により、我々のエンドツーエンドフレームワークは、COCOおよびCrowdHumanデータセット上のNMSを用いた多くの最先端検出器と競合する性能を達成する。
コードはhttps://github.com/Megvii-BaseDetection/DeFCNで入手できる。
関連論文リスト
- Fuzzy-NMS: Improving 3D Object Detection with Fuzzy Classification in
NMS [19.452760776980472]
非最大抑圧(NMS)は、多くの3Dオブジェクト検出フレームワークで使用される重要な後処理モジュールである。
ファジィ学習をNMSに導入し、より詳細な候補境界ボックスフィルタリングを実現するための一般化されたファジィ-NMSモジュールを提案する。
論文 参考訳(メタデータ) (2023-10-21T09:09:03Z) - SSDA3D: Semi-supervised Domain Adaptation for 3D Object Detection from
Point Cloud [125.9472454212909]
本稿では,3次元物体検出(SSDA3D)のための半改良型領域適応法を提案する。
SSDA3Dはドメイン間適応ステージとドメイン内一般化ステージを含む。
実験の結果,10%のラベル付きターゲットデータしか持たないSSDA3Dは,100%のターゲットラベルを持つ完全教師付きオラクルモデルを上回ることができることがわかった。
論文 参考訳(メタデータ) (2022-12-06T09:32:44Z) - Implicit and Efficient Point Cloud Completion for 3D Single Object
Tracking [9.372859423951349]
適応リファイン予測(ARP)とターゲット知識伝達(TKT)の2つの新しいモジュールを紹介する。
本モデルでは,より少ない計算量を維持しながら,最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-09-01T15:11:06Z) - Omni-supervised Point Cloud Segmentation via Gradual Receptive Field
Component Reasoning [41.83979510282989]
提案した RFCR (Receptive Field Component Reasoning) を通したクラウドセグメンテーションに,最初のオムニスケール監視手法を導入する。
提案手法は,S3DIS と Semantic3D に対して新たな最先端性能を実現し,ScanNet ベンチマークの1位にランクインする。
論文 参考訳(メタデータ) (2021-05-21T08:32:02Z) - Object Detection Made Simpler by Eliminating Heuristic NMS [70.93004137521946]
単純なNMSのないエンドツーエンドのオブジェクト検出フレームワークを示す。
検出精度は元の1段検出器と比べて同等か、さらに向上した。
論文 参考訳(メタデータ) (2021-01-28T02:38:29Z) - PC-RGNN: Point Cloud Completion and Graph Neural Network for 3D Object
Detection [57.49788100647103]
LiDARベースの3Dオブジェクト検出は、自動運転にとって重要なタスクです。
現在のアプローチでは、遠方および閉ざされた物体の偏りと部分的な点雲に苦しむ。
本稿では,この課題を2つの解決法で解決する新しい二段階アプローチ,pc-rgnnを提案する。
論文 参考訳(メタデータ) (2020-12-18T18:06:43Z) - Visibility Guided NMS: Efficient Boosting of Amodal Object Detection in
Crowded Traffic Scenes [7.998326245039892]
現代の2Dオブジェクト検出フレームワークは、NMS(Non-Maximum-Suppression)を使用して洗練されたオブジェクトごとの複数のバウンディングボックスを予測し、1つのバウンディングボックスを除くすべてのバウンディングボックスを抑圧する。
我々の新しいVisibility Guided NMS(vg-NMS)は、ピクセルベースとアモーダルオブジェクト検出パラダイムの両方を活用し、特に計算オーバーヘッドの少ない高いオブジェクトに対して検出性能を向上させる。
我々は、KITTI、VIPER、Synscapesデータセットを用いてvg-NMSを評価し、現在の最先端NMSよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-06-15T17:03:23Z) - siaNMS: Non-Maximum Suppression with Siamese Networks for Multi-Camera
3D Object Detection [65.03384167873564]
サイムズネットワークは、よく知られた3Dオブジェクト検出器アプローチのパイプラインに統合される。
アソシエーションはオブジェクトの3Dボックスレグレッションを強化するために利用される。
nuScenesデータセットの実験的評価は,提案手法が従来のNMS手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2020-02-19T15:32:38Z) - SESS: Self-Ensembling Semi-Supervised 3D Object Detection [138.80825169240302]
具体的には、ラベルのない新しい未知のデータに基づくネットワークの一般化を促進するための、徹底的な摂動スキームを設計する。
我々のSESSは、50%のラベル付きデータを用いて、最先端の完全教師付き手法と比較して、競争性能を達成している。
論文 参考訳(メタデータ) (2019-12-26T08:48:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。