論文の概要: GrooMeD-NMS: Grouped Mathematically Differentiable NMS for Monocular 3D
Object Detection
- arxiv url: http://arxiv.org/abs/2103.17202v1
- Date: Wed, 31 Mar 2021 16:29:50 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-01 14:44:35.778975
- Title: GrooMeD-NMS: Grouped Mathematically Differentiable NMS for Monocular 3D
Object Detection
- Title(参考訳): GrooMeD-NMS: 1次元物体検出のためのグループ化数学的微分可能なNMS
- Authors: Abhinav Kumar, Garrick Brazil and Xiaoming Liu
- Abstract要約: GrooMeD-NMS - 単分子3D物体検出のための新しいグループ数学的微分可能なNMS - を提示し、統合する。
GrooMeD-NMSはトレーニングパイプラインと推論パイプラインのミスマッチに対処する。
KITTIベンチマークデータセット上で、最先端のモノクル3Dオブジェクト検出結果を達成する。
- 参考スコア(独自算出の注目度): 25.313894069303718
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern 3D object detectors have immensely benefited from the end-to-end
learning idea. However, most of them use a post-processing algorithm called
Non-Maximal Suppression (NMS) only during inference. While there were attempts
to include NMS in the training pipeline for tasks such as 2D object detection,
they have been less widely adopted due to a non-mathematical expression of the
NMS. In this paper, we present and integrate GrooMeD-NMS -- a novel Grouped
Mathematically Differentiable NMS for monocular 3D object detection, such that
the network is trained end-to-end with a loss on the boxes after NMS. We first
formulate NMS as a matrix operation and then group and mask the boxes in an
unsupervised manner to obtain a simple closed-form expression of the NMS.
GrooMeD-NMS addresses the mismatch between training and inference pipelines
and, therefore, forces the network to select the best 3D box in a
differentiable manner. As a result, GrooMeD-NMS achieves state-of-the-art
monocular 3D object detection results on the KITTI benchmark dataset performing
comparably to monocular video-based methods. Code and models at
https://github.com/abhi1kumar/groomed_nms
- Abstract(参考訳): 現代の3Dオブジェクト検出器は、エンドツーエンドの学習のアイデアから大いに恩恵を受けている。
しかし、ほとんどの場合、推論時にのみNMS(Non-Maximal Suppression)と呼ばれる後処理アルゴリズムを使用する。
2Dオブジェクト検出などのタスクのためのトレーニングパイプラインにNMSを組み込もうとする試みはあったが、NMSの非数学的表現のため、広く採用されていない。
本稿では,ネットワークをエンドツーエンドに訓練し,nms後にボックスに損失を与えるような,単眼的3次元物体検出のための,数学的に微分可能な新しいnsmであるgraceed-nmsを提示・統合する。
まず NMS を行列演算として定式化し、次にボックスを教師なしでグループ化してマスクして NMS の単純な閉形式表現を得る。
GrooMeD-NMSはトレーニングと推論パイプラインのミスマッチに対処するため、ネットワークに最適な3Dボックスを異なる方法で選択させる。
結果として、GrooMeD-NMSは、モノキュラービデオベース手法に適合して動作するKITTIベンチマークデータセット上で、最先端のモノキュラー3Dオブジェクト検出結果を達成する。
https://github.com/abhi1kumar/groomed_nmsのコードとモデル
関連論文リスト
- UniDepth: Universal Monocular Metric Depth Estimation [81.80512457953903]
ドメインをまたいだ単一の画像からメートル法3Dシーンを再構成できる新しいモデルUniDepthを提案する。
我々のモデルは擬似球面出力表現を利用しており、カメラと奥行きの表現を歪めている。
ゼロショット方式における10のデータセットの詳細な評価は、一貫してUniDepthの優れた性能を示している。
論文 参考訳(メタデータ) (2024-03-27T18:06:31Z) - Fuzzy-NMS: Improving 3D Object Detection with Fuzzy Classification in
NMS [19.452760776980472]
非最大抑圧(NMS)は、多くの3Dオブジェクト検出フレームワークで使用される重要な後処理モジュールである。
ファジィ学習をNMSに導入し、より詳細な候補境界ボックスフィルタリングを実現するための一般化されたファジィ-NMSモジュールを提案する。
論文 参考訳(メタデータ) (2023-10-21T09:09:03Z) - BundleSDF: Neural 6-DoF Tracking and 3D Reconstruction of Unknown
Objects [89.2314092102403]
モノクロRGBDビデオシーケンスから未知物体の6-DoF追跡をリアルタイムに行う手法を提案する。
視覚的テクスチャがほとんど欠如している場合でも,任意の剛体オブジェクトに対して有効である。
論文 参考訳(メタデータ) (2023-03-24T17:13:49Z) - Detection Selection Algorithm: A Likelihood based Optimization Method to
Perform Post Processing for Object Detection [1.7188280334580197]
物体検出では、非最大抑圧(NMS)のような後処理法が広く用いられている。
画像中のオブジェクトとそのラベルの正確な数を求めるために,検出選択アルゴリズム (DSA) と呼ばれるポスト処理手法を提案する。
DSAは検出されたバウンディングボックスのサブセットを優雅に選択し、画像全体の解釈を最も高い確率で行う完全なオブジェクト再構成を行う。
論文 参考訳(メタデータ) (2022-12-12T05:15:18Z) - Learning Auxiliary Monocular Contexts Helps Monocular 3D Object
Detection [15.185462008629848]
モノクロ3Dオブジェクト検出は、入力された単一2D画像内の3Dバウンディングボックスをローカライズすることを目的としている。
本稿では, 余分な情報を活用することなく, 単分子物体検出のための簡易かつ効果的な定式化法を提案する。
モノラルな3Dオブジェクト検出を支援するために、トレーニングの補助タスクとしてモノラルなコンテキストを学習するMonoConメソッドを提案する。
論文 参考訳(メタデータ) (2021-12-09T00:05:34Z) - FGR: Frustum-Aware Geometric Reasoning for Weakly Supervised 3D Vehicle
Detection [81.79171905308827]
3Dアノテーションを使わずに点雲中の車両を検出するためのフラストラム対応幾何推論(FGR)を提案する。
本手法は粗い3次元セグメンテーションと3次元バウンディングボックス推定の2段階からなる。
2Dバウンディングボックスとスパースポイントクラウドだけで、3D空間内のオブジェクトを正確に検出できます。
論文 参考訳(メタデータ) (2021-05-17T07:29:55Z) - FCOS3D: Fully Convolutional One-Stage Monocular 3D Object Detection [78.00922683083776]
一般的な2D検出器をこの3Dタスクで動作させることは簡単ではない。
本報告では,完全畳み込み型単段検出器を用いた手法を用いてこの問題を考察する。
私たちのソリューションは、NeurIPS 2020のnuScenes 3D検出チャレンジのすべてのビジョンのみの方法の中で1位を獲得します。
論文 参考訳(メタデータ) (2021-04-22T09:35:35Z) - End-to-End Object Detection with Fully Convolutional Network [71.56728221604158]
エンドツーエンド検出を実現するために,分類のための予測対応ワン・ツー・ワン (POTO) ラベルの割り当てを導入する。
局所領域における畳み込みの判別性を向上させるために, 簡易な3次元maxフィルタ(3dmf)を提案する。
エンドツーエンドのフレームワークは,COCOおよびCrowdHumanデータセット上のNMSを用いて,最先端の多くの検出器と競合する性能を実現する。
論文 参考訳(メタデータ) (2020-12-07T09:14:55Z) - Visibility Guided NMS: Efficient Boosting of Amodal Object Detection in
Crowded Traffic Scenes [7.998326245039892]
現代の2Dオブジェクト検出フレームワークは、NMS(Non-Maximum-Suppression)を使用して洗練されたオブジェクトごとの複数のバウンディングボックスを予測し、1つのバウンディングボックスを除くすべてのバウンディングボックスを抑圧する。
我々の新しいVisibility Guided NMS(vg-NMS)は、ピクセルベースとアモーダルオブジェクト検出パラダイムの両方を活用し、特に計算オーバーヘッドの少ない高いオブジェクトに対して検出性能を向上させる。
我々は、KITTI、VIPER、Synscapesデータセットを用いてvg-NMSを評価し、現在の最先端NMSよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-06-15T17:03:23Z) - SESS: Self-Ensembling Semi-Supervised 3D Object Detection [138.80825169240302]
具体的には、ラベルのない新しい未知のデータに基づくネットワークの一般化を促進するための、徹底的な摂動スキームを設計する。
我々のSESSは、50%のラベル付きデータを用いて、最先端の完全教師付き手法と比較して、競争性能を達成している。
論文 参考訳(メタデータ) (2019-12-26T08:48:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。