論文の概要: Monocular 3D Object Detection with Sequential Feature Association and
Depth Hint Augmentation
- arxiv url: http://arxiv.org/abs/2011.14589v3
- Date: Wed, 2 Dec 2020 03:07:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-07 04:51:12.507208
- Title: Monocular 3D Object Detection with Sequential Feature Association and
Depth Hint Augmentation
- Title(参考訳): 逐次特徴関連と奥行き増強による単眼的3次元物体検出
- Authors: Tianze Gao, Huihui Pan, Huijun Gao
- Abstract要約: FADNetは、モノクル3Dオブジェクト検出の課題に対処するために提示される。
専用のディープヒントモジュールは、ディープヒントと呼ばれる行ワイズ機能を生成するように設計されている。
この研究の貢献は、KITTIベンチマークの実験およびアブレーション研究によって検証される。
- 参考スコア(独自算出の注目度): 12.55603878441083
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Monocular 3D object detection is a promising research topic for the
intelligent perception systems of autonomous driving. In this work, a
single-stage keypoint-based network, named as FADNet, is presented to address
the task of monocular 3D object detection. In contrast to previous
keypoint-based methods which adopt identical layouts for output branches, we
propose to divide the output modalities into different groups according to the
estimating difficulty, whereby different groups are treated differently by
sequential feature association. Another contribution of this work is the
strategy of depth hint augmentation. To provide characterized depth patterns as
hints for depth estimation, a dedicated depth hint module is designed to
generate row-wise features named as depth hints, which are explicitly
supervised in a bin-wise manner. In the training stage, the regression outputs
are uniformly encoded to enable loss disentanglement. The 2D loss term is
further adapted to be depth-aware for improving the detection accuracy of small
objects. The contributions of this work are validated by conducting experiments
and ablation study on the KITTI benchmark. Without utilizing depth priors, post
optimization, or other refinement modules, our network performs competitively
against state-of-the-art methods while maintaining a decent running speed.
- Abstract(参考訳): モノキュラー3次元物体検出は、自律運転の知的知覚システムにとって有望な研究課題である。
本研究では,FADNetと呼ばれる単一ステージのキーポイントベースネットワークを提示し,モノクロ3Dオブジェクト検出の課題に対処する。
出力分岐に同一のレイアウトを取り入れた従来のキーポイント方式とは対照的に、推定困難度に応じて出力モードを異なるグループに分割し、異なるグループを逐次的特徴結合によって異なる扱いをする。
この研究のもうひとつの貢献は、深さヒント増強の戦略である。
深度推定用ヒントとして特徴的深度パターンを提供することを課題とし、専用深度ヒントモジュールは、ビンワイズで明示的に管理された深度ヒントと呼ばれる行ワイズ特徴を生成するように設計されている。
トレーニング段階では、回帰出力を均一に符号化し、損失分散を可能にする。
2D損失項はさらに、小物体の検出精度を向上させるために深度認識に適合する。
この研究の貢献は、KITTIベンチマークの実験およびアブレーション研究によって検証される。
我々のネットワークは、深さ優先やポスト最適化などの改良モジュールを使わずに、適正な実行速度を維持しながら最先端の手法に対して競争力を発揮する。
関連論文リスト
- MonoCD: Monocular 3D Object Detection with Complementary Depths [9.186673054867866]
深度推定は単分子3次元物体検出に不可欠だが挑戦的なサブタスクである。
2つの新しい設計で深度の相補性を高めることを提案する。
KITTIベンチマーク実験により, 余分なデータを導入することなく, 最先端の性能を実現することができた。
論文 参考訳(メタデータ) (2024-04-04T03:30:49Z) - Self-Supervised Monocular Depth Estimation by Direction-aware Cumulative
Convolution Network [80.19054069988559]
自己教師付き単眼深度推定は, 方向感度と環境依存性を示す。
本稿では2つの側面において深度表現を改善する方向対応累積畳み込みネットワーク(DaCCN)を提案する。
実験の結果,提案手法は広く使用されている3つのベンチマークにおいて大幅な改善が得られた。
論文 参考訳(メタデータ) (2023-08-10T14:32:18Z) - SwinDepth: Unsupervised Depth Estimation using Monocular Sequences via
Swin Transformer and Densely Cascaded Network [29.798579906253696]
教師付きトレーニングのための深層地下深度ラベルの取得は困難であり,単分子配列を用いた教師なし深度推定が有望な代替手段として出現する。
本稿では,画像特徴抽出器としてコンボリューションフリーのSwin Transformerを用い,局所的幾何学的特徴と大域的意味的特徴の両方を網羅して深度推定を行う。
また,Densely Cascaded Multi-scale Network (DCMNet)を提案する。
論文 参考訳(メタデータ) (2023-01-17T06:01:46Z) - OPA-3D: Occlusion-Aware Pixel-Wise Aggregation for Monocular 3D Object
Detection [51.153003057515754]
OPA-3Dは、Occlusion-Aware Pixel-Wise Aggregationネットワークである。
密集した風景深度と、奥行きのある箱残量と物の境界箱を共同で推定する。
メインカーのカテゴリーでは最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2022-11-02T14:19:13Z) - Joint Learning of Salient Object Detection, Depth Estimation and Contour
Extraction [91.43066633305662]
RGB-D Salient Object Detection (SOD) のための新しいマルチタスク・マルチモーダルフィルタトランス (MMFT) ネットワークを提案する。
具体的には、深度推定、健全な物体検出、輪郭推定の3つの相補的なタスクを統合する。マルチタスク機構は、タスク認識の特徴を補助タスクから学習するためのモデルを促進する。
実験の結果、複数のデータセット上での深度に基づくRGB-D SOD法をはるかに上回るだけでなく、高品質の深度マップと塩分濃度を同時に正確に予測できることがわかった。
論文 参考訳(メタデータ) (2022-03-09T17:20:18Z) - The Devil is in the Task: Exploiting Reciprocal Appearance-Localization
Features for Monocular 3D Object Detection [62.1185839286255]
低コストのモノクル3D物体検出は、自律運転において基本的な役割を果たす。
DFR-Netという動的特徴反射ネットワークを導入する。
我々は、KITTIテストセットの全ての単分子3D物体検出器の中で、第1位にランク付けする。
論文 参考訳(メタデータ) (2021-12-28T07:31:18Z) - Depth-conditioned Dynamic Message Propagation for Monocular 3D Object
Detection [86.25022248968908]
モノラル3Dオブジェクト検出の問題を解決するために、コンテキストと奥行きを認識する特徴表現を学びます。
KITTIベンチマークデータセットにおける単眼的アプローチにおける最新の結果を示す。
論文 参考訳(メタデータ) (2021-03-30T16:20:24Z) - M3DSSD: Monocular 3D Single Stage Object Detector [82.25793227026443]
特徴アライメントと非対称非局所的注意を有するモノクロ3次元単段物体検出器(M3DSSD)を提案する。
提案したM3DSSDは,KITTIデータセット上のモノラルな3Dオブジェクト検出手法よりも大幅に性能が向上する。
論文 参考訳(メタデータ) (2021-03-24T13:09:11Z) - IAFA: Instance-aware Feature Aggregation for 3D Object Detection from a
Single Image [37.83574424518901]
単一の画像からの3Dオブジェクト検出は、自動運転において重要なタスクです。
本稿では,3次元物体検出の精度向上のために有用な情報を集約するインスタンス認識手法を提案する。
論文 参考訳(メタデータ) (2021-03-05T05:47:52Z) - DELTAS: Depth Estimation by Learning Triangulation And densification of
Sparse points [14.254472131009653]
多視点ステレオ (MVS) は, 能動深度センシングの精度と単眼深度推定の実用性の間の黄金平均値である。
3次元畳み込みニューラルネットワーク(CNN)を用いたコストボリュームベースのアプローチにより、MVSシステムの精度が大幅に向上した。
まず、(a)興味点の記述子を検出して評価し、次に(b)興味点の小さな集合をマッチングして三角測量し、最後に(c)CNNを用いてこのスパースな3D点の集合を密度化することで、効率的な深さ推定手法を提案する。
論文 参考訳(メタデータ) (2020-03-19T17:56:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。