論文の概要: Angle Based Feature Learning in GNN for 3D Object Detection using Point
Cloud
- arxiv url: http://arxiv.org/abs/2108.00780v1
- Date: Mon, 2 Aug 2021 10:56:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-03 15:33:14.237366
- Title: Angle Based Feature Learning in GNN for 3D Object Detection using Point
Cloud
- Title(参考訳): ポイントクラウドを用いた3次元物体検出のためのGNNにおける角度に基づく特徴学習
- Authors: Md Afzal Ansari, Md Meraz, Pavan Chakraborty and Mohammed Javed
- Abstract要約: 本稿では,点群における3次元物体検出のための特徴符号化手法を提案する。
車、歩行者、自転車といった3D物体の検出には、グラフニューラルネットワーク(GNN)を使用しました。
- 参考スコア(独自算出の注目度): 4.3012765978447565
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we present new feature encoding methods for Detection of 3D
objects in point clouds. We used a graph neural network (GNN) for Detection of
3D objects namely cars, pedestrians, and cyclists. Feature encoding is one of
the important steps in Detection of 3D objects. The dataset used is point cloud
data which is irregular and unstructured and it needs to be encoded in such a
way that ensures better feature encapsulation. Earlier works have used relative
distance as one of the methods to encode the features. These methods are not
resistant to rotation variance problems in Graph Neural Networks. We have
included angular-based measures while performing feature encoding in graph
neural networks. Along with that, we have performed a comparison between other
methods like Absolute, Relative, Euclidean distances, and a combination of the
Angle and Relative methods. The model is trained and evaluated on the subset of
the KITTI object detection benchmark dataset under resource constraints. Our
results demonstrate that a combination of angle measures and relative distance
has performed better than other methods. In comparison to the baseline
method(relative), it achieved better performance. We also performed time
analysis of various feature encoding methods.
- Abstract(参考訳): 本稿では,点群内の3次元物体検出のための特徴符号化手法を提案する。
車、歩行者、自転車といった3D物体の検出には、グラフニューラルネットワーク(GNN)を使用しました。
特徴符号化は3Dオブジェクトの検出における重要なステップの1つである。
使用されるデータセットは、不規則で構造化されていないポイントクラウドデータであり、より良い機能カプセル化を保証するような方法でエンコードする必要がある。
初期の作品では、特徴をエンコードする手法の1つとして相対距離を用いた。
これらの手法はグラフニューラルネットワークの回転分散問題に耐性がない。
グラフニューラルネットワークで特徴符号化を行いながら角ベースの測度を含む。
これに加えて、絶対値、相対値、ユークリッド距離などの他の手法と角度と相対値の組み合わせとの比較を行った。
モデルは、リソース制約下でkitti object detection benchmarkデータセットのサブセット上でトレーニングされ、評価される。
その結果,角度測定と相対距離の組み合わせは,他の手法よりも優れていることがわかった。
ベースライン法(相対法)と比較すると、性能は向上した。
また,様々な特徴符号化手法の時間解析を行った。
関連論文リスト
- Inverse Neural Rendering for Explainable Multi-Object Tracking [35.072142773300655]
我々はRGBカメラから3Dマルチオブジェクト追跡をEmphInverse Rendering (IR)問題として再放送した。
我々は、本質的に形状と外観特性を歪ませる生成潜在空間上の画像損失を最適化する。
本手法の一般化とスケーリング能力は,合成データのみから生成前を学習することで検証する。
論文 参考訳(メタデータ) (2024-04-18T17:37:53Z) - 3D Video Object Detection with Learnable Object-Centric Global
Optimization [65.68977894460222]
対応性に基づく最適化は3次元シーン再構成の基盤となるが、3次元ビデオオブジェクト検出では研究されていない。
オブジェクト中心の時間対応学習と特徴量付きオブジェクトバンドル調整を備えた、エンドツーエンドで最適化可能なオブジェクト検出器であるBA-Detを提案する。
論文 参考訳(メタデータ) (2023-03-27T17:39:39Z) - ALSO: Automotive Lidar Self-supervision by Occupancy estimation [70.70557577874155]
本稿では,ポイントクラウド上で動作している深層知覚モデルのバックボーンを事前学習するための自己教師型手法を提案する。
中心となる考え方は、3Dポイントがサンプリングされる表面の再構成であるプリテキストタスクでモデルをトレーニングすることである。
直感的には、もしネットワークがわずかな入力ポイントのみを考慮し、シーン表面を再構築できるなら、おそらく意味情報の断片をキャプチャする。
論文 参考訳(メタデータ) (2022-12-12T13:10:19Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - Learnable Online Graph Representations for 3D Multi-Object Tracking [156.58876381318402]
3D MOT問題に対する統一型学習型アプローチを提案します。
我々は、完全にトレーニング可能なデータアソシエーションにNeural Message Passing Networkを使用します。
AMOTAの65.6%の最先端性能と58%のIDスウィッチを達成して、公開可能なnuScenesデータセットに対する提案手法のメリットを示す。
論文 参考訳(メタデータ) (2021-04-23T17:59:28Z) - Dynamic Edge Weights in Graph Neural Networks for 3D Object Detection [0.0]
本稿では,LiDARスキャンにおける物体検出のためのグラフニューラルネットワーク(GNN)における注目に基づく特徴集約手法を提案する。
GNNの各層では、ノードごとの入力特徴を対応する上位特徴にマッピングする線形変換とは別に、ノードごとの注意を隠蔽する。
KITTIデータセットを用いた実験により,本手法は3次元物体検出に匹敵する結果が得られることが示された。
論文 参考訳(メタデータ) (2020-09-17T12:56:17Z) - Factor Graph based 3D Multi-Object Tracking in Point Clouds [8.411514688735183]
明示的および固定的な代入に依存しない新しい最適化に基づくアプローチを提案する。
我々は、実世界のKITTI追跡データセットの性能を実証し、多くの最先端アルゴリズムよりも優れた結果を得る。
論文 参考訳(メタデータ) (2020-08-12T13:34:46Z) - GNN3DMOT: Graph Neural Network for 3D Multi-Object Tracking with
Multi-Feature Learning [30.72094639797806]
3次元多物体追跡(MOT)は自律システムにとって不可欠である。
そこで本研究では,MOTの識別的特徴学習を改善するための2つの手法を提案する。
提案手法は, KITTI および nuScenes 3D MOT ベンチマーク上での最先端性能を実現する。
論文 参考訳(メタデータ) (2020-06-12T17:08:14Z) - DOPS: Learning to Detect 3D Objects and Predict their 3D Shapes [54.239416488865565]
LIDARデータに対する高速な1段3次元物体検出法を提案する。
我々の手法の中核となる新規性は高速かつシングルパスアーキテクチャであり、どちらも3次元の物体を検出し、それらの形状を推定する。
提案手法は,ScanNetシーンのオブジェクト検出で5%,オープンデータセットでは3.4%の精度で結果が得られた。
論文 参考訳(メタデータ) (2020-04-02T17:48:50Z) - D3Feat: Joint Learning of Dense Detection and Description of 3D Local
Features [51.04841465193678]
私たちは3Dポイントクラウドに3D完全畳み込みネットワークを活用しています。
本稿では,3次元点ごとに検出スコアと記述特徴の両方を密に予測する,新しい,実践的な学習機構を提案する。
本手法は,屋内と屋外の両方のシナリオで最先端の手法を実現する。
論文 参考訳(メタデータ) (2020-03-06T12:51:09Z) - Point-GNN: Graph Neural Network for 3D Object Detection in a Point Cloud [3.04585143845864]
本稿では,LiDAR点雲から物体を検出するグラフニューラルネットワークを提案する。
我々は、その点雲を近辺の固定半径グラフに効率よくエンコードする。
Point-GNNでは,翻訳のばらつきを低減する自動登録機構を提案する。
論文 参考訳(メタデータ) (2020-03-02T23:44:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。