論文の概要: 3D Harmonic Loss: Towards Task-consistent and Time-friendly 3D Object
Detection on Edge for Intelligent Transportation System
- arxiv url: http://arxiv.org/abs/2211.03407v1
- Date: Mon, 7 Nov 2022 10:11:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 17:29:12.100248
- Title: 3D Harmonic Loss: Towards Task-consistent and Time-friendly 3D Object
Detection on Edge for Intelligent Transportation System
- Title(参考訳): 3次元高調波損失:知的交通システムのためのエッジ上でのタスク一貫性と時間フレンドリーな3次元物体検出に向けて
- Authors: Haolin Zhang, M S Mekala, Zulkar Nain, Ju H. Park, Ho-Youl Jung
- Abstract要約: 本稿では,ポイントクラウドに基づく不整合予測を緩和する3次元高調波損失関数を提案する。
提案手法はベンチマークモデルよりも性能が大幅に向上する。
私たちのコードはオープンソースで公開されています。
- 参考スコア(独自算出の注目度): 28.55894241049706
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Edge computing-based 3D perception has received attention in intelligent
transportation systems (ITS) because real-time monitoring of traffic candidates
potentially strengthens Vehicle-to-Everything (V2X) orchestration. Thanks to
the capability of precisely measuring the depth information on surroundings
from LiDAR, the increasing studies focus on lidar-based 3D detection, which
significantly promotes the development of 3D perception. Few methods met the
real-time requirement of edge deployment because of high computation-intensive
operations. Moreover, an inconsistency problem of object detection remains
uncovered in the pointcloud domain due to large sparsity. This paper thoroughly
analyses this problem, comprehensively roused by recent works on determining
inconsistency problems in the image specialisation. Therefore, we proposed a 3D
harmonic loss function to relieve the pointcloud based inconsistent
predictions. Moreover, the feasibility of 3D harmonic loss is demonstrated from
a mathematical optimization perspective. The KITTI dataset and DAIR-V2X-I
dataset are used for simulations, and our proposed method considerably improves
the performance than benchmark models. Further, the simulative deployment on an
edge device (Jetson Xavier TX) validates our proposed model's efficiency. Our
code is open-source and publicly available.
- Abstract(参考訳): エッジコンピューティングに基づく3D認識は、交通候補のリアルタイム監視がV2Xオーケストレーションを強化する可能性があるため、インテリジェントトランスポートシステム(ITS)において注目を集めている。
LiDARの周囲の深度情報を正確に測定する能力のおかげで、LiDARはライダーベースの3D検出に焦点を合わせ、三次元知覚の発達を著しく促進する。
高い計算集約操作のため、エッジデプロイメントのリアルタイム要件を満たす手法はほとんどなかった。
さらに、pointcloudドメインでは、オブジェクト検出の不整合問題が大きなスパースのために発見されている。
本稿では,画像専門化における不整合問題を決定する最近の研究から,この問題を包括的に解析する。
そこで我々は,ポイントクラウドに基づく不整合予測を緩和する3次元高調波損失関数を提案する。
さらに,数理最適化の観点から3次元高調波損失の実現可能性を示す。
KITTIデータセットとDAIR-V2X-Iデータセットをシミュレーションに使用し,提案手法はベンチマークモデルよりも大幅に性能を向上する。
さらに,エッジデバイス(Jetson Xavier TX)へのシミュレーション配置により,提案モデルの有効性が検証された。
私たちのコードはオープンソースで公開されています。
関連論文リスト
- OriCon3D: Effective 3D Object Detection using Orientation and Confidence [0.0]
1つの画像から3次元物体を検出するための高度な手法を提案する。
我々は、深層畳み込みニューラルネットワークに基づく3Dオブジェクト重み付け指向回帰パラダイムを用いる。
提案手法は, 3次元オブジェクトのポーズ決定の精度を大幅に向上し, ベースライン法を超越した。
論文 参考訳(メタデータ) (2023-04-27T19:52:47Z) - BSH-Det3D: Improving 3D Object Detection with BEV Shape Heatmap [10.060577111347152]
我々は,BSH-Det3Dという新しいLiDARベースの3Dオブジェクト検出モデルを提案する。
鳥の視線から完全な形状を推定することにより、空間的特徴を高める効果的な方法を適用する。
KITTIベンチマークの実験は、精度と速度の観点から最先端(SOTA)性能を達成する。
論文 参考訳(メタデータ) (2023-03-03T15:13:11Z) - An Efficient Convex Hull-based Vehicle Pose Estimation Method for 3D
LiDAR [1.9580473532948401]
自動運転車の認識技術において,LiDARを用いた車両の姿勢推定が不可欠である。
既存のポーズ推定手法を用いて3次元LiDARに基づく良好なポーズ抽出を実現することは困難である。
凸船体に基づく新しい車両のポーズ推定手法を提案する。
論文 参考訳(メタデータ) (2023-02-02T11:57:41Z) - Normal Transformer: Extracting Surface Geometry from LiDAR Points
Enhanced by Visual Semantics [6.516912796655748]
本稿では,3次元点雲と2次元カラー画像から正規分布を推定する手法を提案する。
我々は,視覚的セマンティクスと3次元幾何データのハイブリッド情報を活用することを学ぶトランスフォーマーニューラルネットワークを開発した。
論文 参考訳(メタデータ) (2022-11-19T03:55:09Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - Homography Loss for Monocular 3D Object Detection [54.04870007473932]
ホログラフィーロス(Homography Loss)と呼ばれる,2次元情報と3次元情報の両方を利用する識別可能なロス関数を提案する。
提案手法は,KITTI 3Dデータセットにおいて,他の最先端技術と比較して高い性能を示す。
論文 参考訳(メタデータ) (2022-04-02T03:48:03Z) - Cylindrical and Asymmetrical 3D Convolution Networks for LiDAR-based
Perception [122.53774221136193]
運転時のLiDARに基づく認識のための最先端の手法は、しばしば点雲を2D空間に投影し、2D畳み込みによって処理する。
自然な対策として、3Dボクセル化と3D畳み込みネットワークを利用する方法がある。
本研究では,3次元幾何学的パターンを探索するために,円筒状分割と非対称な3次元畳み込みネットワークを設計する,屋外LiDARセグメンテーションのための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-12T06:25:11Z) - Semi-supervised 3D Object Detection via Adaptive Pseudo-Labeling [18.209409027211404]
3次元物体検出はコンピュータビジョンにおいて重要な課題である。
既存のほとんどのメソッドでは、多くの高品質な3Dアノテーションが必要です。
本研究では,屋外3次元物体検出タスクのための擬似ラベルに基づく新しい半教師付きフレームワークを提案する。
論文 参考訳(メタデータ) (2021-08-15T02:58:43Z) - PLUME: Efficient 3D Object Detection from Stereo Images [95.31278688164646]
既存の手法では、2つのステップでこの問題に対処する: 第一深度推定を行い、その深さ推定から擬似LiDAR点雲表現を計算し、3次元空間で物体検出を行う。
この2つのタスクを同一のメトリック空間で統一するモデルを提案する。
提案手法は,既存の手法と比較して推定時間を大幅に削減し,挑戦的なKITTIベンチマークの最先端性能を実現する。
論文 参考訳(メタデータ) (2021-01-17T05:11:38Z) - InfoFocus: 3D Object Detection for Autonomous Driving with Dynamic
Information Modeling [65.47126868838836]
動的情報モデリングを用いた新しい3次元オブジェクト検出フレームワークを提案する。
粗い予測は、ボクセルベースの領域提案ネットワークを介して第1段階で生成される。
大規模なnuScenes 3D検出ベンチマークで実験を行った。
論文 参考訳(メタデータ) (2020-07-16T18:27:08Z) - SESS: Self-Ensembling Semi-Supervised 3D Object Detection [138.80825169240302]
具体的には、ラベルのない新しい未知のデータに基づくネットワークの一般化を促進するための、徹底的な摂動スキームを設計する。
我々のSESSは、50%のラベル付きデータを用いて、最先端の完全教師付き手法と比較して、競争性能を達成している。
論文 参考訳(メタデータ) (2019-12-26T08:48:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。