論文の概要: 3D Harmonic Loss: Towards Task-consistent and Time-friendly 3D Object
Detection on Edge for Intelligent Transportation System
- arxiv url: http://arxiv.org/abs/2211.03407v1
- Date: Mon, 7 Nov 2022 10:11:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 17:29:12.100248
- Title: 3D Harmonic Loss: Towards Task-consistent and Time-friendly 3D Object
Detection on Edge for Intelligent Transportation System
- Title(参考訳): 3次元高調波損失:知的交通システムのためのエッジ上でのタスク一貫性と時間フレンドリーな3次元物体検出に向けて
- Authors: Haolin Zhang, M S Mekala, Zulkar Nain, Ju H. Park, Ho-Youl Jung
- Abstract要約: 本稿では,ポイントクラウドに基づく不整合予測を緩和する3次元高調波損失関数を提案する。
提案手法はベンチマークモデルよりも性能が大幅に向上する。
私たちのコードはオープンソースで公開されています。
- 参考スコア(独自算出の注目度): 28.55894241049706
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Edge computing-based 3D perception has received attention in intelligent
transportation systems (ITS) because real-time monitoring of traffic candidates
potentially strengthens Vehicle-to-Everything (V2X) orchestration. Thanks to
the capability of precisely measuring the depth information on surroundings
from LiDAR, the increasing studies focus on lidar-based 3D detection, which
significantly promotes the development of 3D perception. Few methods met the
real-time requirement of edge deployment because of high computation-intensive
operations. Moreover, an inconsistency problem of object detection remains
uncovered in the pointcloud domain due to large sparsity. This paper thoroughly
analyses this problem, comprehensively roused by recent works on determining
inconsistency problems in the image specialisation. Therefore, we proposed a 3D
harmonic loss function to relieve the pointcloud based inconsistent
predictions. Moreover, the feasibility of 3D harmonic loss is demonstrated from
a mathematical optimization perspective. The KITTI dataset and DAIR-V2X-I
dataset are used for simulations, and our proposed method considerably improves
the performance than benchmark models. Further, the simulative deployment on an
edge device (Jetson Xavier TX) validates our proposed model's efficiency. Our
code is open-source and publicly available.
- Abstract(参考訳): エッジコンピューティングに基づく3D認識は、交通候補のリアルタイム監視がV2Xオーケストレーションを強化する可能性があるため、インテリジェントトランスポートシステム(ITS)において注目を集めている。
LiDARの周囲の深度情報を正確に測定する能力のおかげで、LiDARはライダーベースの3D検出に焦点を合わせ、三次元知覚の発達を著しく促進する。
高い計算集約操作のため、エッジデプロイメントのリアルタイム要件を満たす手法はほとんどなかった。
さらに、pointcloudドメインでは、オブジェクト検出の不整合問題が大きなスパースのために発見されている。
本稿では,画像専門化における不整合問題を決定する最近の研究から,この問題を包括的に解析する。
そこで我々は,ポイントクラウドに基づく不整合予測を緩和する3次元高調波損失関数を提案する。
さらに,数理最適化の観点から3次元高調波損失の実現可能性を示す。
KITTIデータセットとDAIR-V2X-Iデータセットをシミュレーションに使用し,提案手法はベンチマークモデルよりも大幅に性能を向上する。
さらに,エッジデバイス(Jetson Xavier TX)へのシミュレーション配置により,提案モデルの有効性が検証された。
私たちのコードはオープンソースで公開されています。
関連論文リスト
- OccLoff: Learning Optimized Feature Fusion for 3D Occupancy Prediction [5.285847977231642]
3Dセマンティック占有予測は、自動運転の安全性を確保するために不可欠である。
既存のフュージョンベースの占有法では、画像の特徴に対して2次元から3次元のビュー変換を行うのが一般的である。
OccLoffは3次元占有予測のためにFeature Fusionを最適化するフレームワークである。
論文 参考訳(メタデータ) (2024-11-06T06:34:27Z) - HeightFormer: A Semantic Alignment Monocular 3D Object Detection Method from Roadside Perspective [11.841338298700421]
本研究では,空間的前駆体とVoxel Pooling formerを統合した3次元物体検出フレームワークを提案する。
Rope3DとDAIR-V2X-Iデータセットを用いて実験を行い、提案アルゴリズムが車とサイクリストの両方を検知する際の性能を実証した。
論文 参考訳(メタデータ) (2024-10-10T09:37:33Z) - STONE: A Submodular Optimization Framework for Active 3D Object Detection [20.54906045954377]
正確な3Dオブジェクト検出器をトレーニングするための鍵となる要件は、大量のLiDARベースのポイントクラウドデータが利用できることである。
本稿では,3次元物体検出装置のトレーニングにおけるラベル付けコストを大幅に削減する,統合されたアクティブな3次元物体検出フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-04T20:45:33Z) - Future Does Matter: Boosting 3D Object Detection with Temporal Motion Estimation in Point Cloud Sequences [25.74000325019015]
クロスフレーム動作予測情報を用いた時空間特徴学習を容易にするために,新しいLiDAR 3Dオブジェクト検出フレームワークLiSTMを導入する。
我々は,本フレームワークが優れた3次元検出性能を実現することを示すため,アグリゲーションとnuScenesデータセットの実験を行った。
論文 参考訳(メタデータ) (2024-09-06T16:29:04Z) - Normal Transformer: Extracting Surface Geometry from LiDAR Points
Enhanced by Visual Semantics [6.516912796655748]
本稿では,3次元点雲と2次元カラー画像から正規分布を推定する手法を提案する。
我々は,視覚的セマンティクスと3次元幾何データのハイブリッド情報を活用することを学ぶトランスフォーマーニューラルネットワークを開発した。
論文 参考訳(メタデータ) (2022-11-19T03:55:09Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - Homography Loss for Monocular 3D Object Detection [54.04870007473932]
ホログラフィーロス(Homography Loss)と呼ばれる,2次元情報と3次元情報の両方を利用する識別可能なロス関数を提案する。
提案手法は,KITTI 3Dデータセットにおいて,他の最先端技術と比較して高い性能を示す。
論文 参考訳(メタデータ) (2022-04-02T03:48:03Z) - Cylindrical and Asymmetrical 3D Convolution Networks for LiDAR-based
Perception [122.53774221136193]
運転時のLiDARに基づく認識のための最先端の手法は、しばしば点雲を2D空間に投影し、2D畳み込みによって処理する。
自然な対策として、3Dボクセル化と3D畳み込みネットワークを利用する方法がある。
本研究では,3次元幾何学的パターンを探索するために,円筒状分割と非対称な3次元畳み込みネットワークを設計する,屋外LiDARセグメンテーションのための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-12T06:25:11Z) - PLUME: Efficient 3D Object Detection from Stereo Images [95.31278688164646]
既存の手法では、2つのステップでこの問題に対処する: 第一深度推定を行い、その深さ推定から擬似LiDAR点雲表現を計算し、3次元空間で物体検出を行う。
この2つのタスクを同一のメトリック空間で統一するモデルを提案する。
提案手法は,既存の手法と比較して推定時間を大幅に削減し,挑戦的なKITTIベンチマークの最先端性能を実現する。
論文 参考訳(メタデータ) (2021-01-17T05:11:38Z) - InfoFocus: 3D Object Detection for Autonomous Driving with Dynamic
Information Modeling [65.47126868838836]
動的情報モデリングを用いた新しい3次元オブジェクト検出フレームワークを提案する。
粗い予測は、ボクセルベースの領域提案ネットワークを介して第1段階で生成される。
大規模なnuScenes 3D検出ベンチマークで実験を行った。
論文 参考訳(メタデータ) (2020-07-16T18:27:08Z) - SESS: Self-Ensembling Semi-Supervised 3D Object Detection [138.80825169240302]
具体的には、ラベルのない新しい未知のデータに基づくネットワークの一般化を促進するための、徹底的な摂動スキームを設計する。
我々のSESSは、50%のラベル付きデータを用いて、最先端の完全教師付き手法と比較して、競争性能を達成している。
論文 参考訳(メタデータ) (2019-12-26T08:48:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。