論文の概要: Efficient On-Chip Implementation of 4D Radar-Based 3D Object Detection on Hailo-8L
- arxiv url: http://arxiv.org/abs/2505.00757v1
- Date: Thu, 01 May 2025 12:10:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-05 17:21:19.777147
- Title: Efficient On-Chip Implementation of 4D Radar-Based 3D Object Detection on Hailo-8L
- Title(参考訳): ハイロ8Lを用いた4次元レーダによる3次元物体検出の効率的なオンチップ実装
- Authors: Woong-Chan Byun, Dong-Hee Paek, Seung-Hyun Song, Seung-Hyun Kong,
- Abstract要約: ハイロ8L型AI加速器を用いた4次元レーダを用いた3次元物体検出モデルの最初のオンチップ実装について述べる。
本稿では,5次元入力を4次元フォーマットに再設定するテンソル変換手法を提案する。
提案システムは、46.47%のAP_3Dと52.75%のAP_BEVを実現し、GPUベースのモデルに匹敵する精度を維持している。
- 参考スコア(独自算出の注目度): 5.405156980077946
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 4D radar has attracted attention in autonomous driving due to its ability to enable robust 3D object detection even under adverse weather conditions. To practically deploy such technologies, it is essential to achieve real-time processing within low-power embedded environments. Addressing this, we present the first on-chip implementation of a 4D radar-based 3D object detection model on the Hailo-8L AI accelerator. Although conventional 3D convolutional neural network (CNN) architectures require 5D inputs, the Hailo-8L only supports 4D tensors, posing a significant challenge. To overcome this limitation, we introduce a tensor transformation method that reshapes 5D inputs into 4D formats during the compilation process, enabling direct deployment without altering the model structure. The proposed system achieves 46.47% AP_3D and 52.75% AP_BEV, maintaining comparable accuracy to GPU-based models while achieving an inference speed of 13.76 Hz. These results demonstrate the applicability of 4D radar-based perception technologies to autonomous driving systems.
- Abstract(参考訳): 4Dレーダーは、悪天候下でも堅牢な3D物体検出を可能にする能力のために、自動運転において注目を集めている。
このような技術を実際に展開するには、低消費電力の組込み環境においてリアルタイム処理を実現することが不可欠である。
そこで本研究では,ハイロ8L型AIアクセラレータ上での4次元レーダを用いた3次元物体検出モデルのオンチップ実装について述べる。
従来の3D畳み込みニューラルネットワーク(CNN)アーキテクチャは5D入力を必要とするが、Hairo-8Lは4Dテンソルしかサポートしていない。
この制限を克服するため,コンパイルプロセス中に5次元入力を4次元フォーマットに再設定するテンソル変換手法を導入し,モデル構造を変更することなく直接配置を可能にする。
提案方式は46.47%のAP_3Dと52.75%のAP_BEVを達成し、推論速度は13.76Hzである。
これらの結果は,4次元レーダーによる認識技術が自律走行システムに適用可能であることを示す。
関連論文リスト
- Easi3R: Estimating Disentangled Motion from DUSt3R Without Training [48.87063562819018]
Easi3Rは,4次元再構成のための簡易かつ効率的なトレーニングフリー手法である。
提案手法は,事前学習やネットワークファインチューニングの必要性を排除し,推論中の注意適応を適用した。
実世界のダイナミックビデオの実験では、従来の最先端手法よりも軽量な注意適応が著しく優れていたことが示されている。
論文 参考訳(メタデータ) (2025-03-31T17:59:58Z) - Diffusion4D: Fast Spatial-temporal Consistent 4D Generation via Video Diffusion Models [116.31344506738816]
高速でスケーラブルな4Dコンテンツ生成のための新しいフレームワーク textbfDiffusion4D を提案する。
ダイナミックな3Dアセットの軌道ビューを合成できる4D対応ビデオ拡散モデルを開発した。
提案手法は, 生成効率と4次元幾何整合性の観点から, 従来の最先端技術を超えている。
論文 参考訳(メタデータ) (2024-05-26T17:47:34Z) - RadarOcc: Robust 3D Occupancy Prediction with 4D Imaging Radar [15.776076554141687]
3D占有に基づく知覚パイプラインは、かなり進歩した自律運転を持つ。
現在の方法では、LiDARやカメラの入力を3D占有率予測に頼っている。
本稿では,4次元イメージングレーダセンサを用いた3次元占有予測手法を提案する。
論文 参考訳(メタデータ) (2024-05-22T21:48:17Z) - SC4D: Sparse-Controlled Video-to-4D Generation and Motion Transfer [57.506654943449796]
動作と外観を分離するSC4Dという,効率的でスパース制御されたビデオ・ツー・4Dフレームワークを提案する。
我々の手法は、品質と効率の両面で既存の手法を超越している。
動作を多種多様な4Dエンティティにシームレスに転送する新しいアプリケーションを考案する。
論文 参考訳(メタデータ) (2024-04-04T18:05:18Z) - 4DRVO-Net: Deep 4D Radar-Visual Odometry Using Multi-Modal and
Multi-Scale Adaptive Fusion [2.911052912709637]
4次元(4D)レーダー-視覚計測(4DRVO)は4次元レーダーとカメラの補完情報を統合している。
4DRVOは4Dレーダーポイント雲の空隙による追跡誤差が顕著である可能性がある。
本稿では,4次元レーダ・ビジュアル・オドメトリーの手法である4DRVO-Netを提案する。
論文 参考訳(メタデータ) (2023-08-12T14:00:09Z) - NeRF-GAN Distillation for Efficient 3D-Aware Generation with
Convolutions [97.27105725738016]
GAN(Generative Adversarial Networks)のようなニューラルラジアンスフィールド(NeRF)と生成モデルの統合は、単一ビュー画像から3D認識生成を変換した。
提案手法は,ポーズ条件付き畳み込みネットワークにおいて,事前学習したNeRF-GANの有界遅延空間を再利用し,基礎となる3次元表現に対応する3D一貫性画像を直接生成する手法である。
論文 参考訳(メタデータ) (2023-03-22T18:59:48Z) - TJ4DRadSet: A 4D Radar Dataset for Autonomous Driving [16.205201694162092]
我々は、TJ4DRadSetという自律走行データセットを導入し、4Dレーダー、ライダー、カメラ、および合計40Kフレームのシーケンスからなるマルチモーダルセンサーを含む。
我々は,4次元レーダポイント雲に対するディープラーニング手法の有効性を示すために,データセットのための4次元レーダベースの3次元オブジェクト検出ベースラインを提供する。
論文 参考訳(メタデータ) (2022-04-28T13:17:06Z) - PerMO: Perceiving More at Once from a Single Image for Autonomous
Driving [76.35684439949094]
単一画像から完全テクスチャ化された車両の3次元モデルを検出し,セグメント化し,再構成する新しい手法を提案する。
私たちのアプローチは、ディープラーニングの強みと従来のテクニックの優雅さを組み合わせています。
我々はこれらのアルゴリズムを自律運転システムに統合した。
論文 参考訳(メタデータ) (2020-07-16T05:02:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。