Fugu-MT 論文翻訳(概要): TacoDepth: Towards Efficient Radar-Camera Depth Estimation with One-stage Fusion

論文の概要: TacoDepth: Towards Efficient Radar-Camera Depth Estimation with One-stage Fusion

arxiv url: http://arxiv.org/abs/2504.11773v1
Date: Wed, 16 Apr 2025 05:25:04 GMT
ステータス: 翻訳完了
システム内更新日: 2025-04-24 21:50:57.976225
Title: TacoDepth: Towards Efficient Radar-Camera Depth Estimation with One-stage Fusion
Title（参考訳）: TacoDepth: 1段核融合による高効率レーダカメラ深さ推定に向けて
Authors: Yiran Wang, Jiaqi Li, Chaoyi Hong, Ruibo Li, Liusheng Sun, Xiao Song, Zhe Wang, Zhiguo Cao, Guosheng Lin,
Abstract要約: 一段核融合を用いた効率的かつ正確なレーダ・カメラ深度推定モデルであるTacoDepthを提案する。具体的には、グラフベースのRadar構造抽出器とピラミッドベースのRadar融合モジュールを設計する。従来の最先端のアプローチと比較して、TacoDepthは深さ精度と処理速度を12.8%、91.8%改善している。
参考スコア（独自算出の注目度）: 54.46664104437454
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Radar-Camera depth estimation aims to predict dense and accurate metric depth by fusing input images and Radar data. Model efficiency is crucial for this task in pursuit of real-time processing on autonomous vehicles and robotic platforms. However, due to the sparsity of Radar returns, the prevailing methods adopt multi-stage frameworks with intermediate quasi-dense depth, which are time-consuming and not robust. To address these challenges, we propose TacoDepth, an efficient and accurate Radar-Camera depth estimation model with one-stage fusion. Specifically, the graph-based Radar structure extractor and the pyramid-based Radar fusion module are designed to capture and integrate the graph structures of Radar point clouds, delivering superior model efficiency and robustness without relying on the intermediate depth results. Moreover, TacoDepth can be flexible for different inference modes, providing a better balance of speed and accuracy. Extensive experiments are conducted to demonstrate the efficacy of our method. Compared with the previous state-of-the-art approach, TacoDepth improves depth accuracy and processing speed by 12.8% and 91.8%. Our work provides a new perspective on efficient Radar-Camera depth estimation.
Abstract（参考訳）: レーダ・カメラ深度推定は、入力画像とレーダデータとを融合させることにより、密度と精度の高いメートル法深度を推定することを目的としている。モデル効率は、自動運転車やロボットプラットフォームでのリアルタイム処理を追求する上で、このタスクにとって不可欠である。しかしながら、Radarのリターンの幅が広いため、一般的な手法では、中間的な準深度を持つマルチステージフレームワークが採用されている。これらの課題に対処するために,一段融合を用いた効率的かつ正確なレーダ・カメラ深度推定モデルであるTacoDepthを提案する。具体的には、グラフベースのRadar構造抽出器とピラミッドベースのRadar融合モジュールは、Radar点雲のグラフ構造を捕捉・統合し、中間深度結果に頼ることなく、優れたモデル効率とロバスト性を提供するように設計されている。さらに、TacoDepthは異なる推論モードに対して柔軟性があり、速度と精度のバランスが良くなります。本手法の有効性を示すため, 広範囲な実験を行った。従来の最先端のアプローチと比較して、TacoDepthは深さ精度と処理速度を12.8%、91.8%改善している。我々の研究は、効率的なレーダー・カメラ深度推定の新しい視点を提供する。

関連論文リスト

GET-UP: GEomeTric-aware Depth Estimation with Radar Points UPsampling [7.90238039959534]
既存のアルゴリズムは3Dポイントを画像面に投影してレーダデータを処理し、画素レベルの特徴抽出を行う。レーダデータから2次元情報と3次元情報を交換・集約するために,注目度の高いグラフニューラルネットワーク(GNN)を利用するGET-UPを提案する。提案したGET-UPをnuScenesデータセット上でベンチマークし,従来最高のパフォーマンスモデルよりも15.3%,14.7%改善した。
論文参考訳（メタデータ） (2024-09-02T14:15:09Z)
CaFNet: A Confidence-Driven Framework for Radar Camera Depth Estimation [6.9404362058736995]
本稿では,深度推定のための2段階・エンドツーエンドの信頼度対応フュージョンネット(CaFNet)を提案する。第1段階は、あいまいな標高やノイズ測定など、レーダー固有の課題に対処する。最終深度推定のために、レーダと画像の特徴を効果的に統合するための信頼性を考慮したゲート融合機構を革新する。
論文参考訳（メタデータ） (2024-06-30T13:39:29Z)
RadarCam-Depth: Radar-Camera Fusion for Depth Estimation with Learned Metric Scale [21.09258172290667]
本稿では, 単視点画像とスパース, ノイズの多いレーダー点雲の融合に基づく, 距離密度推定のための新しい手法を提案する。提案手法は,難解なnuScenesデータセットと自己コンパイルしたZJU-4DRadarCamデータセットにおいて,平均絶対誤差(MAE)を25.6%,40.2%削減することにより,最先端のRadar-Camera深度推定法を著しく上回っている。
論文参考訳（メタデータ） (2024-01-09T02:40:03Z)
Echoes Beyond Points: Unleashing the Power of Raw Radar Data in Multi-modality Fusion [74.84019379368807]
本稿では,既存のレーダ信号処理パイプラインをスキップするEchoFusionという新しい手法を提案する。具体的には、まずBird's Eye View (BEV)クエリを生成し、次にレーダーから他のセンサーとフューズに対応するスペクトル特徴を取ります。
論文参考訳（メタデータ） (2023-07-31T09:53:50Z)
RadarFormer: Lightweight and Accurate Real-Time Radar Object Detection Model [13.214257841152033]
レーダー中心のデータセットは、レーダー知覚のためのディープラーニング技術の開発にはあまり注目されていない。本稿では,視覚深層学習における最先端技術を活用したトランスフォーマーモデルRadarFormerを提案する。また、チャネルチャープ時マージモジュールを導入し、精度を損なうことなく、モデルのサイズと複雑さを10倍以上に削減する。
論文参考訳（メタデータ） (2023-04-17T17:07:35Z)
How much depth information can radar infer and contribute [1.5899159309486681]
最新技術深度推定モデルを用いて,レーダデータの固有深度推定能力について検討する。実験により, スパースレーダ入力のみによる推定深度は, 周囲の形状をある程度検出できることがわかった。
論文参考訳（メタデータ） (2022-02-26T20:02:47Z)
LiRaNet: End-to-End Trajectory Prediction using Spatio-Temporal Radar Fusion [52.59664614744447]
本稿では,レーダセンサ情報と広範に使用されているライダーと高精細度(HD)マップを用いた新しい終端軌道予測手法LiRaNetを提案する。自動車レーダーは、リッチで補完的な情報を提供し、より長い距離の車両検出と即時速度測定を可能にします。
論文参考訳（メタデータ） (2020-10-02T00:13:00Z)
Depth Estimation from Monocular Images and Sparse Radar Data [93.70524512061318]
本稿では,ディープニューラルネットワークを用いた単眼画像とレーダ点の融合により,より正確な深度推定を実現する可能性を検討する。レーダ測定で発生するノイズが,既存の融合法の適用を妨げている主要な理由の1つであることが判明した。実験はnuScenesデータセット上で行われ、カメラ、レーダー、LiDARの記録を様々な場面と気象条件で記録する最初のデータセットの1つである。
論文参考訳（メタデータ） (2020-09-30T19:01:33Z)
RadarNet: Exploiting Radar for Robust Perception of Dynamic Objects [73.80316195652493]
我々は、自動運転車の文脈における認識のためにRadarを利用する問題に取り組む。我々は、LiDARとRadarの両方のセンサーを知覚に利用した新しいソリューションを提案する。 RadarNetと呼ばれる我々のアプローチは、ボクセルベースの早期核融合と注意に基づく後期核融合を特徴としている。
論文参考訳（メタデータ） (2020-07-28T17:15:02Z)
End-to-end Learning for Inter-Vehicle Distance and Relative Velocity Estimation in ADAS with a Monocular Camera [81.66569124029313]
本稿では,ディープニューラルネットワークのエンドツーエンドトレーニングに基づくカメラによる車間距離と相対速度推定手法を提案する。提案手法の重要な特徴は,2つの時間的単眼フレームによって提供される複数の視覚的手がかりの統合である。また,移動場における視線歪みの影響を緩和する車両中心サンプリング機構を提案する。
論文参考訳（メタデータ） (2020-06-07T08:18:31Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。