論文の概要: CC-3DT: Panoramic 3D Object Tracking via Cross-Camera Fusion
- arxiv url: http://arxiv.org/abs/2212.01247v1
- Date: Fri, 2 Dec 2022 15:43:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-05 16:57:04.349143
- Title: CC-3DT: Panoramic 3D Object Tracking via Cross-Camera Fusion
- Title(参考訳): CC-3DT:クロスカメラフュージョンによるパノラマ3次元物体追跡
- Authors: Tobias Fischer, Yung-Hsu Yang, Suryansh Kumar, Min Sun, Fisher Yu
- Abstract要約: 本研究では,CC-3DTと呼ばれるパノラマ3次元物体追跡手法を提案する。
本手法は、複数のカメラから3次元検出を融合させ、同一性スイッチを大幅に低減し、モーションモデリングを改善する。
我々は,競合するNuScenes 3Dトラッキングベンチマークにおいて,カメラベースのすべての手法の中で,平均マルチオブジェクトトラッキング精度(AMOTA)を12.6%改善した新しい最先端技術を設定した。
- 参考スコア(独自算出の注目度): 45.0665426425428
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To track the 3D locations and trajectories of the other traffic participants
at any given time, modern autonomous vehicles are equipped with multiple
cameras that cover the vehicle's full surroundings. Yet, camera-based 3D object
tracking methods prioritize optimizing the single-camera setup and resort to
post-hoc fusion in a multi-camera setup. In this paper, we propose a method for
panoramic 3D object tracking, called CC-3DT, that associates and models object
trajectories both temporally and across views, and improves the overall
tracking consistency. In particular, our method fuses 3D detections from
multiple cameras before association, reducing identity switches significantly
and improving motion modeling. Our experiments on large-scale driving datasets
show that fusion before association leads to a large margin of improvement over
post-hoc fusion. We set a new state-of-the-art with 12.6% improvement in
average multi-object tracking accuracy (AMOTA) among all camera-based methods
on the competitive NuScenes 3D tracking benchmark, outperforming previously
published methods by 6.5% in AMOTA with the same 3D detector.
- Abstract(参考訳): あらゆる時間に他の交通参加者の3D位置と軌跡を追跡するために、現代の自動運転車は車両の全周囲をカバーする複数のカメラを備えている。
しかし、カメラベースの3Dオブジェクト追跡手法では、単一カメラの設定を最適化し、マルチカメラ設定でのポストホック融合を優先する。
本論文では,パノラマ的3次元物体追跡のための手法であるcc-3dtを提案する。
特に,複数のカメラからの3d検出を結合前に融合させ,アイデンティティスイッチを大幅に削減し,動作モデリングを改善した。
大規模運転データセットを用いた実験により,結合前の融合はポストホック融合よりも大きな改善率をもたらすことが示された。
我々は,競合するNuScenes 3Dトラッキングベンチマークにおいて,AMOTAにおける平均多対象追跡精度(AMOTA)が12.6%向上した新たな最先端技術を設定した。
関連論文リスト
- Cross-Domain Spatial Matching for Camera and Radar Sensor Data Fusion in Autonomous Vehicle Perception System [0.0]
本稿では,自律走行車認識システムにおける3次元物体検出のためのカメラとレーダーセンサの融合問題に対する新しいアプローチを提案する。
我々のアプローチは、ディープラーニングの最近の進歩に基づいており、両方のセンサーの強度を活用して物体検出性能を向上させる。
提案手法は単一センサ・ソリューションよりも優れた性能を実現し,他のトップレベルの融合手法と直接競合できることを示す。
論文 参考訳(メタデータ) (2024-04-25T12:04:31Z) - ShaSTA-Fuse: Camera-LiDAR Sensor Fusion to Model Shape and
Spatio-Temporal Affinities for 3D Multi-Object Tracking [26.976216624424385]
3Dマルチオブジェクトトラッキング(MOT)は、自律移動エージェントが安全にシーンをナビゲートするために不可欠である。
我々は,カメラとLiDARセンサ情報を融合した3DMOTフレームワークの開発を目指している。
論文 参考訳(メタデータ) (2023-10-04T02:17:59Z) - VIMI: Vehicle-Infrastructure Multi-view Intermediate Fusion for
Camera-based 3D Object Detection [17.22491199725569]
VIC3Dは、車両と交通インフラの両方から多視点カメラを利用する。
我々は、新しい3Dオブジェクト検出フレームワーク、Vines-Infrastructure Multi-view Intermediate fusion (VIMI)を提案する。
VIMIは15.61%のAP_3Dと21.44%のAP_BEVを新しいVIC3DデータセットであるDAIR-V2X-Cで達成している。
論文 参考訳(メタデータ) (2023-03-20T09:56:17Z) - 3D Data Augmentation for Driving Scenes on Camera [50.41413053812315]
本稿では,Drive-3DAugと呼ばれる3次元データ拡張手法を提案する。
まずNeural Radiance Field(NeRF)を用いて,背景および前景の3次元モデルの再構成を行う。
そして、予め定義された背景の有効領域に適応した位置と向きの3Dオブジェクトを配置することにより、拡張駆動シーンを得ることができる。
論文 参考訳(メタデータ) (2023-03-18T05:51:05Z) - MSMDFusion: Fusing LiDAR and Camera at Multiple Scales with Multi-Depth
Seeds for 3D Object Detection [89.26380781863665]
自律運転システムにおける高精度で信頼性の高い3次元物体検出を実現するためには,LiDARとカメラ情報の融合が不可欠である。
近年のアプローチでは、2次元カメラ画像の3次元空間への昇華点によるカメラ特徴のセマンティックな密度の探索が試みられている。
マルチグラニュラリティLiDARとカメラ機能とのマルチスケールなプログレッシブインタラクションに焦点を当てた,新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-07T12:29:29Z) - DeepFusion: Lidar-Camera Deep Fusion for Multi-Modal 3D Object Detection [83.18142309597984]
ライダーとカメラは、自動運転における3D検出を補完する情報を提供する重要なセンサーである。
我々はDeepFusionという名前の汎用マルチモーダル3D検出モデル群を開発した。
論文 参考訳(メタデータ) (2022-03-15T18:46:06Z) - DeepFusionMOT: A 3D Multi-Object Tracking Framework Based on
Camera-LiDAR Fusion with Deep Association [8.34219107351442]
本稿では,精度と速度の良好なトレードオフを実現するために,カメラ-LiDAR融合型MOT法を提案する。
提案手法は、追跡精度と処理速度の両方の観点から、最先端MOT法に対して明らかな利点を示す。
論文 参考訳(メタデータ) (2022-02-24T13:36:29Z) - MetaPose: Fast 3D Pose from Multiple Views without 3D Supervision [72.5863451123577]
正確な3Dポーズとカメラ推定が可能なニューラルモデルをトレーニングする方法を示す。
本手法は,古典的バンドル調整と弱教師付き単分子3Dベースラインの両方に優れる。
論文 参考訳(メタデータ) (2021-08-10T18:39:56Z) - Monocular Quasi-Dense 3D Object Tracking [99.51683944057191]
周囲の物体の将来の位置を予測し、自律運転などの多くのアプリケーションで観測者の行動を計画するためには、信頼性と正確な3D追跡フレームワークが不可欠である。
移動プラットフォーム上で撮影された2次元画像のシーケンスから,移動物体を時間とともに効果的に関連付け,その全3次元バウンディングボックス情報を推定するフレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-12T15:30:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。