論文の概要: An Effective Motion-Centric Paradigm for 3D Single Object Tracking in
Point Clouds
- arxiv url: http://arxiv.org/abs/2303.12535v2
- Date: Thu, 12 Oct 2023 02:38:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-15 15:18:01.427169
- Title: An Effective Motion-Centric Paradigm for 3D Single Object Tracking in
Point Clouds
- Title(参考訳): 点群における3次元物体追跡に有効な運動中心パラダイム
- Authors: Chaoda Zheng, Xu Yan, Haiming Zhang, Baoyuan Wang, Shenghui Cheng,
Shuguang Cui, Zhen Li
- Abstract要約: LiDARポイントクラウド(LiDAR SOT)における3Dシングルオブジェクトトラッキングは、自動運転において重要な役割を果たす。
現在のアプローチはすべて、外観マッチングに基づくシームズパラダイムに従っている。
我々は新たな視点からLiDAR SOTを扱うための動き中心のパラダイムを導入する。
- 参考スコア(独自算出の注目度): 50.19288542498838
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3D single object tracking in LiDAR point clouds (LiDAR SOT) plays a crucial
role in autonomous driving. Current approaches all follow the Siamese paradigm
based on appearance matching. However, LiDAR point clouds are usually
textureless and incomplete, which hinders effective appearance matching.
Besides, previous methods greatly overlook the critical motion clues among
targets. In this work, beyond 3D Siamese tracking, we introduce a
motion-centric paradigm to handle LiDAR SOT from a new perspective. Following
this paradigm, we propose a matching-free two-stage tracker M^2-Track. At the
1st-stage, M^2-Track localizes the target within successive frames via motion
transformation. Then it refines the target box through motion-assisted shape
completion at the 2nd-stage. Due to the motion-centric nature, our method shows
its impressive generalizability with limited training labels and provides good
differentiability for end-to-end cycle training. This inspires us to explore
semi-supervised LiDAR SOT by incorporating a pseudo-label-based motion
augmentation and a self-supervised loss term. Under the fully-supervised
setting, extensive experiments confirm that M^2-Track significantly outperforms
previous state-of-the-arts on three large-scale datasets while running at 57FPS
(~3%, ~11% and ~22% precision gains on KITTI, NuScenes, and Waymo Open Dataset
respectively). While under the semi-supervised setting, our method performs on
par with or even surpasses its fully-supervised counterpart using fewer than
half of the labels from KITTI. Further analysis verifies each component's
effectiveness and shows the motion-centric paradigm's promising potential for
auto-labeling and unsupervised domain adaptation.
- Abstract(参考訳): LiDARポイントクラウド(LiDAR SOT)における3Dシングルオブジェクトトラッキングは、自動運転において重要な役割を果たす。
現在のアプローチはすべて、外観マッチングに基づくシームズパラダイムに従っている。
しかし、LiDARの点雲は通常無テクスチャで不完全であり、効果的な外観マッチングを妨げる。
さらに、従来の手法は目標間の重要な動きの手がかりを大きく見落としている。
本研究では,3次元シームズトラッキング以外にも,新たな視点からLiDAR SOTを扱うための動き中心のパラダイムを導入する。
このパラダイムに従って,マッチングフリーな2段トラッカーM^2-Trackを提案する。
第1段階では、m^2トラックは運動変換により連続するフレーム内でターゲットをローカライズする。
そして、第2段の動作支援形状完了により、ターゲットボックスを洗練する。
動作中心の性質から,本手法は訓練ラベルを限定した印象的な一般化性を示し,エンドツーエンドのサイクルトレーニングに優れた微分性を提供する。
これにより,擬似ラベルに基づく運動増強と自己監督的損失項を組み込むことで,半教師付きLiDAR SOTを探索することが可能になる。
完全に監督された設定の下では、M^2-Trackが57FPS(それぞれKITTI、NuScenes、Waymo Open Dataset)で実行中の3つの大規模データセットの最先端を著しく上回っていることを確認する。
半教師付き環境下では,KITTIのラベルの半数未満を使用すれば,完全教師付き環境に匹敵する,あるいは超えた動作を行う。
さらなる分析により、各コンポーネントの有効性が検証され、モーション中心のパラダイムが自動ラベルと教師なしドメイン適応に有望な可能性を示す。
関連論文リスト
- BiTrack: Bidirectional Offline 3D Multi-Object Tracking Using Camera-LiDAR Data [11.17376076195671]
BiTrackは2D-3D検出融合、初期軌道生成、双方向軌道再最適化のモジュールを含む3D OMOTフレームワークである。
KITTIデータセットを用いた実験結果から,BiTrackは3次元OMOTタスクの最先端性能を精度と効率で達成できることが示された。
論文 参考訳(メタデータ) (2024-06-26T15:09:54Z) - Motion-to-Matching: A Mixed Paradigm for 3D Single Object Tracking [27.805298263103495]
本稿では,モーションモデリングと特徴マッチングを組み合わせたMTM-Trackerを提案する。
第1段階では、連続した履歴ボックスを先行動作として利用し、ターゲットの粗い位置を特定するエンコーダ・デコーダ構造を提案する。
第2段階では、連続する点雲から動きを認識する特徴を抽出し、それらをマッチングして目標運動を洗練させる特徴相互作用モジュールを導入する。
論文 参考訳(メタデータ) (2023-08-23T02:40:51Z) - MotionTrack: Learning Motion Predictor for Multiple Object Tracking [68.68339102749358]
本研究では,学習可能なモーション予測器を中心に,新しいモーショントラッカーであるMotionTrackを紹介する。
実験結果から、MotionTrackはDancetrackやSportsMOTといったデータセット上での最先端のパフォーマンスを示す。
論文 参考訳(メタデータ) (2023-06-05T04:24:11Z) - Weakly Supervised Monocular 3D Object Detection using Multi-View
Projection and Direction Consistency [78.76508318592552]
モノクロ3Dオブジェクト検出は、その容易なアプリケーションのための自動駆動において、主流のアプローチとなっている。
現在のほとんどの方法は、トレーニングフェーズで使用される真実をラベル付けするために、まだ3Dポイントのクラウドデータに依存しています。
画像にマークされた2次元ラベルだけでモデルを訓練できる,弱教師付きモノクル3次元オブジェクト検出法を提案する。
論文 参考訳(メタデータ) (2023-03-15T15:14:00Z) - DirectTracker: 3D Multi-Object Tracking Using Direct Image Alignment and
Photometric Bundle Adjustment [41.27664827586102]
直接法は視覚計測とSLAMの応用において優れた性能を示した。
本研究では,3次元物体検出のための短期追跡とスライディングウインドウ光度束調整のための直像アライメントを効果的に組み合わせたフレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-29T17:40:22Z) - Image Understands Point Cloud: Weakly Supervised 3D Semantic
Segmentation via Association Learning [59.64695628433855]
ラベルのない画像から補完的な情報を取り入れた3次元セグメンテーションのための新しいクロスモダリティ弱教師付き手法を提案する。
基本的に、ラベルの小さな部分のパワーを最大化するために、アクティブなラベリング戦略を備えたデュアルブランチネットワークを設計する。
提案手法は,1%未満のアクティブなアノテーションで,最先端の完全教師付き競合よりも優れていた。
論文 参考訳(メタデータ) (2022-09-16T07:59:04Z) - A Lightweight and Detector-free 3D Single Object Tracker on Point Clouds [50.54083964183614]
生のLiDARスキャンにおける物体の点雲は、通常スパースで不完全であるため、正確な目標固有検出を行うのは簡単ではない。
DMTは、複雑な3D検出器の使用を完全に除去する3Dトラッキングネットワークである。
論文 参考訳(メタデータ) (2022-03-08T17:49:07Z) - Beyond 3D Siamese Tracking: A Motion-Centric Paradigm for 3D Single
Object Tracking in Point Clouds [39.41305358466479]
LiDARポイントクラウドにおける3Dオブジェクトトラッキングは、自動運転において重要な役割を果たす。
現在のアプローチはすべて、外観マッチングに基づくシームズパラダイムに従っている。
新しい視点から3D SOTを扱うための動き中心のパラダイムを導入する。
論文 参考訳(メタデータ) (2022-03-03T14:20:10Z) - Monocular Quasi-Dense 3D Object Tracking [99.51683944057191]
周囲の物体の将来の位置を予測し、自律運転などの多くのアプリケーションで観測者の行動を計画するためには、信頼性と正確な3D追跡フレームワークが不可欠である。
移動プラットフォーム上で撮影された2次元画像のシーケンスから,移動物体を時間とともに効果的に関連付け,その全3次元バウンディングボックス情報を推定するフレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-12T15:30:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。