論文の概要: Learnable Online Graph Representations for 3D Multi-Object Tracking
- arxiv url: http://arxiv.org/abs/2104.11747v1
- Date: Fri, 23 Apr 2021 17:59:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-26 12:57:39.667681
- Title: Learnable Online Graph Representations for 3D Multi-Object Tracking
- Title(参考訳): 3次元マルチオブジェクトトラッキングのための学習可能なオンライングラフ表現
- Authors: Jan-Nico Zaech, Dengxin Dai, Alexander Liniger, Martin Danelljan, Luc
Van Gool
- Abstract要約: 3D MOT問題に対する統一型学習型アプローチを提案します。
我々は、完全にトレーニング可能なデータアソシエーションにNeural Message Passing Networkを使用します。
AMOTAの65.6%の最先端性能と58%のIDスウィッチを達成して、公開可能なnuScenesデータセットに対する提案手法のメリットを示す。
- 参考スコア(独自算出の注目度): 156.58876381318402
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tracking of objects in 3D is a fundamental task in computer vision that finds
use in a wide range of applications such as autonomous driving, robotics or
augmented reality. Most recent approaches for 3D multi object tracking (MOT)
from LIDAR use object dynamics together with a set of handcrafted features to
match detections of objects. However, manually designing such features and
heuristics is cumbersome and often leads to suboptimal performance. In this
work, we instead strive towards a unified and learning based approach to the 3D
MOT problem. We design a graph structure to jointly process detection and track
states in an online manner. To this end, we employ a Neural Message Passing
network for data association that is fully trainable. Our approach provides a
natural way for track initialization and handling of false positive detections,
while significantly improving track stability. We show the merit of the
proposed approach on the publicly available nuScenes dataset by achieving
state-of-the-art performance of 65.6% AMOTA and 58% fewer ID-switches.
- Abstract(参考訳): 3dでオブジェクトを追跡することは、自動運転やロボティクス、拡張現実など、幅広いアプリケーションで使用されるコンピュータビジョンの基本的なタスクである。
LIDARからの3Dマルチオブジェクト追跡(MOT)に対する最近のアプローチでは、オブジェクトの検出にマッチする手作りの機能セットとともに、オブジェクトダイナミクスを使用している。
しかし、そのような特徴やヒューリスティックを手動で設計するのは面倒で、しばしば準最適性能につながる。
そこで本研究では,3次元MOT問題に対する統一的かつ学習的アプローチを提案する。
オンライン方式で検出と追跡を共同で行うグラフ構造を設計した。
この目的のために、完全にトレーニング可能なデータアソシエーションにNeural Message Passing Networkを使用します。
提案手法は,偽陽性検出の初期化と処理の自然な方法であり,トラック安定性を著しく向上させる。
AMOTAの65.6%の最先端性能と58%のIDスイッチを達成し,公開可能なnuScenesデータセットに対する提案手法のメリットを示す。
関連論文リスト
- Open3DTrack: Towards Open-Vocabulary 3D Multi-Object Tracking [73.05477052645885]
オープンな語彙的3Dトラッキングを導入し、3Dトラッキングの範囲を広げて、定義済みのカテゴリを超えてオブジェクトを含める。
本稿では,オープン語彙機能を3次元トラッキングフレームワークに統合し,オブジェクトクラスが見えないように一般化する手法を提案する。
論文 参考訳(メタデータ) (2024-10-02T15:48:42Z) - 3DiffTection: 3D Object Detection with Geometry-Aware Diffusion Features [70.50665869806188]
3DiffTectionは、単一の画像から3Dオブジェクトを検出する最先端の方法である。
拡散モデルを微調整し、単一の画像に条件付けされた新しいビュー合成を行う。
さらに、検出監視により、ターゲットデータ上でモデルをトレーニングする。
論文 参考訳(メタデータ) (2023-11-07T23:46:41Z) - View-to-Label: Multi-View Consistency for Self-Supervised 3D Object
Detection [46.077668660248534]
本稿では,RGBシーケンスのみから,自己監督型3Dオブジェクト検出を行う手法を提案する。
KITTI 3Dデータセットを用いた実験では,最先端の自己管理手法と同等の性能を示した。
論文 参考訳(メタデータ) (2023-05-29T09:30:39Z) - Once Detected, Never Lost: Surpassing Human Performance in Offline LiDAR
based 3D Object Detection [50.959453059206446]
本稿では,高性能なオフラインLiDARによる3Dオブジェクト検出を実現することを目的とする。
まず、経験豊富な人間のアノテータが、トラック中心の視点でオブジェクトに注釈を付けるのを観察する。
従来のオブジェクト中心の視点ではなく,トラック中心の視点で高性能なオフライン検出器を提案する。
論文 参考訳(メタデータ) (2023-04-24T17:59:05Z) - Exploring Diversity-based Active Learning for 3D Object Detection in Autonomous Driving [45.405303803618]
多様性に基づくアクティブラーニング(AL)を,アノテーションの負担を軽減するための潜在的解決策として検討する。
選択したサンプルの空間的・時間的多様性を強制する新しい取得関数を提案する。
提案手法がnuScenesデータセットに与える影響を実証し,既存のAL戦略を著しく上回ることを示す。
論文 参考訳(メタデータ) (2022-05-16T14:21:30Z) - 3D Multi-Object Tracking Using Graph Neural Networks with Cross-Edge
Modality Attention [9.150245363036165]
Batch3DMOTは、現実のシーンを、方向付き、非循環型、カテゴリー非結合な追跡グラフとして表現する。
モーダル間断続性を緩和するクロスエッジアテンション機構を用いたマルチモーダルグラフニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2022-03-21T12:44:17Z) - Monocular Quasi-Dense 3D Object Tracking [99.51683944057191]
周囲の物体の将来の位置を予測し、自律運転などの多くのアプリケーションで観測者の行動を計画するためには、信頼性と正確な3D追跡フレームワークが不可欠である。
移動プラットフォーム上で撮影された2次元画像のシーケンスから,移動物体を時間とともに効果的に関連付け,その全3次元バウンディングボックス情報を推定するフレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-12T15:30:02Z) - A two-stage data association approach for 3D Multi-object Tracking [0.0]
画像に基づくトラッキングを3D環境に適応させる2段階データアソシエーション手法を開発した。
提案手法は,NuScenes 検証セットにおいて0.587 AMOTA を達成し,データアソシエーションのための一段二部マッチングを用いてベースラインより優れる。
論文 参考訳(メタデータ) (2021-01-21T15:50:17Z) - Probabilistic 3D Multi-Modal, Multi-Object Tracking for Autonomous
Driving [22.693895321632507]
異なる訓練可能なモジュールからなる確率的、マルチモーダル、マルチオブジェクトトラッキングシステムを提案する。
本手法はNuScenes Trackingデータセットの現在の状態を上回っていることを示した。
論文 参考訳(メタデータ) (2020-12-26T15:00:54Z) - Fine-Grained Vehicle Perception via 3D Part-Guided Visual Data
Augmentation [77.60050239225086]
実画像中の車両に動的部品を付加した3次元自動車モデルによる効果的なトレーニングデータ生成プロセスを提案する。
私達のアプローチは人間の相互作用なしで完全に自動です。
VUS解析用マルチタスクネットワークとVHI解析用マルチストリームネットワークを提案する。
論文 参考訳(メタデータ) (2020-12-15T03:03:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。