論文の概要: Stable at Any Speed: Speed-Driven Multi-Object Tracking with Learnable Kalman Filtering
- arxiv url: http://arxiv.org/abs/2508.00358v1
- Date: Fri, 01 Aug 2025 06:42:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-04 18:08:53.759794
- Title: Stable at Any Speed: Speed-Driven Multi-Object Tracking with Learnable Kalman Filtering
- Title(参考訳): 任意の速度で安定:学習可能なカルマンフィルタを用いた速度駆動型多対象追跡
- Authors: Yan Gong, Mengjun Chen, Hao Liu, Gao Yongsheng, Lei Yang, Naibang Wang, Ziying Song, Haoqun Ma,
- Abstract要約: マルチオブジェクトトラッキング(MOT)により、自動運転車は動的物体を継続的に知覚することができる。
Speed-Guided Learnable Kalman Filter (SG-LKF)は、エゴ車速に不確実性を適用し、高ダイナミックなシナリオにおける安定性と精度を著しく向上する。
SG-LKF は KITTI 2D MOT の79.59% HOTA で全ての視覚ベースの手法の中で第1位であり、KITTI 3D MOT では 82.03% HOTA で強い結果を出し、nuScenes 3D MOT では SimpleTrack を 2.2% AMOTA で上回っている。
- 参考スコア(独自算出の注目度): 5.852380432257675
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-object tracking (MOT) enables autonomous vehicles to continuously perceive dynamic objects, supplying essential temporal cues for prediction, behavior understanding, and safe planning. However, conventional tracking-by-detection methods typically rely on static coordinate transformations based on ego-vehicle poses, disregarding ego-vehicle speed-induced variations in observation noise and reference frame changes, which degrades tracking stability and accuracy in dynamic, high-speed scenarios. In this paper, we investigate the critical role of ego-vehicle speed in MOT and propose a Speed-Guided Learnable Kalman Filter (SG-LKF) that dynamically adapts uncertainty modeling to ego-vehicle speed, significantly improving stability and accuracy in highly dynamic scenarios. Central to SG-LKF is MotionScaleNet (MSNet), a decoupled token-mixing and channel-mixing MLP that adaptively predicts key parameters of SG-LKF. To enhance inter-frame association and trajectory continuity, we introduce a self-supervised trajectory consistency loss jointly optimized with semantic and positional constraints. Extensive experiments show that SG-LKF ranks first among all vision-based methods on KITTI 2D MOT with 79.59% HOTA, delivers strong results on KITTI 3D MOT with 82.03% HOTA, and outperforms SimpleTrack by 2.2% AMOTA on nuScenes 3D MOT.
- Abstract(参考訳): マルチオブジェクトトラッキング(MOT)は、自動運転車が動的物体を継続的に知覚し、予測、行動理解、安全な計画に不可欠な時間的手がかりを提供する。
しかし,従来のトラッキング・バイ・ディテククション法は,高速・ダイナミックなシナリオにおけるトラッキングの安定性と精度を低下させる観測ノイズや参照フレームの変化において,車速が引き起こす変動を無視して,車速の姿勢に基づく静的座標変換に依存するのが一般的である。
本稿では,MOTにおけるエゴ車速のクリティカルな役割について検討し,不確実性モデリングをエゴ車速に動的に適用する高速誘導学習カルマンフィルタ(SG-LKF)を提案し,高ダイナミックなシナリオにおける安定性と精度を著しく向上させる。
SG-LKFの中心となるMotionScaleNet(MSNet)は、SG-LKFの重要なパラメータを適応的に予測する、切り離されたトークンミキシングとチャネルミキシングのMLPである。
フレーム間の結合と軌道連続性を高めるために,意味的制約と位置的制約を併用した自己教師付き軌道整合性損失を導入する。
大規模な実験により、SG-LKFはKITTI 2D MOTの79.59%のHOTAで第1位となり、82.03%のHOTAでKITTI 3D MOTで強い結果を出し、nuScenes 3D MOTでSimpleTrackを2.2%上回った。
関連論文リスト
- Tracking the Unstable: Appearance-Guided Motion Modeling for Robust Multi-Object Tracking in UAV-Captured Videos [58.156141601478794]
マルチオブジェクトトラッキング(UAVT)は、ビデオのフレーム間で一貫したアイデンティティを維持しながら、複数のオブジェクトを追跡することを目的としている。
既存の手法は、通常、動作キューと外観を別々にモデル化し、それらの相互作用を見渡して、最適下追跡性能をもたらす。
本稿では、AMC行列とMTCモジュールの2つの主要コンポーネントを通して、外観と動きの手がかりを利用するAMOTを提案する。
論文 参考訳(メタデータ) (2025-08-03T12:06:47Z) - Deep LG-Track: An Enhanced Localization-Confidence-Guided Multi-Object Tracker [13.846239755569552]
Deep LG-Trackは、トラッキング精度とロバスト性を改善するために3つの重要な拡張を組み込んだ、新しいマルチオブジェクトトラッカーである。
MOT17とMOT20データセットの総合的な評価は、提案されたDeep LG-Trackが常に最先端のトラッカーより優れていることを示している。
論文 参考訳(メタデータ) (2025-04-02T08:10:18Z) - HybridTrack: A Hybrid Approach for Robust Multi-Object Tracking [7.916733469603948]
HybridTrackは、車両のための新しい3Dマルチオブジェクトトラッキングアプローチである。
データ駆動型カルマンフィルタ(KF)をトラッキング・バイ・検出パラダイムに統合する。
82.72%のHOTA精度を実現し、最先端の手法を著しく上回っている。
論文 参考訳(メタデータ) (2025-01-02T14:17:19Z) - MATE: Motion-Augmented Temporal Consistency for Event-based Point Tracking [58.719310295870024]
本稿では,任意の点を追跡するイベントベースのフレームワークを提案する。
事象の間隔に起因する曖昧さを解決するため、運動誘導モジュールは運動ベクトルを局所的なマッチングプロセスに組み込む。
このメソッドは、任意のポイントベースラインのイベントのみのトラッキングに対して、$Survival_50$メトリックを17.9%改善する。
論文 参考訳(メタデータ) (2024-12-02T09:13:29Z) - MOT FCG++: Enhanced Representation of Spatio-temporal Motion and Appearance Features [0.0]
本稿では, 階層クラスタリング手法MOT FCGの改良により, 外観と時空間の動作特徴を表現できる新しい手法を提案する。
まず, 物体の位置と形状の関係をより正確に表現した, 対角変調GIoUを提案する。
外観特徴に対して、信頼情報を含む動的外観表現を用い、軌道の外観特徴をより堅牢でグローバルにすることができる。
論文 参考訳(メタデータ) (2024-11-15T08:17:05Z) - 3D Multi-Object Tracking with Semi-Supervised GRU-Kalman Filter [6.13623925528906]
3D Multi-Object Tracking (MOT)は、自律運転やロボットセンシングのようなインテリジェントなシステムに不可欠である。
本稿では,学習可能なカルマンフィルタを移動モジュールに導入するGRUベースのMOT法を提案する。
このアプローチは、データ駆動学習を通じてオブジェクトの動き特性を学習することができ、手動モデル設計やモデルエラーを回避することができる。
論文 参考訳(メタデータ) (2024-11-13T08:34:07Z) - RobMOT: Robust 3D Multi-Object Tracking by Observational Noise and State Estimation Drift Mitigation on LiDAR PointCloud [11.111388829965103]
本稿では,3次元トラッキング・バイ・検出手法の限界,特に正当な軌跡の同定について論じる。
既存の手法では、しきい値に基づくフィルタリングを検出スコアに用いており、遠方や隠蔽対象で失敗することがある。
ゴーストトラックを著しく低減する,新しい軌道妥当性機構と多段階観測ゲーティングプロセスを提案する。
論文 参考訳(メタデータ) (2024-05-19T12:49:21Z) - MotionTrack: Learning Motion Predictor for Multiple Object Tracking [68.68339102749358]
本研究では,学習可能なモーション予測器を中心に,新しいモーショントラッカーであるMotionTrackを紹介する。
実験結果から、MotionTrackはDancetrackやSportsMOTといったデータセット上での最先端のパフォーマンスを示す。
論文 参考訳(メタデータ) (2023-06-05T04:24:11Z) - An Effective Motion-Centric Paradigm for 3D Single Object Tracking in
Point Clouds [50.19288542498838]
LiDARポイントクラウド(LiDAR SOT)における3Dシングルオブジェクトトラッキングは、自動運転において重要な役割を果たす。
現在のアプローチはすべて、外観マッチングに基づくシームズパラダイムに従っている。
我々は新たな視点からLiDAR SOTを扱うための動き中心のパラダイムを導入する。
論文 参考訳(メタデータ) (2023-03-21T17:28:44Z) - Motion Planning and Control for Multi Vehicle Autonomous Racing at High
Speeds [100.61456258283245]
本稿では,自律走行のための多層移動計画と制御アーキテクチャを提案する。
提案手法はダララのAV-21レースカーに適用され、楕円形のレーストラックで25$m/s2$まで加速試験された。
論文 参考訳(メタデータ) (2022-07-22T15:16:54Z) - StreamYOLO: Real-time Object Detection for Streaming Perception [84.2559631820007]
将来を予測する能力を備えたモデルを提供し、ストリーミング知覚の結果を大幅に改善する。
本稿では,複数の速度を駆動するシーンについて考察し,VasAP(Velocity-Awared streaming AP)を提案する。
本手法は,Argoverse-HDデータセットの最先端性能を実現し,SAPとVsAPをそれぞれ4.7%,VsAPを8.2%改善する。
論文 参考訳(メタデータ) (2022-07-21T12:03:02Z) - Distractor-Aware Fast Tracking via Dynamic Convolutions and MOT
Philosophy [63.91005999481061]
実用的長期トラッカーは、典型的には3つの重要な特性を含む。
効率的なモデル設計、効果的なグローバル再検出戦略、堅牢な気晴らし認識メカニズム。
動的畳み込み (d-convs) と多重オブジェクト追跡 (MOT) の哲学を用いて, 注意をそらした高速トラッキングを実現するための2タスクトラッキングフレームワーク(DMTrack)を提案する。
我々のトラッカーはLaSOT, OxUvA, TLP, VOT2018LT, VOT 2019LTベンチマークの最先端性能を実現し, リアルタイム3倍高速に動作させる。
論文 参考訳(メタデータ) (2021-04-25T00:59:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。