論文の概要: DiffMOT: A Real-time Diffusion-based Multiple Object Tracker with
Non-linear Prediction
- arxiv url: http://arxiv.org/abs/2403.02075v1
- Date: Mon, 4 Mar 2024 14:21:51 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-06 18:24:58.837344
- Title: DiffMOT: A Real-time Diffusion-based Multiple Object Tracker with
Non-linear Prediction
- Title(参考訳): diffmot:非線形予測を用いた実時間拡散型マルチオブジェクトトラッカ
- Authors: Weiyi Lv and Yuhang Huang and Ning Zhang and Ruei-Sung Lin and Mei Han
and Dan Zeng
- Abstract要約: 我々はDiffMOTというリアルタイム拡散に基づくMOT手法を提案し、複雑な非線形運動に対処する。
MOTトラッカーとして、DiffMOTは22.7FPSでリアルタイムであり、DanceTrackやSportsMOTのデータセットの最先端よりも優れている。
- 参考スコア(独自算出の注目度): 16.468873781448625
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In Multiple Object Tracking, objects often exhibit non-linear motion of
acceleration and deceleration, with irregular direction changes.
Tacking-by-detection (TBD) with Kalman Filter motion prediction works well in
pedestrian-dominant scenarios but falls short in complex situations when
multiple objects perform non-linear and diverse motion simultaneously. To
tackle the complex non-linear motion, we propose a real-time diffusion-based
MOT approach named DiffMOT. Specifically, for the motion predictor component,
we propose a novel Decoupled Diffusion-based Motion Predictor (D MP). It models
the entire distribution of various motion presented by the data as a whole. It
also predicts an individual object's motion conditioning on an individual's
historical motion information. Furthermore, it optimizes the diffusion process
with much less sampling steps. As a MOT tracker, the DiffMOT is real-time at
22.7FPS, and also outperforms the state-of-the-art on DanceTrack and SportsMOT
datasets with 63.4 and 76.2 in HOTA metrics, respectively. To the best of our
knowledge, DiffMOT is the first to introduce a diffusion probabilistic model
into the MOT to tackle non-linear motion prediction.
- Abstract(参考訳): 多重物体追跡では、物体はしばしば不規則な方向変化を伴う加速度と減速の非線形運動を示す。
カルマンフィルタを用いたタッキング・バイ・検出(tbd)は歩行者主体のシナリオではうまく機能するが、複数の物体が非線形かつ多様な動きを同時に行う場合、複雑な状況では不足する。
複雑な非線形運動に対処するため,DiffMOTと呼ばれるリアルタイム拡散型MOT手法を提案する。
具体的には、運動予測器の構成要素として、DMP(Decoupled Diffusion-based Motion Predictor)を提案する。
データ全体から提示される様々な動きの分布全体をモデル化する。
また、個人の過去の動き情報に基づいて、個々の物体の動き条件を予測する。
さらに、より少ないサンプリングステップで拡散過程を最適化する。
MOTトラッカーとして、DiffMOTは22.7FPSでリアルタイムであり、DOTAの63.4と76.2でDanceTrackとSportsMOTのデータセットの最先端をそれぞれ上回っている。
我々の知る限りでは、DiffMOTは初めての拡散確率モデルをMOTに導入し、非線形運動予測に取り組む。
関連論文リスト
- AM-SORT: Adaptable Motion Predictor with Historical Trajectory Embedding
for Multi-Object Tracking [26.585985828583304]
我々は,非線形不確かさを推定するために適応性のある動き予測器AM-SORTを用いた動きに基づくMOT手法を提案する。
AM-SORTは、カルマンフィルタに取って代わるSORTシリーズトラッカーの新たな拡張である。
論文 参考訳(メタデータ) (2024-01-25T05:09:30Z) - MotionTrack: Learning Motion Predictor for Multiple Object Tracking [68.68339102749358]
本研究では,学習可能なモーション予測器を中心に,新しいモーショントラッカーであるMotionTrackを紹介する。
実験結果から、MotionTrackはDancetrackやSportsMOTといったデータセット上での最先端のパフォーマンスを示す。
論文 参考訳(メタデータ) (2023-06-05T04:24:11Z) - MSTFormer: Motion Inspired Spatial-temporal Transformer with
Dynamic-aware Attention for long-term Vessel Trajectory Prediction [0.6451914896767135]
MSTFormer は Transformer に基づく動きインスパイアされた容器軌道予測手法である。
軌道の空間的特徴と運動特徴を記述するためのデータ拡張手法を提案する。
第2に,頻繁な動き変換を伴う軌道点に着目したマルチヘッド動的自己認識機構を提案する。
第三に、モデルの性能をさらに向上させるために、知識にインスパイアされた損失関数を構築する。
論文 参考訳(メタデータ) (2023-03-21T02:11:37Z) - Adaptive Multi-source Predictor for Zero-shot Video Object Segmentation [68.56443382421878]
ゼロショットビデオオブジェクトセグメンテーション(ZVOS)のための新しい適応型マルチソース予測器を提案する。
静的オブジェクト予測器では、RGBソースは、同時に深度および静注ソースに変換される。
実験の結果,提案モデルは3つのZVOSベンチマークにおいて最先端の手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2023-03-18T10:19:29Z) - Motion Transformer with Global Intention Localization and Local Movement
Refinement [103.75625476231401]
動き TRansformer (MTR) は、大域的意図の局所化と局所的な動きの洗練の合同最適化として、動き予測をモデル化する。
MTRは、限界運動予測と関節運動予測の両方において最先端の性能を達成する。
論文 参考訳(メタデータ) (2022-09-27T16:23:14Z) - Observation-Centric SORT: Rethinking SORT for Robust Multi-Object
Tracking [32.32109475782992]
簡単な動きモデルにより、外観のような他の手段を使わずに、最先端のトラッキング性能が得られることを示す。
そこで我々は,提案手法を OC-SORT,Observatory-Centric SORT,略してOC-SORT と呼ぶ。
論文 参考訳(メタデータ) (2022-03-27T17:57:08Z) - Stochastic Trajectory Prediction via Motion Indeterminacy Diffusion [88.45326906116165]
運動不確定性拡散(MID)の逆過程として軌道予測タスクを定式化する新しい枠組みを提案する。
我々は,履歴行動情報と社会的相互作用を状態埋め込みとしてエンコードし,トランジトリの時間的依存性を捉えるためにトランスフォーマーに基づく拡散モデルを考案する。
スタンフォード・ドローンやETH/UCYデータセットなど,人間の軌道予測ベンチマーク実験により,本手法の優位性を実証した。
論文 参考訳(メタデータ) (2022-03-25T16:59:08Z) - DetFlowTrack: 3D Multi-object Tracking based on Simultaneous
Optimization of Object Detection and Scene Flow Estimation [23.305159598648924]
オブジェクト検出とシーンフロー推定の同時最適化に基づく3次元MOTフレームワークを提案する。
特に回転を伴う動きの場合のより正確なシーンフローラベルについて,ボックス変換に基づくシーンフローグラウンド真理計算法を提案する。
KITTI MOTデータセットの実験結果は、回転を伴う極運動下での最先端とロバスト性に対して競合する結果を示した。
論文 参考訳(メタデータ) (2022-03-04T07:06:47Z) - MotionRNN: A Flexible Model for Video Prediction with Spacetime-Varying
Motions [70.30211294212603]
本稿では,空間と時間の両方に連続する時空変動を予測できる新たな次元からビデオ予測を行う。
本研究では,動きの複雑な変動を捉え,時空変化に適応できるMotionRNNフレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-03T08:11:50Z) - Motion Prediction Using Temporal Inception Module [96.76721173517895]
人間の動作を符号化するTIM(Temporal Inception Module)を提案する。
本フレームワークは,異なる入力長に対して異なるカーネルサイズを用いて,畳み込み層を用いて入力埋め込みを生成する。
標準的な動き予測ベンチマークデータセットであるHuman3.6MとCMUのモーションキャプチャデータセットの実験結果から,我々の手法は一貫して技術手法の状態を上回ります。
論文 参考訳(メタデータ) (2020-10-06T20:26:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。