Fugu-MT 論文翻訳(概要): DiffMOT: A Real-time Diffusion-based Multiple Object Tracker with Non-linear Prediction

論文の概要: DiffMOT: A Real-time Diffusion-based Multiple Object Tracker with Non-linear Prediction

arxiv url: http://arxiv.org/abs/2403.02075v1
Date: Mon, 4 Mar 2024 14:21:51 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-06 18:24:58.837344
Title: DiffMOT: A Real-time Diffusion-based Multiple Object Tracker with Non-linear Prediction
Title（参考訳）: diffmot:非線形予測を用いた実時間拡散型マルチオブジェクトトラッカ
Authors: Weiyi Lv and Yuhang Huang and Ning Zhang and Ruei-Sung Lin and Mei Han and Dan Zeng
Abstract要約: 我々はDiffMOTというリアルタイム拡散に基づくMOT手法を提案し、複雑な非線形運動に対処する。 MOTトラッカーとして、DiffMOTは22.7FPSでリアルタイムであり、DanceTrackやSportsMOTのデータセットの最先端よりも優れている。
参考スコア（独自算出の注目度）: 16.468873781448625
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In Multiple Object Tracking, objects often exhibit non-linear motion of acceleration and deceleration, with irregular direction changes. Tacking-by-detection (TBD) with Kalman Filter motion prediction works well in pedestrian-dominant scenarios but falls short in complex situations when multiple objects perform non-linear and diverse motion simultaneously. To tackle the complex non-linear motion, we propose a real-time diffusion-based MOT approach named DiffMOT. Specifically, for the motion predictor component, we propose a novel Decoupled Diffusion-based Motion Predictor (D MP). It models the entire distribution of various motion presented by the data as a whole. It also predicts an individual object's motion conditioning on an individual's historical motion information. Furthermore, it optimizes the diffusion process with much less sampling steps. As a MOT tracker, the DiffMOT is real-time at 22.7FPS, and also outperforms the state-of-the-art on DanceTrack and SportsMOT datasets with 63.4 and 76.2 in HOTA metrics, respectively. To the best of our knowledge, DiffMOT is the first to introduce a diffusion probabilistic model into the MOT to tackle non-linear motion prediction.
Abstract（参考訳）: 多重物体追跡では、物体はしばしば不規則な方向変化を伴う加速度と減速の非線形運動を示す。カルマンフィルタを用いたタッキング・バイ・検出(tbd)は歩行者主体のシナリオではうまく機能するが、複数の物体が非線形かつ多様な動きを同時に行う場合、複雑な状況では不足する。複雑な非線形運動に対処するため,DiffMOTと呼ばれるリアルタイム拡散型MOT手法を提案する。具体的には、運動予測器の構成要素として、DMP(Decoupled Diffusion-based Motion Predictor)を提案する。データ全体から提示される様々な動きの分布全体をモデル化する。また、個人の過去の動き情報に基づいて、個々の物体の動き条件を予測する。さらに、より少ないサンプリングステップで拡散過程を最適化する。 MOTトラッカーとして、DiffMOTは22.7FPSでリアルタイムであり、DOTAの63.4と76.2でDanceTrackとSportsMOTのデータセットの最先端をそれぞれ上回っている。我々の知る限りでは、DiffMOTは初めての拡散確率モデルをMOTに導入し、非線形運動予測に取り組む。

関連論文リスト

PlugTrack: Multi-Perceptive Motion Analysis for Adaptive Fusion in Multi-Object Tracking [3.976291254896486]
マルチパーセプティブな動作理解を通じて、カルマンフィルタとデータ駆動型動作予測器を適応的に融合するフレームワークであるPlugTrackを提案する。 PlugTrackは、既存のモーション予測器を変更することなく、MOT17/MOT20とDanceTrackの最先端のパフォーマンス向上を実現している。
論文参考訳（メタデータ） (2025-11-17T08:03:11Z)
Tracking the Unstable: Appearance-Guided Motion Modeling for Robust Multi-Object Tracking in UAV-Captured Videos [58.156141601478794]
マルチオブジェクトトラッキング(UAVT)は、ビデオのフレーム間で一貫したアイデンティティを維持しながら、複数のオブジェクトを追跡することを目的としている。既存の手法は、通常、動作キューと外観を別々にモデル化し、それらの相互作用を見渡して、最適下追跡性能をもたらす。本稿では、AMC行列とMTCモジュールの2つの主要コンポーネントを通して、外観と動きの手がかりを利用するAMOTを提案する。
論文参考訳（メタデータ） (2025-08-03T12:06:47Z)
EMoTive: Event-guided Trajectory Modeling for 3D Motion Estimation [59.33052312107478]
イベントカメラは、シーン変化に対する連続的適応ピクセルレベル応答による3次元モーション推定の可能性を提供する。本稿では,イベント誘導パラメトリック曲線を用いた一様軌道をモデル化するイベントベースフレームワークであるEMoveについて述べる。動作表現には,事象誘導下での空間的特徴と時間的特徴を融合する密度認識適応機構を導入する。最終3次元運動推定は、パラメトリック軌道、流れ、深度運動場の多時間サンプリングによって達成される。
論文参考訳（メタデータ） (2025-03-14T13:15:54Z)
Event-Based Tracking Any Point with Motion-Augmented Temporal Consistency [58.719310295870024]
本稿では,任意の点を追跡するイベントベースのフレームワークを提案する。出来事の空間的空間性や動きの感度によって引き起こされる課題に対処する。競合モデルパラメータによる処理を150%高速化する。
論文参考訳（メタデータ） (2024-12-02T09:13:29Z)
MambaTrack: A Simple Baseline for Multiple Object Tracking with State Space Model [18.607106274732885]
我々は、MTP(Mamba moTion Predictor)という、マンバをベースとしたモーションモデルを導入する。 MTPは、物体の時空間的位置ダイナミクスを入力として、バイマンバ符号化層を用いて動きパターンをキャプチャし、次の動きを予測する。提案するトラッカーであるMambaTrackは、DancetrackやSportsMOTなどのベンチマークで高度なパフォーマンスを示す。
論文参考訳（メタデータ） (2024-08-17T11:58:47Z)
ETTrack: Enhanced Temporal Motion Predictor for Multi-Object Tracking [4.250337979548885]
時間的動き予測器であるETTrackを用いた動きに基づくMOT手法を提案する。具体的には、動作予測器は、変換器モデルと時間畳み込みネットワーク(TCN)を統合して、短期および長期の動作パターンをキャプチャする。本研究では,DanceTrackとSportsMOTの最先端トラッカーと比較して,ETTrackの競争性能が向上していることを示す。
論文参考訳（メタデータ） (2024-05-24T17:51:33Z)
Ego-Motion Aware Target Prediction Module for Robust Multi-Object Tracking [2.7898966850590625]
我々は、Ego-motion Aware Target Prediction (EMAP)と呼ばれる新しいKFベースの予測モジュールを導入する。提案手法は、カルマンフィルタを再構成することにより、物体軌道からのカメラ回転速度と翻訳速度の影響を分離する。 EMAPはOC-SORTとDeep OC-SORTのIDSWをそれぞれ73%と21%減少させる。
論文参考訳（メタデータ） (2024-04-03T23:24:25Z)
MotionTrack: Learning Motion Predictor for Multiple Object Tracking [68.68339102749358]
本研究では,学習可能なモーション予測器を中心に,新しいモーショントラッカーであるMotionTrackを紹介する。実験結果から、MotionTrackはDancetrackやSportsMOTといったデータセット上での最先端のパフォーマンスを示す。
論文参考訳（メタデータ） (2023-06-05T04:24:11Z)
An Effective Motion-Centric Paradigm for 3D Single Object Tracking in Point Clouds [50.19288542498838]
LiDARポイントクラウド(LiDAR SOT)における3Dシングルオブジェクトトラッキングは、自動運転において重要な役割を果たす。現在のアプローチはすべて、外観マッチングに基づくシームズパラダイムに従っている。我々は新たな視点からLiDAR SOTを扱うための動き中心のパラダイムを導入する。
論文参考訳（メタデータ） (2023-03-21T17:28:44Z)
Motion Transformer with Global Intention Localization and Local Movement Refinement [103.75625476231401]
動き TRansformer (MTR) は、大域的意図の局所化と局所的な動きの洗練の合同最適化として、動き予測をモデル化する。 MTRは、限界運動予測と関節運動予測の両方において最先端の性能を達成する。
論文参考訳（メタデータ） (2022-09-27T16:23:14Z)
Observation-Centric SORT: Rethinking SORT for Robust Multi-Object Tracking [32.32109475782992]
簡単な動きモデルにより、外観のような他の手段を使わずに、最先端のトラッキング性能が得られることを示す。そこで我々は,提案手法を OC-SORT,Observatory-Centric SORT,略してOC-SORT と呼ぶ。
論文参考訳（メタデータ） (2022-03-27T17:57:08Z)
MotionRNN: A Flexible Model for Video Prediction with Spacetime-Varying Motions [70.30211294212603]
本稿では,空間と時間の両方に連続する時空変動を予測できる新たな次元からビデオ予測を行う。本研究では,動きの複雑な変動を捉え,時空変化に適応できるMotionRNNフレームワークを提案する。
論文参考訳（メタデータ） (2021-03-03T08:11:50Z)
Motion Prediction Using Temporal Inception Module [96.76721173517895]
人間の動作を符号化するTIM(Temporal Inception Module)を提案する。本フレームワークは,異なる入力長に対して異なるカーネルサイズを用いて,畳み込み層を用いて入力埋め込みを生成する。標準的な動き予測ベンチマークデータセットであるHuman3.6MとCMUのモーションキャプチャデータセットの実験結果から,我々の手法は一貫して技術手法の状態を上回ります。
論文参考訳（メタデータ） (2020-10-06T20:26:01Z)
Simultaneous Detection and Tracking with Motion Modelling for Multiple Object Tracking [94.24393546459424]
本稿では,複数の物体の運動パラメータを推定し,共同検出と関連付けを行うディープ・モーション・モデリング・ネットワーク(DMM-Net)を提案する。 DMM-Netは、人気の高いUA-DETRACチャレンジで12.80 @120+ fpsのPR-MOTAスコアを達成した。また,車両追跡のための大規模な公開データセットOmni-MOTを合成し,精密な接地トルースアノテーションを提供する。
論文参考訳（メタデータ） (2020-08-20T08:05:33Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。