論文の概要: Time-series Meets Complex Motion Modeling: Robust and Computational-effective Motion Predictor for Multi-object Tracking
- arxiv url: http://arxiv.org/abs/2605.00362v1
- Date: Fri, 01 May 2026 02:51:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 17:43:28.829299
- Title: Time-series Meets Complex Motion Modeling: Robust and Computational-effective Motion Predictor for Multi-object Tracking
- Title(参考訳): 複雑な動きモデリングと時系列:多対象追跡のためのロバストかつ計算効率の良い動き予測器
- Authors: Nhat-Tan Do, Le-Huy Tu, Nhi Ngoc-Yen Nguyen, Dieu-Phuong Nguyen, Trong-Hop Do,
- Abstract要約: マルチオブジェクトトラッキング(MOT)は、監視、自律運転、ロボット工学など、多くの現実世界の応用において重要である。
我々は,拡張畳み込みと回帰ヘッドを備えた時間畳み込みネットワーク(TCN)を改良したMOTのための新しいフレームワークであるTCMP(Temporal Convolutional Motion Predictor)を紹介する。
実験結果から,提案手法は最先端性能を実現し,特にいくつかの重要な指標において,従来のベストメソッドの改善を図っている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Multi-object tracking (MOT) is critical in numerous real-world applications, including surveillance, autonomous driving, and robotics. Accurately predicting object motion is fundamental to MOT, but current methods struggle with the complexities of real-world, non-linear motion (e.g., sudden stops, sharp turns). While recent research has gravitated towards increasingly complex and computationally expensive generative models to tackle this problem, their practical utility is often constrained. This paper challenges that paradigm, arguing that such complexity is not only unnecessary but can be outperformed by a more efficient, purpose-built approach. We introduce the Temporal Convolutional Motion Predictor (TCMP), a novel framework for MOT that leverages a modified Temporal Convolutional Network (TCN) featuring dilated convolutions and a regression head. This design allows for effective motion prediction across arbitrary temporal context lengths. Experimental results demonstrate that our approach achieves state-of-the-art performance, specifically improves upon the previous best method in several key metrics: HOTA (a measure of overall tracking accuracy) increases from 62.3% to 63.4%, IDF1 (a measure of identity preservation) rises from 63.0% to 65.0%, and AssA (a measure of association accuracy) improves from 47.2% to 49.1%. Significantly, TCMP achieves this performance while being highly efficient; it has only 0.014 times the parameters and requires only 0.05 times the computational cost (FLOPs) compared to the SOTA method. while is only 0.014 times the size (in terms of parameters) and requires only 0.05 times the computational cost (in terms of FLOPs). These findings highlight the robustness of our method to advance MOT systems by ensuring adaptability, accuracy, and efficiency in complex tracking environments.
- Abstract(参考訳): マルチオブジェクトトラッキング(MOT)は、監視、自律運転、ロボット工学など、多くの現実世界の応用において重要である。
物体の動きを正確に予測することはMOTの基本であるが、現在の手法は実世界の非線型運動(例えば突然停止、急旋回)の複雑さに苦慮している。
近年の研究では、この問題に対処するために複雑で計算に費用がかかる生成モデルが注目されているが、実用性はしばしば制限されている。
本稿は、このような複雑さは不要であるだけでなく、より効率的で汎用的なアプローチによって性能を向上できると主張するパラダイムに挑戦する。
我々は,拡張畳み込みと回帰ヘッドを備えた時間畳み込みネットワーク(TCN)を改良したMOTのための新しいフレームワークであるTCMP(Temporal Convolutional Motion Predictor)を紹介する。
この設計により、任意の時間的文脈長にわたる効果的な動き予測が可能となる。
HOTAは62.3%から63.4%に増加し,IDF1は63.0%から65.0%に増加し,AssAは47.2%から49.1%に改善した。
パラメータの0.014倍しか持たず、SOTA法と比較して計算コスト(FLOP)の0.05倍しか必要としない。
パラメータの0.014倍しか必要とせず、計算コスト(FLOP)の0.05倍しか必要としない。
これらの結果は,複雑なトラッキング環境における適応性,正確性,効率性を確保することで,MOTシステムを進化させる手法の堅牢性を強調した。
関連論文リスト
- Just in time Informed Trees: Manipulability-Aware Asymptotically Optimized Motion Planning [46.553063931217245]
我々はJust-in-Time Informed Trees (JIT*)アルゴリズムを導入し、Effort Informed Trees (EIT*) を拡張した。
JIT* は $mathbbR4$ から $mathbbR16$ まで、従来のサンプリングベースのプランナよりも一貫して優れています。
論文 参考訳(メタデータ) (2026-01-27T18:58:51Z) - EfficientLLM: Efficiency in Large Language Models [64.3537131208038]
大規模言語モデル(LLM)は大きな進歩を導いてきたが、その増加とコンテキストウィンドウは計算、エネルギー、金銭的コストを禁止している。
本稿では,新しいベンチマークであるEfficientLLMを紹介する。
論文 参考訳(メタデータ) (2025-05-20T02:27:08Z) - Fast-COS: A Fast One-Stage Object Detector Based on Reparameterized Attention Vision Transformer for Autonomous Driving [3.617580194719686]
本稿では、シーンを駆動するための新しい単一ステージオブジェクト検出フレームワークであるFast-COSを紹介する。
RAViTはImageNet-1Kデータセットで81.4%のTop-1精度を達成した。
主要なモデルの効率を上回り、最大75.9%のGPU推論速度とエッジデバイスでの1.38のスループットを提供する。
論文 参考訳(メタデータ) (2025-02-11T09:54:09Z) - OneTrack-M: A multitask approach to transformer-based MOT models [0.0]
マルチオブジェクト追跡(MOT)はコンピュータビジョンにおいて重要な問題である。
OneTrack-Mは、計算効率と精度のトラッキングを強化するために設計されたトランスフォーマーベースのMOTモデルである。
論文 参考訳(メタデータ) (2025-02-06T20:02:06Z) - HybridTrack: A Hybrid Approach for Robust Multi-Object Tracking [7.916733469603948]
HybridTrackは、車両のための新しい3Dマルチオブジェクトトラッキングアプローチである。
データ駆動型カルマンフィルタ(KF)をトラッキング・バイ・検出パラダイムに統合する。
82.72%のHOTA精度を実現し、最先端の手法を著しく上回っている。
論文 参考訳(メタデータ) (2025-01-02T14:17:19Z) - Video Prediction Transformers without Recurrence or Convolution [65.93130697098658]
我々は、Gated Transformerを完全にベースとしたフレームワークであるPredFormerを提案する。
本稿では,映像予測の文脈における3次元注意の包括的分析を行う。
精度と効率の両面で大きな改善は、PredFormerの可能性を強調している。
論文 参考訳(メタデータ) (2024-10-07T03:52:06Z) - PointMT: Efficient Point Cloud Analysis with Hybrid MLP-Transformer Architecture [46.266960248570086]
本研究は,効率的な特徴集約のための複雑局所的注意機構を導入することで,自己注意機構の二次的複雑さに取り組む。
また,各チャネルの注目重量分布を適応的に調整するパラメータフリーチャネル温度適応機構を導入する。
我々は,PointMTが性能と精度の最適なバランスを維持しつつ,最先端手法に匹敵する性能を実現することを示す。
論文 参考訳(メタデータ) (2024-08-10T10:16:03Z) - SIMPL: A Simple and Efficient Multi-agent Motion Prediction Baseline for
Autonomous Driving [27.776472262857045]
本稿では,自動運転車のための簡易かつ効率的な運動予測ベースライン(SIMPL)を提案する。
メッセージ転送を対称的に行う,コンパクトで効率的なグローバル機能融合モジュールを提案する。
強力なベースラインとして、SIMPLはArgoverse 1と2のモーション予測ベンチマークで高い競争性能を示す。
論文 参考訳(メタデータ) (2024-02-04T15:07:49Z) - StreamYOLO: Real-time Object Detection for Streaming Perception [84.2559631820007]
将来を予測する能力を備えたモデルを提供し、ストリーミング知覚の結果を大幅に改善する。
本稿では,複数の速度を駆動するシーンについて考察し,VasAP(Velocity-Awared streaming AP)を提案する。
本手法は,Argoverse-HDデータセットの最先端性能を実現し,SAPとVsAPをそれぞれ4.7%,VsAPを8.2%改善する。
論文 参考訳(メタデータ) (2022-07-21T12:03:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。