論文の概要: SAMOFT: Robust Multi-Object Tracking via Region and Flow
- arxiv url: http://arxiv.org/abs/2605.09417v1
- Date: Sun, 10 May 2026 08:39:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.23768
- Title: SAMOFT: Robust Multi-Object Tracking via Region and Flow
- Title(参考訳): SAMOFT: 領域とフローによるロバストなマルチオブジェクト追跡
- Authors: Yanchao Wang, Dawei Zhang, Chengzhuan Yang, Wei Liu, Minglu Li, Hua Wang, Zhonglong Zheng, Ming-Hsuan Yang,
- Abstract要約: マルチオブジェクトトラッキング(MOT)は、コンピュータビジョンにおける基本的なタスクであり、複数のターゲットを継続的に追跡する必要がある。
既存のアプローチのほとんどは、軌道関連のためのインスタンスレベルのオブジェクト機能に依存しています。
我々は,複雑な動作シナリオ下でのロバスト性向上のために,画素レベルのキューを活用するロバストトラッカーSAMOFTを提案する。
- 参考スコア(独自算出の注目度): 42.6206516982406
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-object tracking (MOT) is a fundamental task in computer vision that requires continuously tracking multiple targets while maintaining consistent identities across frames. However, most existing approaches primarily rely on instance-level object features for trajectory association, which often leads to degraded performance under challenging conditions such as object deformation, nonlinear motion, and occlusion. In this work, we propose SAMOFT, a robust tracker that leverages pixel-level cues to improve robustness under complex motion scenarios. Specifically, we introduce a Pixel Motion Matching (PMM) module that integrates the Segment Anything Model (SAM) with dense optical flow to refine Kalman filter-based motion prediction using instantaneous foreground pixel motion. To further enhance robustness under unreliable detections, we design a Centroid Distance Matching (CDM) module that performs flexible mask-based centroid matching for low-confidence or partially occluded observations. Moreover, a Distribution-Based Correction (DBC) module models long-tailed motion patterns in a training-free manner using historical optical flow statistics and dynamically corrects trajectory states online. We also incorporate a Cluster-Aware ReID (CA-ReID) strategy to improve the stability and discriminative power of trajectory appearance features. Extensive experiments on the DanceTrack and MOTChallenge benchmarks demonstrate that SAMOFT consistently improves baseline trackers and achieves competitive performance compared with recent state-of-the-art methods, validating the effectiveness of leveraging pixel-level cues for robust multi-object tracking.
- Abstract(参考訳): マルチオブジェクト追跡(MOT)はコンピュータビジョンにおける基本的なタスクであり、フレーム間の一貫したアイデンティティを維持しながら、複数のターゲットを継続的に追跡する必要がある。
しかし、既存のほとんどのアプローチは、主に軌道アソシエーションのインスタンスレベルのオブジェクト特徴に依存しており、しばしばオブジェクトの変形、非線形運動、閉塞といった困難な条件下での劣化性能をもたらす。
本研究では,複雑な動作シナリオ下でのロバスト性向上のために画素レベルのキューを活用するロバストトラッカーSAMOFTを提案する。
具体的には,Segment Anything Model (SAM) と高密度光流を統合したPixel Motion Matching (PMM) モジュールを導入する。
信頼性の低い検出において、より堅牢性を高めるために、低信頼または部分的に排除された観察のためにフレキシブルマスクベースのセントロイドマッチングを実行するCentroid Distance Matching (CDM) モジュールを設計する。
さらに、分散ベース補正(DBC)モジュールは、歴史的光学的フロー統計を用いて、トレーニング不要な長い尾運動パターンをモデル化し、オンラインで軌道状態の動的修正を行う。
また,CA-ReID(Cluster-Aware ReID)戦略を取り入れ,軌道外観特徴の安定性と識別力を向上させる。
DanceTrackとMOTChallengeベンチマークの大規模な実験により、SAMOFTはベースライントラッカーを一貫して改善し、最近の最先端手法と比較して競争性能を向上し、堅牢なマルチオブジェクトトラッキングにピクセルレベルのキューを活用することの有効性を検証した。
関連論文リスト
- Hypergraph-State Collaborative Reasoning for Multi-Object Tracking [63.32950991964095]
複数の相関オブジェクト間の共同推論による動き推定を向上する協調推論フレームワークを提案する。
類似の運動状態を持つ物体同士を互いに拘束し、互いに洗練させることで、我々のフレームワークはノイズの軌道を安定させ、目標を遮蔽しても可塑性運動の連続性を推測する。
論文 参考訳(メタデータ) (2026-04-14T12:37:39Z) - DMTrack: Deformable State-Space Modeling for UAV Multi-Object Tracking with Kalman Fusion and Uncertainty-Aware Association [18.68212724411998]
無人航空機(UAV)からの多目的追跡(MOT)は、予測不可能な物体の動きによる固有の課題を提示する。
UAVベースのMOTに適した変形可能なモーショントラッキングフレームワークであるDMTrackを提案する。
本手法は, 外観モデルなしで動作し, 競争効率を保ち, 堅牢なUAVトラッキングの実現性を強調した。
論文 参考訳(メタデータ) (2025-10-15T13:54:25Z) - SocialTrack: Multi-Object Tracking in Complex Urban Traffic Scenes Inspired by Social Behavior [17.501890320034693]
本稿では,複雑な都市交通環境における小目標の追跡精度とロバスト性を高めるために,新しい多目的追跡フレームワークSocialTrackを提案する。
特殊小ターゲット検出器は、マルチスケールの特徴増強機構を用いて検出性能を向上させる。
UAVDTとMOT17データセットに関する大規模な実験は、SocialTrackが既存の最先端(SOTA)メソッドをいくつかの主要なメトリクスで上回っていることを示している。
論文 参考訳(メタデータ) (2025-08-18T09:53:32Z) - Tracking the Unstable: Appearance-Guided Motion Modeling for Robust Multi-Object Tracking in UAV-Captured Videos [58.156141601478794]
マルチオブジェクトトラッキング(UAVT)は、ビデオのフレーム間で一貫したアイデンティティを維持しながら、複数のオブジェクトを追跡することを目的としている。
既存の手法は、通常、動作キューと外観を別々にモデル化し、それらの相互作用を見渡して、最適下追跡性能をもたらす。
本稿では、AMC行列とMTCモジュールの2つの主要コンポーネントを通して、外観と動きの手がかりを利用するAMOTを提案する。
論文 参考訳(メタデータ) (2025-08-03T12:06:47Z) - CAMELTrack: Context-Aware Multi-cue ExpLoitation for Online Multi-Object Tracking [68.24998698508344]
CAMELはコンテキスト対応型マルチキューExpLoitationのための新しいアソシエイトモジュールである。
エンド・ツー・エンドの検知・バイ・トラック方式とは異なり,本手法は軽量かつ高速にトレーニングが可能であり,外部のオフ・ザ・シェルフモデルを活用することができる。
提案するオンライントラッキングパイプラインであるCAMELTrackは,複数のトラッキングベンチマークで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2025-05-02T13:26:23Z) - MATE: Motion-Augmented Temporal Consistency for Event-based Point Tracking [58.719310295870024]
本稿では,任意の点を追跡するイベントベースのフレームワークを提案する。
事象の間隔に起因する曖昧さを解決するため、運動誘導モジュールは運動ベクトルを局所的なマッチングプロセスに組み込む。
このメソッドは、任意のポイントベースラインのイベントのみのトラッキングに対して、$Survival_50$メトリックを17.9%改善する。
論文 参考訳(メタデータ) (2024-12-02T09:13:29Z) - MAT: Motion-Aware Multi-Object Tracking [9.098793914779161]
本稿では,様々な物体の動作パターンに着目した動き認識トラッキング(MAT)を提案する。
MOT16とMOT17の挑戦的なベンチマークの実験は、我々のMATアプローチが大きなマージンで優れたパフォーマンスを達成することを実証している。
論文 参考訳(メタデータ) (2020-09-10T11:51:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。