論文の概要: YOLO11-JDE: Fast and Accurate Multi-Object Tracking with Self-Supervised Re-ID
- arxiv url: http://arxiv.org/abs/2501.13710v1
- Date: Thu, 23 Jan 2025 14:38:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-24 15:59:13.319094
- Title: YOLO11-JDE: Fast and Accurate Multi-Object Tracking with Self-Supervised Re-ID
- Title(参考訳): YOLO11-JDE:自己監督型Re-IDによる高速かつ高精度なマルチオブジェクトトラッキング
- Authors: Iñaki Erregue, Kamal Nasrollahi, Sergio Escalera,
- Abstract要約: リアルタイム物体検出と自己教師付き再同定(Re-ID)を組み合わせた,高速かつ正確なマルチオブジェクト追跡(MOT)ソリューションであるYOLO11-JDEを導入する。
YOLO11に専用のRe-IDブランチを組み込むことで,検出毎に外観特徴を生成するJDE(Joint Detection and Embedding)を実行する。
YOLO11-JDE は MOT17 と MOT20 のベンチマークで競合し、既存の JDE メソッドを FPS で上回り、最大 10 倍のパラメータを使用する。
- 参考スコア(独自算出の注目度): 38.27486095404261
- License:
- Abstract: We introduce YOLO11-JDE, a fast and accurate multi-object tracking (MOT) solution that combines real-time object detection with self-supervised Re-Identification (Re-ID). By incorporating a dedicated Re-ID branch into YOLO11s, our model performs Joint Detection and Embedding (JDE), generating appearance features for each detection. The Re-ID branch is trained in a fully self-supervised setting while simultaneously training for detection, eliminating the need for costly identity-labeled datasets. The triplet loss, with hard positive and semi-hard negative mining strategies, is used for learning discriminative embeddings. Data association is enhanced with a custom tracking implementation that successfully integrates motion, appearance, and location cues. YOLO11-JDE achieves competitive results on MOT17 and MOT20 benchmarks, surpassing existing JDE methods in terms of FPS and using up to ten times fewer parameters. Thus, making our method a highly attractive solution for real-world applications.
- Abstract(参考訳): 本稿では,リアルタイム物体検出と自己教師付き再同定(Re-ID)を組み合わせた,高速かつ正確なマルチオブジェクト追跡(MOT)ソリューションであるYOLO11-JDEを紹介する。
YOLO11に専用のRe-IDブランチを組み込むことで,JDE(Joint Detection and Embedding)を実行し,検出毎に外観特徴を生成する。
Re-IDブランチは、完全に自己管理された設定でトレーニングされ、同時に検出のためのトレーニングが行われ、コストのかかるIDラベル付きデータセットが不要になる。
三重項の損失は、強い正と半強硬な負の鉱業戦略を持ち、識別的埋め込みの学習に使用される。
データアソシエーションは、動き、外観、位置の手がかりをうまく統合するカスタムトラッキング実装によって強化されている。
YOLO11-JDE は MOT17 と MOT20 のベンチマークで競合し、既存の JDE メソッドを FPS で上回り、最大 10 倍のパラメータを使用する。
したがって,本手法を実世界のアプリケーションにとって非常に魅力的なソリューションとする。
関連論文リスト
- Temporal Correlation Meets Embedding: Towards a 2nd Generation of JDE-based Real-Time Multi-Object Tracking [52.04679257903805]
共同検出・埋め込み(JDE)トラッカーは多目的追跡(MOT)タスクにおいて優れた性能を示した。
TCBTrackという名前のトラッカーは、複数の公開ベンチマークで最先端のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2024-07-19T07:48:45Z) - YOLO-World: Real-Time Open-Vocabulary Object Detection [87.08732047660058]
オープン語彙検出機能でYOLOを強化する革新的なアプローチであるYOLO-Worldを紹介する。
提案手法は,ゼロショット方式で広範囲の物体を高効率で検出する。
YOLO-WorldはV100上で52.0 FPSの35.4 APを達成した。
論文 参考訳(メタデータ) (2024-01-30T18:59:38Z) - Hybrid-SORT: Weak Cues Matter for Online Multi-Object Tracking [51.16677396148247]
Multi-Object Tracking (MOT) は、望まれるすべてのオブジェクトをフレーム間で検出し、関連付けることを目的としている。
本稿では,MOTにおけるこの長期的課題を,弱い手がかりを取り入れることで,効果的かつ効果的に解決できることを実証する。
提案手法は,MOT17,MOT20,特にDanceTrackなど,様々なベンチマークにおいて優れた性能を実現する。
論文 参考訳(メタデータ) (2023-08-01T18:53:24Z) - Self-Supervised Multi-Object Tracking For Autonomous Driving From
Consistency Across Timescales [53.55369862746357]
自己管理型マルチオブジェクトトラッカーは、生のドメイン固有データから学習できるという大きな可能性を秘めている。
しかし、その再識別精度は、監督対象よりも低い。
本稿では,複数の連続フレームから再同定特徴を自己教師付きで学習できる学習目標を提案する。
論文 参考訳(メタデータ) (2023-04-25T20:47:29Z) - SimpleTrack: Rethinking and Improving the JDE Approach for Multi-Object
Tracking [10.969806056391004]
共同検出と埋め込み(JDE)に基づくマルチオブジェクトトラッキング(MOT)における単一のネットワークを持つオブジェクトのバウンディングボックスと埋め込み特性の推定
追跡段階において、JDEに基づく手法は、同じルールを適用して、ターゲットの動作情報と外観情報を融合する。
本稿では,埋め込みコサイン距離と物体のジョウ距離を組み合わせた新しい相関行列,エンベディングとジョウ行列を提案する。
論文 参考訳(メタデータ) (2022-03-08T10:19:35Z) - Multi-object Tracking with a Hierarchical Single-branch Network [31.680667324595557]
階層的な単一ブランチネットワークに基づくオンライン多目的追跡フレームワークを提案する。
新たなiHOIM損失関数は,2つのサブタスクの目的を統一し,より優れた検出性能を実現する。
MOT16とMOT20データセットの実験結果から,最先端のトラッキング性能が達成できた。
論文 参考訳(メタデータ) (2021-01-06T12:14:58Z) - Multi-object tracking with self-supervised associating network [5.947279761429668]
人間のラベリングを伴わない短い動画を多数使用して,新たな自己教師型学習手法を提案する。
再識別ネットワークは自己管理方式で訓練されているが、MOTA 62.0% と IDF1 62.6% の最先端性能をMOT17テストベンチマークで達成している。
論文 参考訳(メタデータ) (2020-10-26T08:48:23Z) - Rethinking the competition between detection and ReID in Multi-Object
Tracking [44.59367033562385]
検出と識別の埋め込みを共同で学習するワンショットモデルは、マルチオブジェクトトラッキング(MOT)において大きな注目を集めている。
本稿では,タスク依存表現をよりよく学習するために,自己関係と相互関係を持つ新しい相互ネットワーク(REN)を提案する。
また,ID埋め込みの関連性を改善するために,意味レベルのミスアライメントを防止するスケールアウェア・アテンション・ネットワーク(SAAN)を導入する。
論文 参考訳(メタデータ) (2020-10-23T02:44:59Z) - Towards Precise Intra-camera Supervised Person Re-identification [54.86892428155225]
人物の再識別(Re-ID)のためのカメラ内監視(ICS)は、アイデンティティラベルが各カメラビュー内に独立してアノテートされていると仮定する。
カメラ間ラベルの欠如により、ICS Re-ID問題は、完全に監督されたラベルよりもはるかに難しい。
われわれの手法は、2つのデータセットで最先端の完全教師付き手法に匹敵する性能を発揮する。
論文 参考訳(メタデータ) (2020-02-12T11:56:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。