論文の概要: SAMIDARE: Advanced Tracking-by-Segmentation for Dense Scenarios
- arxiv url: http://arxiv.org/abs/2604.22162v1
- Date: Fri, 24 Apr 2026 02:22:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-27 15:36:26.311449
- Title: SAMIDARE: Advanced Tracking-by-Segmentation for Dense Scenarios
- Title(参考訳): SAMIDARE: ディエンスシナリオのための高度なトラッキング・バイ・セグメンテーション
- Authors: Shozaburo Hirano, Norimichi Ukita,
- Abstract要約: SAMIDAREは、密集したシーンにおける多目的追跡を強化するフレームワークである。
これはSportsMOTデータセットの堅牢性を達成し、ベースラインを2.5 HOTAと4.2 IDF1ポイントで上回る。
これらの結果から,マスク制御とステート・アウェア・アソシエーションを用いた適応型特徴管理が,高密度スポーツトラッキングの堅牢かつ効率的なソリューションであることが示された。
- 参考スコア(独自算出の注目度): 14.682073556734515
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automated sports analysis demands robust multi-object tracking (MOT), yet segmentation-based methods often struggle with mask errors and ID switches in dense scenes. We propose SAMIDARE, a framework that enhances SAM2MOT for crowded scenes through three key components: (1) density-aware mask re-generation and (2) selective memory updates, both for adaptive mask control to preserve target feature integrity, and (3) state-aware association and new track initialization, which improves robustness under mutual occlusions and frequent frame-out events. Evaluated on the SportsMOT dataset, SAMIDARE achieves state-of-the-art performance, outperforming the baseline by 2.5 HOTA and 4.2 IDF1 points on the validation set. These results demonstrate that adaptive feature management using mask control and state-aware association provide a robust and efficient solution for dense sports tracking. Code is available at https://github.com/ZabuZabuZabu/SAMIDARE
- Abstract(参考訳): 自動スポーツ分析では、堅牢なマルチオブジェクトトラッキング(MOT)が要求されるが、セグメンテーションベースの手法では、密集したシーンでマスクエラーやIDスイッチに悩まされることが多い。
SAMIDAREは,(1)密度認識マスクのリジェネレーションと(2)目標特徴の整合性を維持するための適応マスク制御のための選択メモリ更新,(3)状態認識アソシエーションと新しいトラック初期化の3つの主要なコンポーネントを通じて,混雑したシーンに対するSAM2MOTを強化するフレームワークを提案する。
SAMIDAREは、SportsMOTデータセットに基づいて、最先端のパフォーマンスを達成し、ベースラインを2.5HOTAと4.2IDF1ポイントで上回った。
これらの結果から,マスク制御とステート・アウェア・アソシエーションを用いた適応型特徴管理が,高密度スポーツトラッキングの堅牢かつ効率的なソリューションであることが示された。
コードはhttps://github.com/ZabuZabuZabu/SAMIDAREで入手できる。
関連論文リスト
- COVTrack++: Learning Open-Vocabulary Multi-Object Tracking from Continuous Videos via a Synergistic Paradigm [59.26203051651017]
C-TAOはOpen-Vocabulary Multi-Object Tracking (OVMOT)のための最初の連続アノテーション付きトレーニングセットである
フレームワークボトルネックに対するCOVTrack++は,3つのモジュールによる検出とアソシエーションの双方向相互機構を実現するための相乗的フレームワークである。
TAOの実験では、新しいTAAは検証とテストセットで35.4%、30.5%に達し、新しいAssocAは4.8%、新しいLocAは5.8%向上した。
論文 参考訳(メタデータ) (2026-03-25T07:20:27Z) - Evaluating SAM2 for Video Semantic Segmentation [60.157605818225186]
Anything Model 2 (SAM2)は、画像とビデオの両方において、迅速な視覚オブジェクトのセグメンテーションのための強力な基盤モデルであることが証明されている。
本稿では, SAM2 から高密度ビデオセマンティック (VSS) への拡張について検討する。
我々の実験は、SAM2を利用することでVSSの全体的な性能が向上することを示唆している。
論文 参考訳(メタデータ) (2025-12-01T15:15:16Z) - Distractor-Aware Memory-Based Visual Object Tracking [17.945503249662675]
本稿では,SAM2のイントロスペクションに基づくメモリモジュールとイントロスペクション・ベースの管理手法を提案する。
本設計は, 物体閉塞後のトラクションドリフトを効果的に低減し, 再検出能力を向上させる。
13のベンチマークで、DAM4SAMはSAM2.1より優れており、10に新しい最先端結果が設定されている。
論文 参考訳(メタデータ) (2025-09-17T09:54:27Z) - Seg2Track-SAM2: SAM2-based Multi-object Tracking and Segmentation for Zero-shot Generalization [3.108551551357326]
Seg2Track-SAM2は、事前訓練されたオブジェクト検出器とSAM2と新しいSeg2Trackモジュールを統合するフレームワークである。
Seg2Track-SAM2は最先端(SOTA)のパフォーマンスを達成し、KITTI MOTSでは車と歩行者の両方で総合4位にランクインした。
結果、Seg2Track-SAM2は、堅牢なゼロショットトラッキング、強化されたアイデンティティ保存、効率的なメモリ利用を組み合わせることで、MOTSの進歩を確認した。
論文 参考訳(メタデータ) (2025-09-15T10:52:27Z) - SAMITE: Position Prompted SAM2 with Calibrated Memory for Visual Object Tracking [58.35852822355312]
Visual Object Tracking (VOT)は、ビデオ内のターゲットを継続的に追跡する自律運転のようなアプリケーションで広く使われている。
これらの問題に対処するために、ビデオ基盤モデルSAM2をVOTに適用し、各フレームの追跡結果をメモリとして符号化し、残りのフレームを自己回帰的に条件付けする手法を提案する。
これらの課題に対処するために,SAM2 上にモジュールを追加して構築した SAMITE モデルを提案する。
論文 参考訳(メタデータ) (2025-07-29T12:11:56Z) - SAM2MOT: A Novel Paradigm of Multi-Object Tracking by Segmentation [11.1906749425206]
Segment Anything 2 (SAM2)は、セグメンテーションを使った堅牢な単一オブジェクト追跡を可能にする。
本稿では,多目的追跡のための新しいトラッキング・バイ・パラダイムであるSAM2MOTを提案する。
SAM2MOTはセグメンテーションマスクから直接トラッキングボックスを生成し、検出精度への依存を減らす。
論文 参考訳(メタデータ) (2025-04-06T15:32:08Z) - Bridge the Points: Graph-based Few-shot Segment Anything Semantically [79.1519244940518]
プレトレーニング技術の最近の進歩により、視覚基礎モデルの能力が向上した。
最近の研究はSAMをFew-shot Semantic segmentation (FSS)に拡張している。
本稿では,グラフ解析に基づく簡易かつ効果的な手法を提案する。
論文 参考訳(メタデータ) (2024-10-09T15:02:28Z) - Dense Scene Multiple Object Tracking with Box-Plane Matching [73.54369833671772]
マルチオブジェクトトラッキング(MOT)はコンピュータビジョンにおいて重要なタスクである。
密集したシーンにおけるMOT性能を改善するために,Box-Plane Matching (BPM)法を提案する。
3つのモジュールの有効性により、ACM MM Grand Challenge HiEve 2020において、私たちのチームはトラック1のリーダーボードで1位を獲得しました。
論文 参考訳(メタデータ) (2020-07-30T16:39:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。