論文の概要: EdgeDAM: Real-time Object Tracking for Mobile Devices
- arxiv url: http://arxiv.org/abs/2603.05463v1
- Date: Thu, 05 Mar 2026 18:35:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-06 22:06:11.370775
- Title: EdgeDAM: Real-time Object Tracking for Mobile Devices
- Title(参考訳): EdgeDAM: モバイルデバイスのリアルタイムオブジェクトトラッキング
- Authors: Syed Muhammad Raza, Syed Murtaza Hussain Abidi, Khawar Islam, Muhammad Ibrahim, Ajmal Saeed Mian,
- Abstract要約: エッジデバイス上での単一オブジェクト追跡は、コンピュータビジョンの重要なタスクである。
近年, セグメンテーションをベースとしたトラッカーに注目が集まっている。
We propose EdgeDAM, a detection-guided tracking framework that improveed distractor-aware memory for bounding-box tracking。
- 参考スコア(独自算出の注目度): 6.26511531314926
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Single-object tracking (SOT) on edge devices is a critical computer vision task, requiring accurate and continuous target localization across video frames under occlusion, distractor interference, and fast motion. However, recent state-of-the-art distractor-aware memory mechanisms are largely built on segmentation-based trackers and rely on mask prediction and attention-driven memory updates, which introduce substantial computational overhead and limit real-time deployment on resource-constrained hardware; meanwhile, lightweight trackers sustain high throughput but are prone to drift when visually similar distractors appear. To address these challenges, we propose EdgeDAM, a lightweight detection-guided tracking framework that reformulates distractor-aware memory for bounding-box tracking under strict edge constraints. EdgeDAM introduces two key strategies: (1) Dual-Buffer Distractor-Aware Memory (DAM), which integrates a Recent-Aware Memory to preserve temporally consistent target hypotheses and a Distractor-Resolving Memory to explicitly store hard negative candidates and penalize their re-selection during recovery; and (2) Confidence-Driven Switching with Held-Box Stabilization, where tracker reliability and temporal consistency criteria adaptively activate detection and memory-guided re-identification during occlusion, while a held-box mechanism temporarily freezes and expands the estimate to suppress distractor contamination. Extensive experiments on five benchmarks, including the distractor-focused DiDi dataset, demonstrate improved robustness under occlusion and fast motion while maintaining real-time performance on mobile devices, achieving 88.2% accuracy on DiDi and 25 FPS on an iPhone 15. Code will be released.
- Abstract(参考訳): エッジデバイス上でのシングルオブジェクト追跡(SOT)は重要なコンピュータビジョンタスクであり、閉塞、干渉、高速動作下での映像フレーム間の正確な、連続的なターゲット位置決めを必要とする。
しかし、最近の最先端のイントラクタ対応メモリメカニズムは、主にセグメンテーションベースのトラッカー上に構築されており、マスク予測とアテンション駆動メモリの更新に依存している。
これらの課題に対処するために,厳密なエッジ制約下でのバウンディングボックストラッキングのためのトラヒックタ認識メモリを再構成する,ライトウェイトな検出誘導トラッキングフレームワークであるEdgeDAMを提案する。
EdgeDAMは,1) 時間的に一貫したターゲット仮説を保存するためのDAM(Dual-Buffer Distractor-Aware Memory)と,(2) ハードネガティブな候補を明示的に保存し,リカバリ時に再選択をペナルティ化するDistractor-Resolving Memory,2) トラッカーの信頼性と時間的整合性の基準を適応的に活性化するHld-Box安定化による信頼駆動スイッチ,の2つの主要な戦略を導入する。
イントラクタ中心のDiDiデータセットを含む5つのベンチマークに関する大規模な実験は、モバイルデバイスでのリアルタイムパフォーマンスを維持しながら、閉塞下での堅牢性と高速な動作を改善し、iPhone 15でのDiDiの88.2%の精度と25 FPSを達成した。
コードはリリースされる。
関連論文リスト
- Detector-in-the-Loop Tracking: Active Memory Rectification for Stable Glottic Opening Localization [25.593059138669844]
本稿では,信頼性に整合した状態決定とアクティブメモリの整合性により,Segment Anything Model 2(SAM2)を監督する検出・イン・ザ・ループフレームワークを提案する。
緊急挿管ビデオでは、CL-MCは最先端のパフォーマンスを達成し、ドリフトと欠落率を大幅に低減する。
論文 参考訳(メタデータ) (2026-02-22T23:29:28Z) - Video Object Recognition in Mobile Edge Networks: Local Tracking or Edge Detection? [57.000348519630286]
モバイルエッジコンピューティングの最近の進歩により、高精度ニューラルネットワークを備えたエッジサーバに集約的なオブジェクト検出をオフロードすることが可能になった。
このハイブリッドアプローチは有望なソリューションを提供するが、新たな課題として、エッジ検出とローカルトラッキングのタイミングを決定する。
局所的なトラッキングとエッジ検出を適応的に選択する深層強化学習に基づくアルゴリズムである単一デバイス環境での LTED-Ada を提案する。
論文 参考訳(メタデータ) (2025-11-25T04:54:51Z) - Self-Supervised Moving Object Segmentation of Sparse and Noisy Radar Point Clouds [17.737940705639573]
オブジェクトのセグメンテーションは、自動運転車のような安全で信頼性の高い自律型モバイルシステムにとって重要なタスクだ。
レーダーポイントクラウドは、しばしばスパースでノイズが多く、教師あり学習に使用するデータアノテーションを作成する。
本稿では,レーダデータの動作認識表現を生成するためにネットワークを事前訓練するために,動的点除去に基づくクラスタリファインメントを用いたクラスタリングに基づく新しいコントラスト損失関数を提案する。
論文 参考訳(メタデータ) (2025-11-04T09:21:45Z) - Distractor-Aware Memory-Based Visual Object Tracking [17.945503249662675]
本稿では,SAM2のイントロスペクションに基づくメモリモジュールとイントロスペクション・ベースの管理手法を提案する。
本設計は, 物体閉塞後のトラクションドリフトを効果的に低減し, 再検出能力を向上させる。
13のベンチマークで、DAM4SAMはSAM2.1より優れており、10に新しい最先端結果が設定されている。
論文 参考訳(メタデータ) (2025-09-17T09:54:27Z) - SAMITE: Position Prompted SAM2 with Calibrated Memory for Visual Object Tracking [58.35852822355312]
Visual Object Tracking (VOT)は、ビデオ内のターゲットを継続的に追跡する自律運転のようなアプリケーションで広く使われている。
これらの問題に対処するために、ビデオ基盤モデルSAM2をVOTに適用し、各フレームの追跡結果をメモリとして符号化し、残りのフレームを自己回帰的に条件付けする手法を提案する。
これらの課題に対処するために,SAM2 上にモジュールを追加して構築した SAMITE モデルを提案する。
論文 参考訳(メタデータ) (2025-07-29T12:11:56Z) - Online Dense Point Tracking with Streaming Memory [54.22820729477756]
デンスポイントトラッキングは、ビデオのかなりの部分を通して、初期フレーム内のすべてのポイントの連続的な追跡を必要とする、困難なタスクである。
最近の点追跡アルゴリズムは、通常、最初のフレームから現在のフレームへの間接的な情報伝達のためにスライドウィンドウに依存する。
我々は、高密度のtextbfPOint textbfTracking とオンラインビデオ処理のための textbfStreaming メモリを備えた軽量で高速なモデルを提案する。
論文 参考訳(メタデータ) (2025-03-09T06:16:49Z) - MATE: Motion-Augmented Temporal Consistency for Event-based Point Tracking [58.719310295870024]
本稿では,任意の点を追跡するイベントベースのフレームワークを提案する。
事象の間隔に起因する曖昧さを解決するため、運動誘導モジュールは運動ベクトルを局所的なマッチングプロセスに組み込む。
このメソッドは、任意のポイントベースラインのイベントのみのトラッキングに対して、$Survival_50$メトリックを17.9%改善する。
論文 参考訳(メタデータ) (2024-12-02T09:13:29Z) - TF-SASM: Training-free Spatial-aware Sparse Memory for Multi-object Tracking [6.91631684487121]
コンピュータビジョンにおけるマルチオブジェクト追跡(MOT)は依然として重要な課題であり、ビデオシーケンス内の複数のオブジェクトの正確な位置決めと連続的な追跡が必要である。
本稿では,オブジェクトの動きと重なり合う認識に基づいて,重要な特徴を選択的に記憶するメモリベースの新しいアプローチを提案する。
提案手法はDanceTrackテストセットのMOTRv2よりも有意に改善し,AsAスコアが2.0%,IFF1スコアが2.1%向上した。
論文 参考訳(メタデータ) (2024-07-05T07:55:19Z) - RTracker: Recoverable Tracking via PN Tree Structured Memory [71.05904715104411]
本稿では,木構造メモリを用いてトラッカーと検出器を動的に関連付け,自己回復を可能にするRTrackerを提案する。
具体的には,正負と負のターゲットサンプルを時系列に保存し,維持する正負のツリー構造メモリを提案する。
我々の中核となる考え方は、正と負の目標カテゴリーの支持サンプルを用いて、目標損失の信頼性評価のための相対的距離に基づく基準を確立することである。
論文 参考訳(メタデータ) (2024-03-28T08:54:40Z) - Spatio-Temporal Bi-directional Cross-frame Memory for Distractor Filtering Point Cloud Single Object Tracking [2.487142846438629]
LIDARポイント内の1つのオブジェクトトラッキングは、コンピュータビジョンにおける重要なタスクである。
既存の手法は、ネットワーク経由の外観マッチングのみに依存するか、連続したフレームからの情報を利用するが、重大な課題に遭遇する。
我々は、これらの課題を緩和するために、STMD-Trackerという、革新的なクロスフレームバイテンポラルモーショントラッカーを設計する。
論文 参考訳(メタデータ) (2024-03-23T13:15:44Z) - SpikeMOT: Event-based Multi-Object Tracking with Sparse Motion Features [52.213656737672935]
SpikeMOTはイベントベースのマルチオブジェクトトラッカーである。
SpikeMOTはスパイクニューラルネットワークを使用して、オブジェクトに関連するイベントストリームからスパーステンポラルな特徴を抽出する。
論文 参考訳(メタデータ) (2023-09-29T05:13:43Z) - Implicit Motion Handling for Video Camouflaged Object Detection [60.98467179649398]
本稿では,新しいビデオカモフラージュオブジェクト検出(VCOD)フレームワークを提案する。
短期的および長期的整合性を利用して、ビデオフレームからカモフラージュされたオブジェクトを検出する。
論文 参考訳(メタデータ) (2022-03-14T17:55:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。