論文の概要: DynamicTrack: Advancing Gigapixel Tracking in Crowded Scenes
- arxiv url: http://arxiv.org/abs/2407.18637v1
- Date: Fri, 26 Jul 2024 10:08:01 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-29 13:50:27.540378
- Title: DynamicTrack: Advancing Gigapixel Tracking in Crowded Scenes
- Title(参考訳): DynamicTrack: 群衆シーンにおけるギガピクセル追跡の強化
- Authors: Yunqi Zhao, Yuchen Guo, Zheng Cao, Kai Ni, Ruqi Huang, Lu Fang,
- Abstract要約: 混雑したシーンにおけるギガピクセル追跡問題に対処するために設計された動的トラッキングフレームワークであるDynamicTrackを紹介する。
特に,コントラスト学習を利用して歩行者の頭部と身体を共同で検出する動的検出器を提案する。
- 参考スコア(独自算出の注目度): 29.98165509387273
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tracking in gigapixel scenarios holds numerous potential applications in video surveillance and pedestrian analysis. Existing algorithms attempt to perform tracking in crowded scenes by utilizing multiple cameras or group relationships. However, their performance significantly degrades when confronted with complex interaction and occlusion inherent in gigapixel images. In this paper, we introduce DynamicTrack, a dynamic tracking framework designed to address gigapixel tracking challenges in crowded scenes. In particular, we propose a dynamic detector that utilizes contrastive learning to jointly detect the head and body of pedestrians. Building upon this, we design a dynamic association algorithm that effectively utilizes head and body information for matching purposes. Extensive experiments show that our tracker achieves state-of-the-art performance on widely used tracking benchmarks specifically designed for gigapixel crowded scenes.
- Abstract(参考訳): ギガピクセルのシナリオの追跡は、ビデオ監視と歩行者分析に多くの潜在的な応用をもたらす。
既存のアルゴリズムは、複数のカメラやグループ関係を利用して、混雑したシーンでトラッキングを実行しようとする。
しかし、その性能は、複雑な相互作用や、ギガピクセル画像に固有の閉塞に直面すると著しく低下する。
本稿では,混雑したシーンにおけるギガピクセル追跡問題に対処するために設計された動的トラッキングフレームワークであるDynamicTrackを紹介する。
特に,コントラスト学習を利用して歩行者の頭部と身体を共同で検出する動的検出器を提案する。
そこで我々は,頭部と身体の情報をマッチング目的に効果的に活用する動的アソシエーションアルゴリズムを設計した。
広汎な実験により,我々のトラッカーは,ギガピクセル混在シーンに特化して設計された広範に使用されているトラッキングベンチマークにおいて,最先端のパフォーマンスを達成することができた。
関連論文リスト
- Analysis of Unstructured High-Density Crowded Scenes for Crowd Monitoring [55.2480439325792]
我々は,人群集の組織的動きを検出する自動システムの開発に興味がある。
コンピュータビジョンアルゴリズムは、混雑したシーンのビデオから情報を抽出することができる。
組織化されたコホート内の参加者数を見積もることができます。
論文 参考訳(メタデータ) (2024-08-06T22:09:50Z) - DenseTrack: Drone-based Crowd Tracking via Density-aware Motion-appearance Synergy [33.57923199717605]
ドローンによる群集追跡は、空中からの物体の正確な識別と監視に困難に直面している。
これらの課題に対処するために、密度認識追跡(DenseTrack)フレームワークを提案する。
DenseTrackは、群衆のカウントに乗じて、オブジェクトの位置を正確に決定し、視覚とモーションのキューを混ぜて、小規模オブジェクトの追跡を改善する。
論文 参考訳(メタデータ) (2024-07-24T13:39:07Z) - Motion Segmentation for Neuromorphic Aerial Surveillance [42.04157319642197]
イベントカメラは優れた時間分解能、優れたダイナミックレンジ、最小限の電力要件を提供する。
固定間隔で冗長な情報をキャプチャする従来のフレームベースのセンサーとは異なり、イベントカメラは画素レベルの明るさ変化を非同期に記録する。
本稿では,イベントデータと光フロー情報の両方に自己監督型視覚変換器を利用する動き分割手法を提案する。
論文 参考訳(メタデータ) (2024-05-24T04:36:13Z) - EchoTrack: Auditory Referring Multi-Object Tracking for Autonomous Driving [64.58258341591929]
聴覚参照マルチオブジェクトトラッキング(AR-MOT)は、自律運転において難しい問題である。
私たちは、デュアルストリーム・ビジョン・トランスフォーマーを備えたエンドツーエンドのAR-MOTフレームワークであるEchoTrackを提案しました。
大規模AR-MOTベンチマークの最初のセットを確立する。
論文 参考訳(メタデータ) (2024-02-28T12:50:16Z) - Distractor-aware Event-based Tracking [45.07711356111249]
本稿では,シームズネットワークアーキテクチャ(DANet)にトランスフォーマーモジュールを導入するイベントベースのトラッカーを提案する。
本モデルは主にモーション認識ネットワークとターゲット認識ネットワークで構成され,イベントデータから動作キューとオブジェクトの輪郭の両方を同時に活用する。
私たちのDANetは、後処理なしでエンドツーエンドでトレーニングでき、単一のV100上で80FPS以上で実行できます。
論文 参考訳(メタデータ) (2023-10-22T05:50:20Z) - Graph-Based Multi-Camera Soccer Player Tracker [1.6244541005112743]
本稿では,サッカー場周辺に設置した複数のキャリブレーションカメラから,長撮影映像記録におけるサッカー選手の追跡を目的としたマルチカメラ追跡手法を提案する。
カメラとの距離が大きいため、個々のプレイヤーを視覚的に区別することは困難であり、従来のソリューションの性能に悪影響を及ぼす。
本手法は,各プレイヤーのダイナミクスと周辺プレイヤー間の相互作用に着目し,トラッキング性能の向上を図る。
論文 参考訳(メタデータ) (2022-11-03T20:01:48Z) - ParticleSfM: Exploiting Dense Point Trajectories for Localizing Moving
Cameras in the Wild [57.37891682117178]
本稿では,一対の光流からの高密度対応に基づく動画の高密度間接構造抽出手法を提案する。
不規則点軌道データを処理するために,新しいニューラルネットワークアーキテクチャを提案する。
MPIシンテルデータセットを用いた実験により,我々のシステムはより正確なカメラ軌道を生成することがわかった。
論文 参考訳(メタデータ) (2022-07-19T09:19:45Z) - Scalable and Real-time Multi-Camera Vehicle Detection,
Re-Identification, and Tracking [58.95210121654722]
理想化されたビデオストリームやキュレートされたビデオストリームの代わりに,リアルタイムで低解像度のCCTVを処理する,リアルタイムな都市規模のマルチカメラ車両追跡システムを提案する。
私たちの手法は、公共のリーダーボードで上位5人のパフォーマーにランク付けされています。
論文 参考訳(メタデータ) (2022-04-15T12:47:01Z) - Indoor Navigation Assistance for Visually Impaired People via Dynamic
SLAM and Panoptic Segmentation with an RGB-D Sensor [25.36354262588248]
シーンの動的情報を検出するために,RGB-Dセンサを用いた支援システムを提案する。
画像から抽出されたスパース特徴点により、ユーザのポーズを推定することができる。
追跡された動的オブジェクトのポーズと速度を推定することができる。
論文 参考訳(メタデータ) (2022-04-03T20:19:15Z) - Self-supervised Human Detection and Segmentation via Multi-view
Consensus [116.92405645348185]
本稿では,トレーニング中に幾何学的制約を多視点一貫性という形で組み込むマルチカメラフレームワークを提案する。
本手法は,標準ベンチマークから視覚的に外れた画像に対して,最先端の自己監視的人物検出とセグメンテーション技術に勝ることを示す。
論文 参考訳(メタデータ) (2020-12-09T15:47:21Z) - Tracking-by-Counting: Using Network Flows on Crowd Density Maps for
Tracking Multiple Targets [96.98888948518815]
State-of-the-art multi-object tracking(MOT)法は、トラッキング・バイ・検出のパラダイムに従っている。
混み合ったシーンに適したMOTパラダイムであるトラッキング・バイ・カウントを提案する。
論文 参考訳(メタデータ) (2020-07-18T19:51:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。