Fugu-MT 論文翻訳(概要): DynamicTrack: Advancing Gigapixel Tracking in Crowded Scenes

論文の概要: DynamicTrack: Advancing Gigapixel Tracking in Crowded Scenes

arxiv url: http://arxiv.org/abs/2407.18637v1
Date: Fri, 26 Jul 2024 10:08:01 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-29 13:50:27.540378
Title: DynamicTrack: Advancing Gigapixel Tracking in Crowded Scenes
Title（参考訳）: DynamicTrack: 群衆シーンにおけるギガピクセル追跡の強化
Authors: Yunqi Zhao, Yuchen Guo, Zheng Cao, Kai Ni, Ruqi Huang, Lu Fang,
Abstract要約: 混雑したシーンにおけるギガピクセル追跡問題に対処するために設計された動的トラッキングフレームワークであるDynamicTrackを紹介する。特に,コントラスト学習を利用して歩行者の頭部と身体を共同で検出する動的検出器を提案する。
参考スコア（独自算出の注目度）: 29.98165509387273
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Tracking in gigapixel scenarios holds numerous potential applications in video surveillance and pedestrian analysis. Existing algorithms attempt to perform tracking in crowded scenes by utilizing multiple cameras or group relationships. However, their performance significantly degrades when confronted with complex interaction and occlusion inherent in gigapixel images. In this paper, we introduce DynamicTrack, a dynamic tracking framework designed to address gigapixel tracking challenges in crowded scenes. In particular, we propose a dynamic detector that utilizes contrastive learning to jointly detect the head and body of pedestrians. Building upon this, we design a dynamic association algorithm that effectively utilizes head and body information for matching purposes. Extensive experiments show that our tracker achieves state-of-the-art performance on widely used tracking benchmarks specifically designed for gigapixel crowded scenes.
Abstract（参考訳）: ギガピクセルのシナリオの追跡は、ビデオ監視と歩行者分析に多くの潜在的な応用をもたらす。既存のアルゴリズムは、複数のカメラやグループ関係を利用して、混雑したシーンでトラッキングを実行しようとする。しかし、その性能は、複雑な相互作用や、ギガピクセル画像に固有の閉塞に直面すると著しく低下する。本稿では,混雑したシーンにおけるギガピクセル追跡問題に対処するために設計された動的トラッキングフレームワークであるDynamicTrackを紹介する。特に,コントラスト学習を利用して歩行者の頭部と身体を共同で検出する動的検出器を提案する。そこで我々は,頭部と身体の情報をマッチング目的に効果的に活用する動的アソシエーションアルゴリズムを設計した。広汎な実験により,我々のトラッカーは,ギガピクセル混在シーンに特化して設計された広範に使用されているトラッキングベンチマークにおいて,最先端のパフォーマンスを達成することができた。

関連論文リスト

MegaSaM: Accurate, Fast, and Robust Structure and Motion from Casual Dynamic Videos [104.1338295060383]
本研究では,ダイナミックシーンのカジュアルモノクラー映像から,カメラパラメータと奥行きマップの精度,高速,堅牢な推定を可能にするシステムを提案する。本システムは,先行作業や同時作業と比較して,カメラポーズや深度推定において有意に精度が高く,頑健である。
論文参考訳（メタデータ） (2024-12-05T18:59:42Z)
DATAP-SfM: Dynamic-Aware Tracking Any Point for Robust Structure from Motion in the Wild [85.03973683867797]
本稿では,スムーズなカメラ軌跡を推定し,野生のカジュアルビデオのための高密度点雲を得るための,簡潔でエレガントでロバストなパイプラインを提案する。提案手法は,複雑な動的課題シーンにおいても,カメラポーズ推定による最先端性能を実現する。
論文参考訳（メタデータ） (2024-11-20T13:01:16Z)
DenseTrack: Drone-based Crowd Tracking via Density-aware Motion-appearance Synergy [33.57923199717605]
ドローンによる群集追跡は、空中からの物体の正確な識別と監視に困難に直面している。これらの課題に対処するために、密度認識追跡(DenseTrack)フレームワークを提案する。 DenseTrackは、群衆のカウントに乗じて、オブジェクトの位置を正確に決定し、視覚とモーションのキューを混ぜて、小規模オブジェクトの追跡を改善する。
論文参考訳（メタデータ） (2024-07-24T13:39:07Z)
EchoTrack: Auditory Referring Multi-Object Tracking for Autonomous Driving [64.58258341591929]
聴覚参照マルチオブジェクトトラッキング(AR-MOT)は、自律運転において難しい問題である。私たちは、デュアルストリーム・ビジョン・トランスフォーマーを備えたエンドツーエンドのAR-MOTフレームワークであるEchoTrackを提案しました。大規模AR-MOTベンチマークの最初のセットを確立する。
論文参考訳（メタデータ） (2024-02-28T12:50:16Z)
Distractor-aware Event-based Tracking [45.07711356111249]
本稿では,シームズネットワークアーキテクチャ(DANet)にトランスフォーマーモジュールを導入するイベントベースのトラッカーを提案する。本モデルは主にモーション認識ネットワークとターゲット認識ネットワークで構成され,イベントデータから動作キューとオブジェクトの輪郭の両方を同時に活用する。私たちのDANetは、後処理なしでエンドツーエンドでトレーニングでき、単一のV100上で80FPS以上で実行できます。
論文参考訳（メタデータ） (2023-10-22T05:50:20Z)
Graph-Based Multi-Camera Soccer Player Tracker [1.6244541005112743]
本稿では,サッカー場周辺に設置した複数のキャリブレーションカメラから,長撮影映像記録におけるサッカー選手の追跡を目的としたマルチカメラ追跡手法を提案する。カメラとの距離が大きいため、個々のプレイヤーを視覚的に区別することは困難であり、従来のソリューションの性能に悪影響を及ぼす。本手法は,各プレイヤーのダイナミクスと周辺プレイヤー間の相互作用に着目し,トラッキング性能の向上を図る。
論文参考訳（メタデータ） (2022-11-03T20:01:48Z)
ParticleSfM: Exploiting Dense Point Trajectories for Localizing Moving Cameras in the Wild [57.37891682117178]
本稿では,一対の光流からの高密度対応に基づく動画の高密度間接構造抽出手法を提案する。不規則点軌道データを処理するために,新しいニューラルネットワークアーキテクチャを提案する。 MPIシンテルデータセットを用いた実験により,我々のシステムはより正確なカメラ軌道を生成することがわかった。
論文参考訳（メタデータ） (2022-07-19T09:19:45Z)
Scalable and Real-time Multi-Camera Vehicle Detection, Re-Identification, and Tracking [58.95210121654722]
理想化されたビデオストリームやキュレートされたビデオストリームの代わりに,リアルタイムで低解像度のCCTVを処理する,リアルタイムな都市規模のマルチカメラ車両追跡システムを提案する。私たちの手法は、公共のリーダーボードで上位5人のパフォーマーにランク付けされています。
論文参考訳（メタデータ） (2022-04-15T12:47:01Z)
Indoor Navigation Assistance for Visually Impaired People via Dynamic SLAM and Panoptic Segmentation with an RGB-D Sensor [25.36354262588248]
シーンの動的情報を検出するために,RGB-Dセンサを用いた支援システムを提案する。画像から抽出されたスパース特徴点により、ユーザのポーズを推定することができる。追跡された動的オブジェクトのポーズと速度を推定することができる。
論文参考訳（メタデータ） (2022-04-03T20:19:15Z)
Self-supervised Human Detection and Segmentation via Multi-view Consensus [116.92405645348185]
本稿では,トレーニング中に幾何学的制約を多視点一貫性という形で組み込むマルチカメラフレームワークを提案する。本手法は,標準ベンチマークから視覚的に外れた画像に対して,最先端の自己監視的人物検出とセグメンテーション技術に勝ることを示す。
論文参考訳（メタデータ） (2020-12-09T15:47:21Z)
Tracking-by-Counting: Using Network Flows on Crowd Density Maps for Tracking Multiple Targets [96.98888948518815]
State-of-the-art multi-object tracking(MOT)法は、トラッキング・バイ・検出のパラダイムに従っている。混み合ったシーンに適したMOTパラダイムであるトラッキング・バイ・カウントを提案する。
論文参考訳（メタデータ） (2020-07-18T19:51:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。