論文の概要: Video Individual Counting and Tracking from Moving Drones: A Benchmark and Methods
- arxiv url: http://arxiv.org/abs/2601.12500v1
- Date: Sun, 18 Jan 2026 17:17:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:22.65385
- Title: Video Individual Counting and Tracking from Moving Drones: A Benchmark and Methods
- Title(参考訳): 移動中のドローンのビデオのカウントと追跡:ベンチマークと方法
- Authors: Yaowu Fan, Jia Wan, Tao Han, Andy J. Ma, Antoni B. Chan,
- Abstract要約: moveDroneCrowd++は、移動中のドローンが捉えた、密集した群衆のカウントと追跡のための、最大のビデオレベルのデータセットである。
また,GD3Aを提案する。GD3Aは,特定位置化を回避する密度マップに基づくビデオ個人カウント手法である。
実験結果から,本手法は群集や複雑な運動下での既存手法よりも有意に優れていた。
- 参考スコア(独自算出の注目度): 51.91154554622608
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Counting and tracking dense crowds in large-scale scenes is highly challenging, yet existing methods mainly rely on datasets captured by fixed cameras, which provide limited spatial coverage and are inadequate for large-scale dense crowd analysis. To address this limitation, we propose a flexible solution using moving drones to capture videos and perform video-level crowd counting and tracking of unique pedestrians across entire scenes. We introduce MovingDroneCrowd++, the largest video-level dataset for dense crowd counting and tracking captured by moving drones, covering diverse and complex conditions with varying flight altitudes, camera angles, and illumination. Existing methods fail to achieve satisfactory performance on this dataset. To this end, we propose GD3A (Global Density Map Decomposition via Descriptor Association), a density map-based video individual counting method that avoids explicit localization. GD3A establishes pixel-level correspondences between pedestrian descriptors across consecutive frames via optimal transport with an adaptive dustbin score, enabling the decomposition of global density maps into shared, inflow, and outflow components. Building on this framework, we further introduce DVTrack, which converts descriptor-level matching into instance-level associations through a descriptor voting mechanism for pedestrian tracking. Experimental results show that our methods significantly outperform existing approaches under dense crowds and complex motion, reducing counting error by 47.4 percent and improving tracking performance by 39.2 percent.
- Abstract(参考訳): 大規模なシーンにおける密集群集のカウントと追跡は極めて困難であるが、既存の手法は主に固定カメラが捉えたデータセットに依存しており、空間的範囲は限られており、大規模な密集群集分析には不十分である。
この制限に対処するために,移動ドローンを用いたフレキシブルな解決策を提案する。
moveDroneCrowd++は、移動中のドローンが捉えた、密集した群衆のカウントと追跡のための最大のビデオレベルのデータセットで、飛行高度、カメラアングル、照明など、多種多様な複雑な状況をカバーする。
既存のメソッドは、このデータセットで十分なパフォーマンスを達成できない。
そこで本研究では,GD3A(Global Density Map Decomposition via Descriptor Association)を提案する。
GD3Aは、アダプティブ・ダストビンスコアによる最適な輸送により、連続するフレーム間の歩行者記述子間のピクセルレベルの対応を確立し、グローバル密度マップを共有、インフロー、アウトフローコンポーネントに分解することを可能にする。
この枠組みに基づいて、歩行者追跡のための記述子投票機構を通じて、記述子レベルのマッチングをインスタンスレベルの関連付けに変換するDVTrackについても紹介する。
実験結果から,本手法は群集群集と複雑運動群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集
関連論文リスト
- Video Individual Counting for Moving Drones [51.429771128144964]
ビデオ・パーソナライズ・カウンティング(VIC)は、インテリジェント・ビデオ監視の重要性から注目を集めている。
以前のデータセットは、比較的まばらな個人で固定または稀に動くカメラでキャプチャされ、混雑したシーンでの高度に異なるビューと時間の評価を制限する。
これらの問題に対処するために、私たちはMovingDroneCrowdデータセットを導入しました。
論文 参考訳(メタデータ) (2025-03-12T07:09:33Z) - DATAP-SfM: Dynamic-Aware Tracking Any Point for Robust Structure from Motion in the Wild [85.03973683867797]
本稿では,スムーズなカメラ軌跡を推定し,野生のカジュアルビデオのための高密度点雲を得るための,簡潔でエレガントでロバストなパイプラインを提案する。
提案手法は,複雑な動的課題シーンにおいても,カメラポーズ推定による最先端性能を実現する。
論文 参考訳(メタデータ) (2024-11-20T13:01:16Z) - DenseTrack: Drone-based Crowd Tracking via Density-aware Motion-appearance Synergy [33.57923199717605]
ドローンによる群集追跡は、空中からの物体の正確な識別と監視に困難に直面している。
これらの課題に対処するために、密度認識追跡(DenseTrack)フレームワークを提案する。
DenseTrackは、群衆のカウントに乗じて、オブジェクトの位置を正確に決定し、視覚とモーションのキューを混ぜて、小規模オブジェクトの追跡を改善する。
論文 参考訳(メタデータ) (2024-07-24T13:39:07Z) - STCrowd: A Multimodal Dataset for Pedestrian Perception in Crowded
Scenes [78.95447086305381]
3D空間における歩行者の正確な検出と追跡は、回転、ポーズ、スケールの大きなバリエーションのために困難である。
既存のベンチマークは2Dアノテーションのみを提供するか、あるいは低密度の歩行者分布を持つ限定的な3Dアノテーションを持つ。
混み合ったシナリオにおける歩行者認識アルゴリズムをよりよく評価するために,大規模なマルチモーダルデータセットSTCrowdを導入する。
論文 参考訳(メタデータ) (2022-04-03T08:26:07Z) - Tracking-by-Counting: Using Network Flows on Crowd Density Maps for
Tracking Multiple Targets [96.98888948518815]
State-of-the-art multi-object tracking(MOT)法は、トラッキング・バイ・検出のパラダイムに従っている。
混み合ったシーンに適したMOTパラダイムであるトラッキング・バイ・カウントを提案する。
論文 参考訳(メタデータ) (2020-07-18T19:51:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。