論文の概要: DR.VIC: Decomposition and Reasoning for Video Individual Counting
- arxiv url: http://arxiv.org/abs/2203.12335v1
- Date: Wed, 23 Mar 2022 11:24:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-24 23:17:39.820662
- Title: DR.VIC: Decomposition and Reasoning for Video Individual Counting
- Title(参考訳): DR.VIC:ビデオ個別カウントのための分解と推論
- Authors: Tao Han, Lei Bai, Junyu Gao, Qi Wang, Wanli Ouyang
- Abstract要約: 我々は、新しい視点から歩行者計数を行う、ビデオ個別計数(VIC)を提案する。
本研究は,MOT(Multiple Object Tracking)技術に頼らず,全歩行者を第1フレームに存在する初期歩行者と第2フレームに別個の身元を持つ新歩行者に分解することで,その問題を解決することを提案する。
終端分解・推論ネットワーク (DRNet) は, 初期歩行者数を密度推定法で予測し, 新歩行者数を最適な移動量で推定するように設計されている。
- 参考スコア(独自算出の注目度): 93.12166351940242
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Pedestrian counting is a fundamental tool for understanding pedestrian
patterns and crowd flow analysis. Existing works (e.g., image-level pedestrian
counting, crossline crowd counting et al.) either only focus on the image-level
counting or are constrained to the manual annotation of lines. In this work, we
propose to conduct the pedestrian counting from a new perspective - Video
Individual Counting (VIC), which counts the total number of individual
pedestrians in the given video (a person is only counted once). Instead of
relying on the Multiple Object Tracking (MOT) techniques, we propose to solve
the problem by decomposing all pedestrians into the initial pedestrians who
existed in the first frame and the new pedestrians with separate identities in
each following frame. Then, an end-to-end Decomposition and Reasoning Network
(DRNet) is designed to predict the initial pedestrian count with the density
estimation method and reason the new pedestrian's count of each frame with the
differentiable optimal transport. Extensive experiments are conducted on two
datasets with congested pedestrians and diverse scenes, demonstrating the
effectiveness of our method over baselines with great superiority in counting
the individual pedestrians. Code: https://github.com/taohan10200/DRNet.
- Abstract(参考訳): 歩行者計数は歩行者パターンと群集の流れ解析を理解するための基本的なツールである。
既存の作品(例えば、イメージレベルの歩行者計数、クロスラインの群衆計数など)は、画像レベルの計数のみに焦点を当てるか、行のマニュアルアノテーションに拘束される。
そこで本研究では,与えられた映像中の個々の歩行者の総数をカウントするビデオ個人計数(vic)という,新たな視点から歩行者計数を行うことを提案する。
本研究は,MOT(Multiple Object Tracking)技術に頼らず,全歩行者を第1フレームに存在する初期歩行者と第2フレームに別個の身元を持つ新歩行者に分解することで,その問題を解決することを提案する。
そこで,DRNet(End-to-end Decomposition and Reasoning Network)は,初期歩行者数を密度推定法で予測し,各フレームの新規歩行者数を最適な移動量で推定する。
混雑歩行者と多彩なシーンの2つのデータセットについて広範な実験を行い,個々の歩行者を数えるのに優れたベースラインに対して,提案手法の有効性を実証した。
コード: https://github.com/taohan10200/drnet。
関連論文リスト
- Multiview Detection with Cardboard Human Modeling [23.072791405965415]
本研究では,人点雲モデリングに基づく新しい歩行者表現方式を提案する。
具体的には、人体深度推定のためのレイトレーシングを用いて、歩行者を地上の直立した薄い段ボールの点雲としてモデル化する。
論文 参考訳(メタデータ) (2022-07-05T12:47:26Z) - STCrowd: A Multimodal Dataset for Pedestrian Perception in Crowded
Scenes [78.95447086305381]
3D空間における歩行者の正確な検出と追跡は、回転、ポーズ、スケールの大きなバリエーションのために困難である。
既存のベンチマークは2Dアノテーションのみを提供するか、あるいは低密度の歩行者分布を持つ限定的な3Dアノテーションを持つ。
混み合ったシナリオにおける歩行者認識アルゴリズムをよりよく評価するために,大規模なマルチモーダルデータセットSTCrowdを導入する。
論文 参考訳(メタデータ) (2022-04-03T08:26:07Z) - Pedestrian Stop and Go Forecasting with Hybrid Feature Fusion [87.77727495366702]
歩行者の立ち止まりと予測の新たな課題を紹介します。
都市交通における歩行者の立ち寄り行動を明示的に研究するためのベンチマークであるTransをリリースする。
歩行者の歩行動作に注釈を付けたいくつかの既存のデータセットから構築し、さまざまなシナリオや行動を実現する。
論文 参考訳(メタデータ) (2022-03-04T18:39:31Z) - Pedestrian Intention Prediction: A Multi-task Perspective [83.7135926821794]
グローバルに展開するためには、自動運転車は歩行者の安全を保証する必要がある。
本研究は歩行者の意図と視覚状態を共同で予測することでこの問題を解決しようとするものである。
この方法はマルチタスク学習アプローチにおけるリカレントニューラルネットワークである。
論文 参考訳(メタデータ) (2020-10-20T13:42:31Z) - Completely Self-Supervised Crowd Counting via Distribution Matching [92.09218454377395]
我々は,密集した群集数に対するトレーニングモデルに対する完全な自己超越的アプローチを提案する。
トレーニングに必要な入力は、大量の未ラベルの群衆画像以外は、群衆数に近似した上限である。
提案手法は,自然群集が逆伝播の誤り信号を生成するために利用可能な電力法分布に従うという考え方に富む。
論文 参考訳(メタデータ) (2020-09-14T13:20:12Z) - Do Not Disturb Me: Person Re-identification Under the Interference of
Other Pedestrians [97.45805377769354]
本稿では,Pedestrian-Interference Suppression Network (PISNet)と呼ばれる新しいディープネットワークを提案する。
PISNetはクエリガイド付アテンションブロック(QGAB)を活用して、クエリのガイダンスの下でギャラリー内のターゲットの機能を強化する。
その結果,提案手法は既存のRe-ID手法に対して良好に動作することがわかった。
論文 参考訳(メタデータ) (2020-08-16T17:45:14Z) - The Pedestrian Patterns Dataset [11.193504036335503]
データセットは、異なる特定のタイムスロットから1週間、同じ3つのルートを繰り返すことで収集された。
データセットの目的は、横断するルートに沿って異なる時間に、社会的および歩行者の行動パターンをキャプチャすることである。
論文 参考訳(メタデータ) (2020-01-06T23:58:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。