論文の概要: Cross-View Cross-Scene Multi-View Crowd Counting
- arxiv url: http://arxiv.org/abs/2205.01551v1
- Date: Tue, 3 May 2022 15:03:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-04 14:23:01.145303
- Title: Cross-View Cross-Scene Multi-View Crowd Counting
- Title(参考訳): クロスビュー・クロスシーン・マルチビュー・クラウドカウント
- Authors: Qi Zhang, Wei Lin, Antoni B. Chan
- Abstract要約: 従来,複数カメラを用いて1台のカメラの視野を拡大する手法が提案されてきた。
任意のカメラレイアウトで異なるシーンでトレーニングやテストを行う,クロスビュー・クロスシーン(CVCS)のマルチビュー・クラウドカウント・パラダイムを提案する。
- 参考スコア(独自算出の注目度): 56.83882084112913
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Multi-view crowd counting has been previously proposed to utilize
multi-cameras to extend the field-of-view of a single camera, capturing more
people in the scene, and improve counting performance for occluded people or
those in low resolution. However, the current multi-view paradigm trains and
tests on the same single scene and camera-views, which limits its practical
application. In this paper, we propose a cross-view cross-scene (CVCS)
multi-view crowd counting paradigm, where the training and testing occur on
different scenes with arbitrary camera layouts. To dynamically handle the
challenge of optimal view fusion under scene and camera layout change and
non-correspondence noise due to camera calibration errors or erroneous
features, we propose a CVCS model that attentively selects and fuses multiple
views together using camera layout geometry, and a noise view regularization
method to train the model to handle non-correspondence errors. We also generate
a large synthetic multi-camera crowd counting dataset with a large number of
scenes and camera views to capture many possible variations, which avoids the
difficulty of collecting and annotating such a large real dataset. We then test
our trained CVCS model on real multi-view counting datasets, by using
unsupervised domain transfer. The proposed CVCS model trained on synthetic data
outperforms the same model trained only on real data, and achieves promising
performance compared to fully supervised methods that train and test on the
same single scene.
- Abstract(参考訳): マルチビュー・群衆計数法は,複数カメラを用いて1台のカメラの視野を拡大し,シーン内のより多くの人を捕捉し,隠蔽された人や低解像度の人のカウント性能を向上させることが提案されている。
しかし、現在のマルチビュー・パラダイム・トレインとテストは同じシーンとカメラ・ビューで行われ、実用性は制限されている。
本稿では,任意のカメラレイアウトで異なるシーンでトレーニングやテストを行う,クロスビュー・クロスシーン(CVCS)のマルチビュー・クラウドカウントパラダイムを提案する。
シーン下での最適視界融合とカメラレイアウト変化, カメラキャリブレーション誤差や誤特徴による非対応ノイズの問題を動的に処理するために, カメラレイアウト形状を用いて複数のビューを注意深く選択・融合するCVCSモデルと, 非対応誤差を扱うようにモデルを訓練するノイズビュー正規化手法を提案する。
また,多数のシーンとカメラビューを持つ大規模な合成マルチカメラ群数データセットを生成し,可能なバリエーションをキャプチャすることで,このような大規模なデータセットの収集と注釈付けの困難さを回避した。
次に、教師なしドメイン転送を用いて、実際のマルチビューカウントデータセット上でトレーニングされたCVCSモデルをテストする。
合成データに基づいてトレーニングされたCVCSモデルは、実データのみに基づいてトレーニングされた同じモデルより優れており、同一のシーンでトレーニングおよびテストを行う完全に教師された方法と比較して、有望な性能を達成する。
関連論文リスト
- Learning to Select Camera Views: Efficient Multiview Understanding at
Few Glances [59.34619548026885]
本稿では,対象物やシナリオを所定のビューから分析し,処理に最適なビューを選択するビュー選択手法を提案する。
提案手法は,MVSelectという強化学習に基づくカメラ選択モジュールを備えており,ビューの選択だけでなく,タスクネットワークとの協調トレーニングも容易である。
論文 参考訳(メタデータ) (2023-03-10T18:59:10Z) - ViewNeRF: Unsupervised Viewpoint Estimation Using Category-Level Neural
Radiance Fields [35.89557494372891]
ニューラルラジアンス場に基づく視点推定法であるViewNeRFを導入する。
提案手法は,条件付きNeRFと視点予測器とシーンエンコーダを組み合わせた合成手法を用いて解析を行う。
本モデルでは,合成データセットと実データセットの競合結果を示す。
論文 参考訳(メタデータ) (2022-12-01T11:16:11Z) - Cross-Camera Feature Prediction for Intra-Camera Supervised Person
Re-identification across Distant Scenes [70.30052164401178]
人物再識別(Re-ID)は、重複しないカメラビュー間で人物画像をマッチングすることを目的としている。
ICS-DS Re-IDは、カメラ内IDラベル付きクロスカメラアンペアデータを使用してトレーニングを行う。
カメラ横断型自己監視情報マイニングのためのクロスカメラ特徴予測法
グローバルレベルの特徴とローカルレベルの特徴の合同学習は、グローバルなローカルなクロスカメラ特徴予測スキームを形成する。
論文 参考訳(メタデータ) (2021-07-29T11:27:50Z) - DeepMultiCap: Performance Capture of Multiple Characters Using Sparse
Multiview Cameras [63.186486240525554]
deep multicapは、スパースマルチビューカメラを用いたマルチパーソンパフォーマンスキャプチャのための新しい手法である。
本手法では,事前走査型テンプレートモデルを用いることなく,時間変化した表面の詳細をキャプチャできる。
論文 参考訳(メタデータ) (2021-05-01T14:32:13Z) - Wide-Baseline Multi-Camera Calibration using Person Re-Identification [27.965850489928457]
本稿では,大規模広ベースシナリオのためのカメラネットワークの3次元ポーズ推定の問題に対処する。
現場の人々を「キーポイント」として扱い、異なるカメラビューに関連付けることは、対応を得るための代替方法である。
本手法ではまず,カメラ間で人間境界ボックスを関連付ける再ID法を用い,境界ボックス対応を点対応に変換する。
論文 参考訳(メタデータ) (2021-04-17T15:09:18Z) - Self-supervised Human Detection and Segmentation via Multi-view
Consensus [116.92405645348185]
本稿では,トレーニング中に幾何学的制約を多視点一貫性という形で組み込むマルチカメラフレームワークを提案する。
本手法は,標準ベンチマークから視覚的に外れた画像に対して,最先端の自己監視的人物検出とセグメンテーション技術に勝ることを示す。
論文 参考訳(メタデータ) (2020-12-09T15:47:21Z) - Wide-Area Crowd Counting: Multi-View Fusion Networks for Counting in
Large Scenes [50.744452135300115]
マルチビュー・クラウドカウントのためのディープニューラルネットワークフレームワークを提案する。
提案手法は,他のマルチビューカウントベースラインと比較して,最先端の結果が得られる。
論文 参考訳(メタデータ) (2020-12-02T03:20:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。