Fugu-MT 論文翻訳(概要): Cross-View Cross-Scene Multi-View Crowd Counting

論文の概要: Cross-View Cross-Scene Multi-View Crowd Counting

arxiv url: http://arxiv.org/abs/2205.01551v1
Date: Tue, 3 May 2022 15:03:44 GMT
ステータス: 翻訳完了
システム内更新日: 2022-05-04 14:23:01.145303
Title: Cross-View Cross-Scene Multi-View Crowd Counting
Title（参考訳）: クロスビュー・クロスシーン・マルチビュー・クラウドカウント
Authors: Qi Zhang, Wei Lin, Antoni B. Chan
Abstract要約: 従来,複数カメラを用いて1台のカメラの視野を拡大する手法が提案されてきた。任意のカメラレイアウトで異なるシーンでトレーニングやテストを行う,クロスビュー・クロスシーン(CVCS)のマルチビュー・クラウドカウント・パラダイムを提案する。
参考スコア（独自算出の注目度）: 56.83882084112913
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Multi-view crowd counting has been previously proposed to utilize multi-cameras to extend the field-of-view of a single camera, capturing more people in the scene, and improve counting performance for occluded people or those in low resolution. However, the current multi-view paradigm trains and tests on the same single scene and camera-views, which limits its practical application. In this paper, we propose a cross-view cross-scene (CVCS) multi-view crowd counting paradigm, where the training and testing occur on different scenes with arbitrary camera layouts. To dynamically handle the challenge of optimal view fusion under scene and camera layout change and non-correspondence noise due to camera calibration errors or erroneous features, we propose a CVCS model that attentively selects and fuses multiple views together using camera layout geometry, and a noise view regularization method to train the model to handle non-correspondence errors. We also generate a large synthetic multi-camera crowd counting dataset with a large number of scenes and camera views to capture many possible variations, which avoids the difficulty of collecting and annotating such a large real dataset. We then test our trained CVCS model on real multi-view counting datasets, by using unsupervised domain transfer. The proposed CVCS model trained on synthetic data outperforms the same model trained only on real data, and achieves promising performance compared to fully supervised methods that train and test on the same single scene.
Abstract（参考訳）: マルチビュー・群衆計数法は,複数カメラを用いて1台のカメラの視野を拡大し,シーン内のより多くの人を捕捉し,隠蔽された人や低解像度の人のカウント性能を向上させることが提案されている。しかし、現在のマルチビュー・パラダイム・トレインとテストは同じシーンとカメラ・ビューで行われ、実用性は制限されている。本稿では,任意のカメラレイアウトで異なるシーンでトレーニングやテストを行う,クロスビュー・クロスシーン(CVCS)のマルチビュー・クラウドカウントパラダイムを提案する。シーン下での最適視界融合とカメラレイアウト変化, カメラキャリブレーション誤差や誤特徴による非対応ノイズの問題を動的に処理するために, カメラレイアウト形状を用いて複数のビューを注意深く選択・融合するCVCSモデルと, 非対応誤差を扱うようにモデルを訓練するノイズビュー正規化手法を提案する。また,多数のシーンとカメラビューを持つ大規模な合成マルチカメラ群数データセットを生成し,可能なバリエーションをキャプチャすることで,このような大規模なデータセットの収集と注釈付けの困難さを回避した。次に、教師なしドメイン転送を用いて、実際のマルチビューカウントデータセット上でトレーニングされたCVCSモデルをテストする。合成データに基づいてトレーニングされたCVCSモデルは、実データのみに基づいてトレーニングされた同じモデルより優れており、同一のシーンでトレーニングおよびテストを行う完全に教師された方法と比較して、有望な性能を達成する。

関連論文リスト

Semi-Supervised Multi-View Crowd Counting by Ranking Multi-View Fusion Models [46.12213690696149]
本稿では,2つの半教師付き多視点群カウントフレームワークを提案する。入力ビューの数が異なるマルチビュー融合モデルをランク付けする。実験では,提案手法の利点を実証する。
論文参考訳（メタデータ） (2025-12-18T06:49:55Z)
Stable Virtual Camera: Generative View Synthesis with Diffusion Models [51.71244310522393]
本稿では,シーンの新たなビューを生成する汎用拡散モデルであるスタブルバーチャルカメラ(Seva)を紹介する。このアプローチは、シンプルなモデル設計、最適化されたトレーニングレシピ、柔軟なサンプリング戦略によってこれらの制限を克服する。提案手法では,シームレスなループ閉鎖により,最大半分間の高品質なビデオを生成することができる。
論文参考訳（メタデータ） (2025-03-18T17:57:22Z)
Self-Supervised Partial Cycle-Consistency for Multi-View Matching [5.984724082624813]
我々は、部分的な重複を処理するために、サイクル一貫性を持つビュー不変の特徴抽出ネットワークを訓練する。本稿では,複数のサイクルを補完し,時間分割シーンサンプリング方式を提案する。自己監督状態と比較すると, コントリビューションによるF1スコアは4.3%上昇した。
論文参考訳（メタデータ） (2025-01-10T14:32:20Z)
Redundancy-Aware Camera Selection for Indoor Scene Neural Rendering [54.468355408388675]
カメラの空間的多様性と画像の意味的変動の両方を取り入れた類似度行列を構築した。カメラ選択を最適化するために,多様性に基づくサンプリングアルゴリズムを適用した。 IndoorTrajという新しいデータセットも開発しています。仮想屋内環境で人間が捉えた、長くて複雑なカメラの動きが含まれています。
論文参考訳（メタデータ） (2024-09-11T08:36:49Z)
Multi-View People Detection in Large Scenes via Supervised View-Wise Contribution Weighting [44.48514301889318]
本稿では、教師付きビューワイドコントリビューション重み付け手法の開発により、多視点人物検出の改善に焦点をあてる。モデルの一般化能力を高めるために、大規模な合成データセットが採用されている。実験により,提案手法が有望な多面的人物検出性能の実現に有効であることを実証した。
論文参考訳（メタデータ） (2024-05-30T11:03:27Z)
Learning to Select Camera Views: Efficient Multiview Understanding at Few Glances [59.34619548026885]
本稿では,対象物やシナリオを所定のビューから分析し,処理に最適なビューを選択するビュー選択手法を提案する。提案手法は,MVSelectという強化学習に基づくカメラ選択モジュールを備えており,ビューの選択だけでなく,タスクネットワークとの協調トレーニングも容易である。
論文参考訳（メタデータ） (2023-03-10T18:59:10Z)
DeepMultiCap: Performance Capture of Multiple Characters Using Sparse Multiview Cameras [63.186486240525554]
deep multicapは、スパースマルチビューカメラを用いたマルチパーソンパフォーマンスキャプチャのための新しい手法である。本手法では,事前走査型テンプレートモデルを用いることなく,時間変化した表面の詳細をキャプチャできる。
論文参考訳（メタデータ） (2021-05-01T14:32:13Z)
Wide-Baseline Multi-Camera Calibration using Person Re-Identification [27.965850489928457]
本稿では,大規模広ベースシナリオのためのカメラネットワークの3次元ポーズ推定の問題に対処する。現場の人々を「キーポイント」として扱い、異なるカメラビューに関連付けることは、対応を得るための代替方法である。本手法ではまず,カメラ間で人間境界ボックスを関連付ける再ID法を用い,境界ボックス対応を点対応に変換する。
論文参考訳（メタデータ） (2021-04-17T15:09:18Z)
Self-supervised Human Detection and Segmentation via Multi-view Consensus [116.92405645348185]
本稿では,トレーニング中に幾何学的制約を多視点一貫性という形で組み込むマルチカメラフレームワークを提案する。本手法は,標準ベンチマークから視覚的に外れた画像に対して,最先端の自己監視的人物検出とセグメンテーション技術に勝ることを示す。
論文参考訳（メタデータ） (2020-12-09T15:47:21Z)
Wide-Area Crowd Counting: Multi-View Fusion Networks for Counting in Large Scenes [50.744452135300115]
マルチビュー・クラウドカウントのためのディープニューラルネットワークフレームワークを提案する。提案手法は,他のマルチビューカウントベースラインと比較して,最先端の結果が得られる。
論文参考訳（メタデータ） (2020-12-02T03:20:30Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。