論文の概要: AdaCrowd: Unlabeled Scene Adaptation for Crowd Counting
- arxiv url: http://arxiv.org/abs/2010.12141v2
- Date: Tue, 23 Feb 2021 06:05:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-03 23:11:27.421634
- Title: AdaCrowd: Unlabeled Scene Adaptation for Crowd Counting
- Title(参考訳): adacrowd: 群衆カウントのためのラベルなしシーン適応
- Authors: Mahesh Kumar Krishna Reddy, Mrigank Rochan, Yiwei Lu, Yang Wang
- Abstract要約: 本稿では,未ラベルのシーン適応型群衆カウントと呼ばれる新しい問題を提案する。
新しいターゲットシーンを前提として、この特定のシーンに特化して群衆カウントモデルを構築したい。
本稿では,対象シーンからの1つ以上の未ラベル画像を用いて適応を行うことを提案する。
- 参考スコア(独自算出の注目度): 14.916045549353987
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We address the problem of image-based crowd counting. In particular, we
propose a new problem called unlabeled scene-adaptive crowd counting. Given a
new target scene, we would like to have a crowd counting model specifically
adapted to this particular scene based on the target data that capture some
information about the new scene. In this paper, we propose to use one or more
unlabeled images from the target scene to perform the adaptation. In comparison
with the existing problem setups (e.g. fully supervised), our proposed problem
setup is closer to the real-world applications of crowd counting systems. We
introduce a novel AdaCrowd framework to solve this problem. Our framework
consists of a crowd counting network and a guiding network. The guiding network
predicts some parameters in the crowd counting network based on the unlabeled
images from a particular scene. This allows our model to adapt to different
target scenes. The experimental results on several challenging benchmark
datasets demonstrate the effectiveness of our proposed approach compared with
other alternative methods. Code is available at
https://github.com/maheshkkumar/adacrowd.
- Abstract(参考訳): 我々は,画像に基づく群衆数量の問題に対処する。
特に,無ラベルシーン適応型群衆カウントという新しい問題を提案する。
新しいターゲットシーンを前提として,新たなシーンに関する情報を収集するターゲットデータに基づいて,この特定のシーンに特異的に適応した群衆カウントモデルを構築したい。
本稿では,対象シーンからの1つ以上の未ラベル画像を用いて適応を行うことを提案する。
既存の問題設定(例えば、完全な教師付き)と比較して、提案する問題設定は、クラウドカウントシステムの実世界のアプリケーションに近いものです。
我々は,この問題を解決するための新しい枠組みを提案する。
本フレームワークは,クラウドカウントネットワークとガイドネットワークから構成される。
案内ネットワークは、特定のシーンからのラベルなし画像に基づいて、群衆カウントネットワーク内のいくつかのパラメータを予測する。
これにより、モデルは異なるターゲットシーンに適応できます。
いくつかの挑戦的なベンチマークデータセットの実験結果から,提案手法の有効性を他の手法と比較した。
コードはhttps://github.com/maheshkkumar/adacrowdで入手できる。
関連論文リスト
- GLACE: Global Local Accelerated Coordinate Encoding [66.87005863868181]
シーン座標回帰法は小規模なシーンでは有効であるが、大規模シーンでは重大な課題に直面している。
本研究では,事前学習したグローバルおよびローカルのエンコーディングを統合したGLACEを提案する。
提案手法は,低マップサイズモデルを用いて,大規模シーンにおける最先端結果を実現する。
論文 参考訳(メタデータ) (2024-06-06T17:59:50Z) - Robust Zero-Shot Crowd Counting and Localization With Adaptive Resolution SAM [55.93697196726016]
本稿では,SEEM(Seegment-Everything-Everywhere Model)を用いた簡易かつ効果的な群集カウント手法を提案する。
密集した群集シーンにおけるSEEMの性能は,高密度領域の多くの人々が欠落していることが主な原因である。
提案手法は,群集カウントにおいて最高の教師なし性能を実現すると同時に,いくつかの教師付き手法に匹敵する性能を示す。
論文 参考訳(メタデータ) (2024-02-27T13:55:17Z) - Break-A-Scene: Extracting Multiple Concepts from a Single Image [80.47666266017207]
テキストシーン分解の課題を紹介する。
本稿では,対象概念の存在を示すマスクを用いた入力画像の拡張を提案する。
次に、新しい2段階のカスタマイズプロセスを示す。
論文 参考訳(メタデータ) (2023-05-25T17:59:04Z) - Knowing What to Label for Few Shot Microscopy Image Cell Segmentation [15.510258960276083]
顕微鏡画像セルセグメンテーションでは、異なる種類の顕微鏡画像を含む、ソースデータに基づいてディープニューラルネットワークを訓練することが一般的である。
注釈付きトレーニング対象画像のランダムな選択は、効果的な微調整プロセスを可能にしないのではないか、と我々は主張する。
提案手法では, 新たなスコアリング機能を用いて, 意図しない対象画像の探索を行う。
論文 参考訳(メタデータ) (2022-11-18T14:03:49Z) - Cross-View Cross-Scene Multi-View Crowd Counting [56.83882084112913]
従来,複数カメラを用いて1台のカメラの視野を拡大する手法が提案されてきた。
任意のカメラレイアウトで異なるシーンでトレーニングやテストを行う,クロスビュー・クロスシーン(CVCS)のマルチビュー・クラウドカウント・パラダイムを提案する。
論文 参考訳(メタデータ) (2022-05-03T15:03:44Z) - Scene-Adaptive Attention Network for Crowd Counting [31.29858034122248]
本稿では,シーン適応型アテンションネットワークであるSAANetを提案する。
本研究では,変形可能なサンプリング位置と動的注意重みを持つ適応的特徴表現を学習するトランスフォーマーバックボーンの設計を行う。
我々は,4つの挑戦的群集カウントベンチマークについて広範な実験を行い,その手法が最先端のパフォーマンスを達成できることを実証した。
論文 参考訳(メタデータ) (2021-12-31T15:03:17Z) - A Few Guidelines for Incremental Few-Shot Segmentation [57.34237650765928]
事前訓練されたセグメンテーションモデルと、新しいクラスを含む画像が少ないことを前提として、我々が目指すのは、以前に見たセグメンテーション能力を維持しながら、新しいクラスをセグメンテーションすることである。
このシナリオにおけるエンド・ツー・エンドのトレーニングの主な問題はどのようなものかを示します。
一 バッチ正規化統計を、バッチ正規化で修正できる新しいクラスへ向けての漂流すること。
二 旧クラスの忘れ物 正規化戦略で解決できるもの。
論文 参考訳(メタデータ) (2020-11-30T20:45:56Z) - Completely Self-Supervised Crowd Counting via Distribution Matching [92.09218454377395]
我々は,密集した群集数に対するトレーニングモデルに対する完全な自己超越的アプローチを提案する。
トレーニングに必要な入力は、大量の未ラベルの群衆画像以外は、群衆数に近似した上限である。
提案手法は,自然群集が逆伝播の誤り信号を生成するために利用可能な電力法分布に従うという考え方に富む。
論文 参考訳(メタデータ) (2020-09-14T13:20:12Z) - SceneAdapt: Scene-based domain adaptation for semantic segmentation
using adversarial learning [24.37746089471516]
SceneAdaptは、逆学習に基づくセマンティックセグメンテーションアルゴリズムのシーン適応手法である。
このトピックについての研究を促進するため、私たちはWebページにコードを公開しました。
論文 参考訳(メタデータ) (2020-06-18T09:43:31Z) - Few-Shot Scene Adaptive Crowd Counting Using Meta-Learning [13.149654626505741]
数ショットシーン適応的な群集カウントの問題点を考察する。
対象のカメラシーンが与えられた場合、この特定のシーンにモデルを適応させることを目標としています。
我々は、最近導入された学習から学習へのパラダイムからインスピレーションを得て、この課題を達成する。
論文 参考訳(メタデータ) (2020-02-01T19:41:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。