論文の概要: Single Domain Generalization for Crowd Counting
- arxiv url: http://arxiv.org/abs/2403.09124v1
- Date: Thu, 14 Mar 2024 06:16:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-15 21:36:54.934696
- Title: Single Domain Generalization for Crowd Counting
- Title(参考訳): クラウドカウントのための単一ドメインの一般化
- Authors: Zhuoxuan Peng, S. -H. Gary Chan,
- Abstract要約: MPCountは、さまざまなシナリオ下での最先端技術と比較して、カウント精度を著しく改善している。
MPCountは、狭いソース分布のトレーニングデータに保存されていない様々なシナリオ下でのテクニックの状態と比較して、カウントの精度を著しく改善する。
- 参考スコア(独自算出の注目度): 11.212941297348268
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Current image-based crowd counting widely employs density map regression due to its promising results. However, the method often suffers from severe performance degradation when tested on data from unseen scenarios. To address this so-called "domain shift" problem, we investigate single domain generalization (SDG) for crowd counting. The existing SDG approaches are mainly for classification and segmentation, and can hardly be extended to our case due to its regression nature and label ambiguity (i.e., ambiguous pixel-level ground truths). We propose MPCount, a novel SDG approach effective even for narrow source distribution. Reconstructing diverse features for density map regression with a single memory bank, MPCount retains only domain-invariant representations using a content error mask and attention consistency loss. It further introduces patch-wise classification as an auxiliary task to boost the robustness of density prediction to achieve highly accurate labels. Through extensive experiments on different datasets, MPCount is shown to significantly improve counting accuracy compared to the state of the art under diverse scenarios unobserved in the training data of narrow source distribution. Code is available at https://github.com/Shimmer93/MPCount.
- Abstract(参考訳): 現在の画像に基づく群集カウントは、その有望な結果のために密度マップの回帰を広く採用している。
しかし、この手法は、目に見えないシナリオからのデータでテストした場合、しばしば深刻なパフォーマンス劣化に悩まされる。
いわゆる「ドメインシフト」問題に対処するため,集団カウントのための単一領域一般化(SDG)について検討する。
既存のSDGアプローチは主に分類とセグメンテーションのためのものであり、その回帰性やラベルの曖昧さ(不明瞭なピクセルレベルの基底真理)のため、我々の場合までほとんど拡張できない。
本稿では,狭い音源分布においても有効な新しいSDG手法であるMPCountを提案する。
MPCountは、単一のメモリバンクで密度マップレグレッションの多様な機能を再構築し、コンテンツエラーマスクとアテンション一貫性損失を使用して、ドメイン不変表現のみを保持する。
さらに、高精度なラベルを実現するために密度予測の堅牢性を高める補助タスクとしてパッチワイズ分類を導入する。
異なるデータセットに関する広範な実験により、MPCountは、狭いソース分布のトレーニングデータに保存されていない様々なシナリオの下で、最先端の手法と比較して、カウント精度を著しく改善することが示された。
コードはhttps://github.com/Shimmer93/MPCount.comから入手できる。
関連論文リスト
- Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - High-fidelity Pseudo-labels for Boosting Weakly-Supervised Segmentation [17.804090651425955]
画像レベルの弱い教師付きセグメンテーション(WSSS)は、トレーニング中にセグメンテーションマスクを代理することで、通常膨大なデータアノテーションコストを削減する。
本研究は,GAPの代替となる重要サンプリングと特徴類似性損失という,CAMを改善するための2つの手法に基づく。
複数の独立二項問題の後部二項問題に基づいて両手法を再構成する。
パフォーマンスが向上し、より一般的なものになり、事実上あらゆるWSSSメソッドを増強できるアドオンメソッドが出来上がります。
論文 参考訳(メタデータ) (2023-04-05T17:43:57Z) - Rethinking Spatial Invariance of Convolutional Networks for Object
Counting [119.83017534355842]
局所連結ガウス核を用いて元の畳み込みフィルタを置き換え、密度写像の空間位置を推定する。
従来の研究から着想を得て,大規模なガウス畳み込みの近似を好意的に実装するために,翻訳不変性を伴う低ランク近似を提案する。
提案手法は,他の最先端手法を著しく上回り,物体の空間的位置の有望な学習を実現する。
論文 参考訳(メタデータ) (2022-06-10T17:51:25Z) - Semantic-Aware Domain Generalized Segmentation [67.49163582961877]
ソースドメインでトレーニングされたディープモデルは、異なるデータ分布を持つ未確認対象ドメインで評価された場合、一般化に欠ける。
セマンティック・アウェア・正規化(SAN)とセマンティック・アウェア・ホワイトニング(SAW)の2つの新しいモジュールを含むフレームワークを提案する。
提案手法は,様々なバックボーンネットワークにおいて,既存の最先端ネットワークよりも大幅に改善されている。
論文 参考訳(メタデータ) (2022-04-02T09:09:59Z) - Semantic Distribution-aware Contrastive Adaptation for Semantic
Segmentation [50.621269117524925]
ドメイン適応セマンティックセグメンテーション(ドメイン適応セマンティックセグメンテーション)とは、特定のソースドメインのアノテーションだけで特定のターゲットドメイン上で予測を行うことを指す。
画素ワイド表示アライメントを可能にする意味分布対応コントラスト適応アルゴリズムを提案する。
複数のベンチマークでSDCAを評価し、既存のアルゴリズムを大幅に改善します。
論文 参考訳(メタデータ) (2021-05-11T13:21:25Z) - Regressive Domain Adaptation for Unsupervised Keypoint Detection [67.2950306888855]
ドメイン適応(DA)は、ラベル付きソースドメインからラベル付きターゲットドメインに知識を転送することを目的とする。
本稿では,教師なしキーポイント検出のためのレグレッシブドメイン適応(RegDA)法を提案する。
提案手法は,異なるデータセット上のPCKにおいて,8%から11%の大幅な改善をもたらす。
論文 参考訳(メタデータ) (2021-03-10T16:45:22Z) - Reciprocal Distance Transform Maps for Crowd Counting and People
Localization in Dense Crowd [16.224760698133462]
本稿では,クラウドカウントのためのReciprocal Distance Transform (R-DT) マップを提案する。
密度マップと比較すると、r-dtマップは人口の位置を正確に記述しており、密度の高い地域で近くの頭部が重なり合うことはない。
密度マップをR-DTマップに置き換えることで、クラウドカウントと人々のローカリゼーションを同時にシンプルなネットワークで実現します。
論文 参考訳(メタデータ) (2021-02-16T02:25:55Z) - Learning Independent Instance Maps for Crowd Localization [44.6430092887941]
Independent Instance Map segmentation (IIM) という,クラウドローカライゼーションのためのエンドツーエンドかつ簡単なフレームワークを提案する。
IIMセグメントは独立した接続コンポーネントに群集し、位置と群集数を得ます。
異なる密度領域のセグメンテーション品質を向上させるために,微分可能二元化モジュール(bm)を提案する。
BMはローカライズモデルに2つの利点をもたらす: 1) 異なる画像のしきい値マップを適応的に学習し、各インスタンスをより正確に検出する; 2) バイナリ予測とラベルの損失を使ってモデルを直接訓練する。
論文 参考訳(メタデータ) (2020-12-08T02:17:19Z) - Distribution Matching for Crowd Counting [51.90971145453012]
アノテーションにガウスを付与することは一般化性能を損なうことを示す。
我々は,群集CoUNTing (DM-Count) における分布マッチングの利用を提案する。
平均絶対誤差(Mean Absolute Error)の観点では、DM-Countは従来の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2020-09-28T04:57:23Z) - Adaptive Mixture Regression Network with Local Counting Map for Crowd
Counting [16.816382549827214]
そこで我々は,密度マップに基づくアプローチよりも正確な結果を得るために,LCM (Local counting map) という新しいターゲットを導入する。
また、3つのモジュールからなる適応型混合回帰フレームワークを粗大な方法で提案し、群衆推定の精度をさらに向上させる。
論文 参考訳(メタデータ) (2020-05-12T13:54:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。