論文の概要: Single Domain Generalization for Crowd Counting
- arxiv url: http://arxiv.org/abs/2403.09124v2
- Date: Fri, 5 Apr 2024 12:56:31 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-08 18:16:01.309967
- Title: Single Domain Generalization for Crowd Counting
- Title(参考訳): クラウドカウントのための単一ドメインの一般化
- Authors: Zhuoxuan Peng, S. -H. Gary Chan,
- Abstract要約: MPCountは、ソース分布が狭い場合でも、新しい効果的なアプローチである。
密度マップの回帰のために多様な密度値を格納し、1つのメモリバンクでドメイン不変の特徴を再構築する。
様々なシナリオ下での美術品の状態と比較して、カウント精度が著しく向上することが示されている。
- 参考スコア(独自算出の注目度): 11.212941297348268
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Due to its promising results, density map regression has been widely employed for image-based crowd counting. The approach, however, often suffers from severe performance degradation when tested on data from unseen scenarios, the so-called "domain shift" problem. To address the problem, we investigate in this work single domain generalization (SDG) for crowd counting. The existing SDG approaches are mainly for image classification and segmentation, and can hardly be extended to our case due to its regression nature and label ambiguity (i.e., ambiguous pixel-level ground truths). We propose MPCount, a novel effective SDG approach even for narrow source distribution. MPCount stores diverse density values for density map regression and reconstructs domain-invariant features by means of only one memory bank, a content error mask and attention consistency loss. By partitioning the image into grids, it employs patch-wise classification as an auxiliary task to mitigate label ambiguity. Through extensive experiments on different datasets, MPCount is shown to significantly improve counting accuracy compared to the state of the art under diverse scenarios unobserved in the training data characterized by narrow source distribution. Code is available at https://github.com/Shimmer93/MPCount.
- Abstract(参考訳): その有望な結果により、密度マップの回帰は画像に基づく群集カウントに広く採用されている。
しかしこのアプローチは、目に見えないシナリオ、いわゆる"ドメインシフト"問題からのデータでテストした場合、パフォーマンスの深刻な低下に悩まされることが多い。
そこで本研究では,集団カウントのための単一領域一般化(SDG)について検討する。
既存のSDGアプローチは主に画像分類とセグメンテーションのためのもので、その回帰性やラベルの曖昧さ(不明瞭なピクセルレベルの基底真理)のため、我々の場合へ拡張することは困難である。
本稿では,狭い音源分布においても有効なSDG手法であるMPCountを提案する。
MPCountは密度マップの回帰のために様々な密度値を格納し、1つのメモリバンク、コンテンツエラーマスク、アテンション一貫性損失によってドメイン不変の特徴を再構築する。
イメージをグリッドに分割することで、ラベルのあいまいさを軽減する補助タスクとしてパッチワイズ分類を採用する。
異なるデータセットに関する広範な実験を通じて、MPCountは、狭いソース分布を特徴とするトレーニングデータに観察されない様々なシナリオの下で、最先端の手法と比較して、カウント精度を著しく改善することが示されている。
コードはhttps://github.com/Shimmer93/MPCount.comから入手できる。
関連論文リスト
- Learning to Rank Patches for Unbiased Image Redundancy Reduction [80.93989115541966]
画像は、隣接する領域の画素が空間的に相関しているため、空間的冗長性に悩まされる。
既存のアプローチでは、意味の少ない画像領域を減らし、この制限を克服しようとしている。
本稿では,Learning to Rank Patchesと呼ばれる画像冗長性低減のための自己教師型フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-31T13:12:41Z) - Multimodal Unsupervised Domain Generalization by Retrieving Across the Modality Gap [11.96884248631201]
教師なし領域一般化問題のマルチモーダル版に取り組む。
我々のフレームワークは、ソースデータセットを共同視覚言語空間で正確かつ効率的に検索できるという前提に依存している。
我々は,テキストクエリと粗い量子化に使用される画像セントロイドとの距離が大きいため,近接した近接探索が低リコールに悩まされていることを理論的に示す。
論文 参考訳(メタデータ) (2024-02-06T21:29:37Z) - Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - High-fidelity Pseudo-labels for Boosting Weakly-Supervised Segmentation [17.804090651425955]
画像レベルの弱い教師付きセグメンテーション(WSSS)は、トレーニング中にセグメンテーションマスクを代理することで、通常膨大なデータアノテーションコストを削減する。
本研究は,GAPの代替となる重要サンプリングと特徴類似性損失という,CAMを改善するための2つの手法に基づく。
複数の独立二項問題の後部二項問題に基づいて両手法を再構成する。
パフォーマンスが向上し、より一般的なものになり、事実上あらゆるWSSSメソッドを増強できるアドオンメソッドが出来上がります。
論文 参考訳(メタデータ) (2023-04-05T17:43:57Z) - Semantic-Aware Domain Generalized Segmentation [67.49163582961877]
ソースドメインでトレーニングされたディープモデルは、異なるデータ分布を持つ未確認対象ドメインで評価された場合、一般化に欠ける。
セマンティック・アウェア・正規化(SAN)とセマンティック・アウェア・ホワイトニング(SAW)の2つの新しいモジュールを含むフレームワークを提案する。
提案手法は,様々なバックボーンネットワークにおいて,既存の最先端ネットワークよりも大幅に改善されている。
論文 参考訳(メタデータ) (2022-04-02T09:09:59Z) - Semantic Distribution-aware Contrastive Adaptation for Semantic
Segmentation [50.621269117524925]
ドメイン適応セマンティックセグメンテーション(ドメイン適応セマンティックセグメンテーション)とは、特定のソースドメインのアノテーションだけで特定のターゲットドメイン上で予測を行うことを指す。
画素ワイド表示アライメントを可能にする意味分布対応コントラスト適応アルゴリズムを提案する。
複数のベンチマークでSDCAを評価し、既存のアルゴリズムを大幅に改善します。
論文 参考訳(メタデータ) (2021-05-11T13:21:25Z) - Distribution Matching for Crowd Counting [51.90971145453012]
アノテーションにガウスを付与することは一般化性能を損なうことを示す。
我々は,群集CoUNTing (DM-Count) における分布マッチングの利用を提案する。
平均絶対誤差(Mean Absolute Error)の観点では、DM-Countは従来の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2020-09-28T04:57:23Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。