Fugu-MT 論文翻訳(概要): Single Domain Generalization for Crowd Counting

論文の概要: Single Domain Generalization for Crowd Counting

arxiv url: http://arxiv.org/abs/2403.09124v1
Date: Thu, 14 Mar 2024 06:16:21 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-15 21:36:54.934696
Title: Single Domain Generalization for Crowd Counting
Title（参考訳）: クラウドカウントのための単一ドメインの一般化
Authors: Zhuoxuan Peng, S. -H. Gary Chan,
Abstract要約: MPCountは、さまざまなシナリオ下での最先端技術と比較して、カウント精度を著しく改善している。 MPCountは、狭いソース分布のトレーニングデータに保存されていない様々なシナリオ下でのテクニックの状態と比較して、カウントの精度を著しく改善する。
参考スコア（独自算出の注目度）: 11.212941297348268
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Current image-based crowd counting widely employs density map regression due to its promising results. However, the method often suffers from severe performance degradation when tested on data from unseen scenarios. To address this so-called "domain shift" problem, we investigate single domain generalization (SDG) for crowd counting. The existing SDG approaches are mainly for classification and segmentation, and can hardly be extended to our case due to its regression nature and label ambiguity (i.e., ambiguous pixel-level ground truths). We propose MPCount, a novel SDG approach effective even for narrow source distribution. Reconstructing diverse features for density map regression with a single memory bank, MPCount retains only domain-invariant representations using a content error mask and attention consistency loss. It further introduces patch-wise classification as an auxiliary task to boost the robustness of density prediction to achieve highly accurate labels. Through extensive experiments on different datasets, MPCount is shown to significantly improve counting accuracy compared to the state of the art under diverse scenarios unobserved in the training data of narrow source distribution. Code is available at https://github.com/Shimmer93/MPCount.
Abstract（参考訳）: 現在の画像に基づく群集カウントは、その有望な結果のために密度マップの回帰を広く採用している。しかし、この手法は、目に見えないシナリオからのデータでテストした場合、しばしば深刻なパフォーマンス劣化に悩まされる。いわゆる「ドメインシフト」問題に対処するため,集団カウントのための単一領域一般化(SDG)について検討する。既存のSDGアプローチは主に分類とセグメンテーションのためのものであり、その回帰性やラベルの曖昧さ(不明瞭なピクセルレベルの基底真理)のため、我々の場合までほとんど拡張できない。本稿では,狭い音源分布においても有効な新しいSDG手法であるMPCountを提案する。 MPCountは、単一のメモリバンクで密度マップレグレッションの多様な機能を再構築し、コンテンツエラーマスクとアテンション一貫性損失を使用して、ドメイン不変表現のみを保持する。さらに、高精度なラベルを実現するために密度予測の堅牢性を高める補助タスクとしてパッチワイズ分類を導入する。異なるデータセットに関する広範な実験により、MPCountは、狭いソース分布のトレーニングデータに保存されていない様々なシナリオの下で、最先端の手法と比較して、カウント精度を著しく改善することが示された。コードはhttps://github.com/Shimmer93/MPCount.comから入手できる。

関連論文リスト

DSGC-Net: A Dual-Stream Graph Convolutional Network for Crowd Counting via Feature Correlation Mining [70.17284306493814]
特徴相関マイニングに基づくDual-Stream Graph Convolutional NetworkであるDSGC-Netを提案する。 2つの意味グラフをモデル化することにより、密度の変動と表現分布の潜在的な特徴相関を捉える。広く使われている3つのデータセットの実験では、DSGC-Netが現在の最先端の手法より優れていることが示されている。
論文参考訳（メタデータ） (2025-09-02T12:35:33Z)
Learning to Rank Patches for Unbiased Image Redundancy Reduction [80.93989115541966]
画像は、隣接する領域の画素が空間的に相関しているため、空間的冗長性に悩まされる。既存のアプローチでは、意味の少ない画像領域を減らし、この制限を克服しようとしている。本稿では,Learning to Rank Patchesと呼ばれる画像冗長性低減のための自己教師型フレームワークを提案する。
論文参考訳（メタデータ） (2024-03-31T13:12:41Z)
Multimodal Unsupervised Domain Generalization by Retrieving Across the Modality Gap [11.96884248631201]
教師なし領域一般化問題のマルチモーダル版に取り組む。我々のフレームワークは、ソースデータセットを共同視覚言語空間で正確かつ効率的に検索できるという前提に依存している。我々は,テキストクエリと粗い量子化に使用される画像セントロイドとの距離が大きいため,近接した近接探索が低リコールに悩まされていることを理論的に示す。
論文参考訳（メタデータ） (2024-02-06T21:29:37Z)
Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文参考訳（メタデータ） (2023-09-01T11:15:50Z)
High-fidelity Pseudo-labels for Boosting Weakly-Supervised Segmentation [17.804090651425955]
画像レベルの弱い教師付きセグメンテーション(WSSS)は、トレーニング中にセグメンテーションマスクを代理することで、通常膨大なデータアノテーションコストを削減する。本研究は,GAPの代替となる重要サンプリングと特徴類似性損失という,CAMを改善するための2つの手法に基づく。複数の独立二項問題の後部二項問題に基づいて両手法を再構成する。パフォーマンスが向上し、より一般的なものになり、事実上あらゆるWSSSメソッドを増強できるアドオンメソッドが出来上がります。
論文参考訳（メタデータ） (2023-04-05T17:43:57Z)
Semantic-Aware Domain Generalized Segmentation [67.49163582961877]
ソースドメインでトレーニングされたディープモデルは、異なるデータ分布を持つ未確認対象ドメインで評価された場合、一般化に欠ける。セマンティック・アウェア・正規化(SAN)とセマンティック・アウェア・ホワイトニング(SAW)の2つの新しいモジュールを含むフレームワークを提案する。提案手法は,様々なバックボーンネットワークにおいて,既存の最先端ネットワークよりも大幅に改善されている。
論文参考訳（メタデータ） (2022-04-02T09:09:59Z)
Semantic Distribution-aware Contrastive Adaptation for Semantic Segmentation [50.621269117524925]
ドメイン適応セマンティックセグメンテーション(ドメイン適応セマンティックセグメンテーション)とは、特定のソースドメインのアノテーションだけで特定のターゲットドメイン上で予測を行うことを指す。画素ワイド表示アライメントを可能にする意味分布対応コントラスト適応アルゴリズムを提案する。複数のベンチマークでSDCAを評価し、既存のアルゴリズムを大幅に改善します。
論文参考訳（メタデータ） (2021-05-11T13:21:25Z)
Distribution Matching for Crowd Counting [51.90971145453012]
アノテーションにガウスを付与することは一般化性能を損なうことを示す。我々は,群集CoUNTing (DM-Count) における分布マッチングの利用を提案する。平均絶対誤差(Mean Absolute Error)の観点では、DM-Countは従来の最先端手法よりも優れている。
論文参考訳（メタデータ） (2020-09-28T04:57:23Z)
Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文参考訳（メタデータ） (2020-02-07T03:45:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。