論文の概要: Fine-grained Domain Adaptive Crowd Counting via Point-derived
Segmentation
- arxiv url: http://arxiv.org/abs/2108.02980v1
- Date: Fri, 6 Aug 2021 07:16:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-09 20:53:25.473683
- Title: Fine-grained Domain Adaptive Crowd Counting via Point-derived
Segmentation
- Title(参考訳): 点由来セグメンテーションによるきめ細かいドメイン適応群カウント
- Authors: Yongtuo Liu, Dan Xu, Sucheng Ren, Hanjie Wu, Hongmin Cai, Shengfeng He
- Abstract要約: 各群集画像全体に対する既存領域適応手法により,群集と背景における領域の相違を同時に低減する。
群集や背景は異なる特徴を持ち,背景は異なる群集シーンで劇的に変化する可能性があるため,これらの手法は準最適であると主張する。
我々は,群集画像から群集と背景を抽出し,群集カウントのための細粒度ドメイン適応法を設計することを提案する。
- 参考スコア(独自算出の注目度): 30.036284847649394
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Existing domain adaptation methods for crowd counting view each crowd image
as a whole and reduce domain discrepancies on crowds and backgrounds
simultaneously. However, we argue that these methods are suboptimal, as crowds
and backgrounds have quite different characteristics and backgrounds may vary
dramatically in different crowd scenes (see Fig.~\ref{teaser}). This makes
crowds not well aligned across domains together with backgrounds in a holistic
manner. To this end, we propose to untangle crowds and backgrounds from crowd
images and design fine-grained domain adaption methods for crowd counting.
Different from other tasks which possess region-based fine-grained annotations
(e.g., segments or bounding boxes), crowd counting only annotates one point on
each human head, which impedes the implementation of fine-grained adaptation
methods. To tackle this issue, we propose a novel and effective schema to learn
crowd segmentation from point-level crowd counting annotations in the context
of Multiple Instance Learning. We further leverage the derived segments to
propose a crowd-aware fine-grained domain adaptation framework for crowd
counting, which consists of two novel adaptation modules, i.e., Crowd Region
Transfer (CRT) and Crowd Density Alignment (CDA). Specifically, the CRT module
is designed to guide crowd features transfer across domains beyond background
distractions, and the CDA module dedicates to constraining the target-domain
crowd density distributions. Extensive experiments on multiple cross-domain
settings (i.e., Synthetic $\rightarrow$ Real, Fixed $\rightarrow$ Fickle,
Normal $\rightarrow$ BadWeather) demonstrate the superiority of the proposed
method compared with state-of-the-art methods.
- Abstract(参考訳): 各群集画像全体に対する既存領域適応手法により,群集と背景における領域の相違を同時に低減する。
しかし,これらの手法は群集や背景が全く異なる特徴を持ち,背景が異なる群集シーンで劇的に変化するため,準最適であると主張する(図参照)。
これにより、群衆は全体的方法で背景とともにドメイン間でうまく整合しない。
そこで本研究では,群衆画像から群衆と背景を切り離し,群衆カウントのための細粒度ドメイン適応法を設計することを提案する。
領域ベースの細粒度アノテーション(セグメントやバウンディングボックスなど)を持つ他のタスクとは異なり、群衆のカウントは人間の頭部の1点のみに注釈を付け、細粒度適応メソッドの実装を妨げる。
そこで本研究では,複数インスタンス学習の文脈において,ポイントレベル群数アノテーションから群集セグメンテーションを学ぶための,新規かつ効果的なスキーマを提案する。
さらに、得られたセグメントを活用して、群集カウントのための細粒度ドメイン適応フレームワークを提案する。これは、2つの新しい適応モジュール、すなわち、CRT(Crowd Region Transfer)とCDA(Crowd Density Alignment)から構成される。
具体的には、CRTモジュールは、背景の乱れを超えた領域間での群衆の移動を誘導するために設計されており、CDAモジュールはターゲット領域の群集密度分布の制限に重点を置いている。
複数のクロスドメイン設定(Synthetic $\rightarrow$ Real, Fixed $\rightarrow$ Fickle, Normal $\rightarrow$ BadWeather)に対する大規模な実験は、最先端の手法と比較して提案手法の優位性を実証している。
関連論文リスト
- Dynamic Proxy Domain Generalizes the Crowd Localization by Better Binary Segmentation [65.13362950067744]
群衆のローカライゼーションは、イメージ内の各インスタンスの正確な位置を予測することを目的としている。
現在の高度な手法では、混雑予測に対処する画素単位のバイナリ分類が提案されている。
ドメインシフト下で学習者を一般化するための動的プロキシドメイン(DPD)手法を提案する。
論文 参考訳(メタデータ) (2024-04-22T08:58:57Z) - Robust Zero-Shot Crowd Counting and Localization With Adaptive Resolution SAM [55.93697196726016]
本稿では,SEEM(Seegment-Everything-Everywhere Model)を用いた簡易かつ効果的な群集カウント手法を提案する。
密集した群集シーンにおけるSEEMの性能は,高密度領域の多くの人々が欠落していることが主な原因である。
提案手法は,群集カウントにおいて最高の教師なし性能を実現すると同時に,いくつかの教師付き手法に匹敵する性能を示す。
論文 参考訳(メタデータ) (2024-02-27T13:55:17Z) - Fine-Grained Unsupervised Cross-Modality Domain Adaptation for
Vestibular Schwannoma Segmentation [3.0081059328558624]
ドメイン適応のためのきめ細かい教師なしのフレームワークの導入に注力する。
本稿では,ベクトルを用いて生成元を制御し,与えられた特徴を持つ偽画像を合成する手法を提案する。
そして、特徴辞書を検索することで、データセットに様々な拡張を適用することができる。
論文 参考訳(メタデータ) (2023-11-25T18:08:59Z) - Domain-General Crowd Counting in Unseen Scenarios [25.171343652312974]
群集データ間のドメインシフトは、群集数モデルが目に見えないシナリオに一般化するのを著しく妨げます。
ソースドメインを複数のサブドメインに分割する動的サブドメイン分割方式を提案する。
画像特徴におけるドメイン固有情報からドメイン不変情報を切り離すために、ドメイン不変および-特定のクラウドメモリモジュールを設計する。
論文 参考訳(メタデータ) (2022-12-05T19:52:28Z) - Distribution Regularized Self-Supervised Learning for Domain Adaptation
of Semantic Segmentation [3.284878354988896]
本稿では,セマンティックセグメンテーションの自己教師付きドメイン適応のための画素レベル分布正規化スキーム(DRSL)を提案する。
典型的な環境では、分類損失はセマンティックセグメンテーションモデルにクラス間のバリエーションをキャプチャする表現を欲しがらせるように強制する。
クラス認識型マルチモーダル分布学習により,ピクセルレベルのクラス内変動を捉える。
論文 参考訳(メタデータ) (2022-06-20T09:52:49Z) - Scene-Adaptive Attention Network for Crowd Counting [31.29858034122248]
本稿では,シーン適応型アテンションネットワークであるSAANetを提案する。
本研究では,変形可能なサンプリング位置と動的注意重みを持つ適応的特徴表現を学習するトランスフォーマーバックボーンの設計を行う。
我々は,4つの挑戦的群集カウントベンチマークについて広範な実験を行い,その手法が最先端のパフォーマンスを達成できることを実証した。
論文 参考訳(メタデータ) (2021-12-31T15:03:17Z) - Coarse to Fine: Domain Adaptive Crowd Counting via Adversarial Scoring
Network [58.05473757538834]
本稿では,ドメイン間のギャップを粗い粒度から細かな粒度に埋める新しい逆スコアリングネットワーク (ASNet) を提案する。
3組のマイグレーション実験により,提案手法が最先端のカウント性能を実現することを示す。
論文 参考訳(メタデータ) (2021-07-27T14:47:24Z) - Instance Level Affinity-Based Transfer for Unsupervised Domain
Adaptation [74.71931918541748]
ILA-DAと呼ばれる適応中のソースからターゲットへの転送に対するインスタンス親和性に基づく基準を提案する。
まず、ソースとターゲットをまたいだ類似および異種サンプルを抽出し、マルチサンプルのコントラスト損失を利用してドメインアライメントプロセスを駆動する信頼性が高く効率的な手法を提案する。
ILA-DAの有効性は、様々なベンチマークデータセットに対する一般的なドメイン適応手法よりも精度が一貫した改善を観察することによって検証する。
論文 参考訳(メタデータ) (2021-04-03T01:33:14Z) - Cross-Domain Grouping and Alignment for Domain Adaptive Semantic
Segmentation [74.3349233035632]
深層畳み込みニューラルネットワーク(CNN)内のソースドメインとターゲットドメインにセマンティックセグメンテーションネットワークを適用する既存の技術は、対象ドメイン自身や推定カテゴリ内のクラス間変異を考慮していない。
学習可能なクラスタリングモジュールと、クロスドメイングルーピングとアライメントと呼ばれる新しいドメイン適応フレームワークを導入する。
本手法はセマンティクスセグメンテーションにおける適応性能を一貫して向上させ,様々なドメイン適応設定において最先端を上回っている。
論文 参考訳(メタデータ) (2020-12-15T11:36:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。