論文の概要: Learning Independent Instance Maps for Crowd Localization
- arxiv url: http://arxiv.org/abs/2012.04164v2
- Date: Mon, 22 Mar 2021 03:20:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-17 12:27:58.079634
- Title: Learning Independent Instance Maps for Crowd Localization
- Title(参考訳): クラウドローカライゼーションのための独立インスタンスマップの学習
- Authors: Junyu Gao, Tao Han, Yuan Yuan, Qi Wang
- Abstract要約: Independent Instance Map segmentation (IIM) という,クラウドローカライゼーションのためのエンドツーエンドかつ簡単なフレームワークを提案する。
IIMセグメントは独立した接続コンポーネントに群集し、位置と群集数を得ます。
異なる密度領域のセグメンテーション品質を向上させるために,微分可能二元化モジュール(bm)を提案する。
BMはローカライズモデルに2つの利点をもたらす: 1) 異なる画像のしきい値マップを適応的に学習し、各インスタンスをより正確に検出する; 2) バイナリ予測とラベルの損失を使ってモデルを直接訓練する。
- 参考スコア(独自算出の注目度): 44.6430092887941
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurately locating each head's position in the crowd scenes is a crucial
task in the field of crowd analysis. However, traditional density-based methods
only predict coarse prediction, and segmentation/detection-based methods cannot
handle extremely dense scenes and large-range scale-variations crowds. To this
end, we propose an end-to-end and straightforward framework for crowd
localization, named Independent Instance Map segmentation (IIM). Different from
density maps and boxes regression, each instance in IIM is non-overlapped. By
segmenting crowds into independent connected components, the positions and the
crowd counts (the centers and the number of components, respectively) are
obtained. Furthermore, to improve the segmentation quality for different
density regions, we present a differentiable Binarization Module (BM) to output
structured instance maps. BM brings two advantages into localization models: 1)
adaptively learn a threshold map for different images to detect each instance
more accurately; 2) directly train the model using loss on binary predictions
and labels. Extensive experiments verify the proposed method is effective and
outperforms the-state-of-the-art methods on the five popular crowd datasets.
Significantly, IIM improves F1-measure by 10.4\% on the NWPU-Crowd Localization
task. The source code and pre-trained models will be released at
\url{https://github.com/taohan10200/IIM}.
- Abstract(参考訳): 群衆分析の分野では、群衆シーンにおける各頭部の位置を正確に特定することが重要な課題である。
しかし、従来の密度に基づく手法は粗い予測のみを予測し、セグメント化/検出に基づく手法は、非常に密集したシーンや大規模変動群を扱えない。
そこで我々は,Independent Instance Map segmentation (IIM) という,クラウドローカライゼーションのためのエンドツーエンドかつ簡単なフレームワークを提案する。
密度写像やボックス回帰とは異なり、IIMの各インスタンスはオーバーラップされない。
群集を独立した連結成分に分割することにより、その位置と群集数(それぞれ中心数と成分数)を求める。
さらに,異なる密度領域のセグメンテーション品質を向上させるため,構造化されたインスタンスマップを出力するために,BM (di differentiable Binarization Module) を提案する。
BMはローカライズモデルに2つの利点をもたらす: 1) 異なる画像のしきい値マップを適応的に学習し、各インスタンスをより正確に検出する; 2) バイナリ予測とラベルの損失を使ってモデルを直接訓練する。
提案手法が有効であることが検証され,5つの一般的な群集データセット上での最先端手法よりも優れていた。
重要なことに、IIM は NWPU-Crowd Localization タスクにおいて F1 対策を 10.4 % 改善している。
ソースコードと事前トレーニングされたモデルは \url{https://github.com/taohan10200/iim} でリリースされる。
関連論文リスト
- Bidirectional Domain Mixup for Domain Adaptive Semantic Segmentation [73.3083304858763]
本稿では,ドメイン適応型セマンティックセグメンテーションタスクにおけるミックスアップの影響を系統的に研究する。
具体的には、ドメインミックスアップをカットとペーストという2ステップで実現します。
フレームワークの主なコンポーネントを実証的に検証するために、広範囲にわたるアブレーション実験を行います。
論文 参考訳(メタデータ) (2023-03-17T05:22:44Z) - Divide and Contrast: Source-free Domain Adaptation via Adaptive
Contrastive Learning [122.62311703151215]
Divide and Contrast (DaC) は、それぞれの制限を回避しつつ、両方の世界の善良な端を接続することを目的としている。
DaCは、ターゲットデータをソースライクなサンプルとターゲット固有なサンプルに分割する。
さらに、ソースライクなドメインと、メモリバンクベースの最大平均離散性(MMD)損失を用いて、ターゲット固有のサンプルとを整合させて、分散ミスマッチを低減する。
論文 参考訳(メタデータ) (2022-11-12T09:21:49Z) - Personalizing Federated Medical Image Segmentation via Local Calibration [9.171482226385551]
ひとつのモデルを使って、異なるサイトからさまざまなデータ分布に適応することは、非常に難しい。
現場間一貫性を活用するために,textbfLocal textbfCalibration (LC-Fed) を用いたパーソナライズドフェデレーションフレームワークを提案する。
提案手法は,最先端のパーソナライズされたFL法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2022-07-11T06:30:31Z) - Decoupling Predictions in Distributed Learning for Multi-Center Left
Atrial MRI Segmentation [20.20518948616193]
本稿では,2つのグループ間のギャップを埋める分散学習のフレームワークを提案する。
左房左房左房 (LA) MRI 区分けを行った結果, 総括的データと局所的データの両方において, 既存手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2022-06-10T08:35:42Z) - PANet: Perspective-Aware Network with Dynamic Receptive Fields and
Self-Distilling Supervision for Crowd Counting [63.84828478688975]
本稿では,視点問題に対処するため,PANetと呼ばれる新しい視点認識手法を提案する。
対象物のサイズが視点効果によって1つの画像で大きく変化するという観測に基づいて,動的受容場(DRF)フレームワークを提案する。
このフレームワークは、入力画像に応じて拡張畳み込みパラメータによって受容野を調整することができ、モデルが各局所領域についてより識別的な特徴を抽出するのに役立つ。
論文 参考訳(メタデータ) (2021-10-31T04:43:05Z) - LDC-Net: A Unified Framework for Localization, Detection and Counting in
Dense Crowds [103.8635206945196]
視覚的群集分析の急速な発展は、単に密度マップを要約するのではなく、位置決めや検出によって人を数える傾向を示している。
群集の局所化と検出に関する最近の研究には,1) 群集を扱えない典型的な検出法と,大規模に変化する群集を扱えないこと,2) 密度マップ法は,特に高密度群集や大規模群集において,位置とボックスの予測における性能不足に悩まされていること,の2つの制限がある。
論文 参考訳(メタデータ) (2021-10-10T07:55:44Z) - PGL: Prior-Guided Local Self-supervised Learning for 3D Medical Image
Segmentation [87.50205728818601]
本稿では,潜在特徴空間における局所的一貫性を学習するPGL(PresideedGuided Local)自己教師モデルを提案する。
我々のPGLモデルは、局所領域の特異な表現を学習し、したがって構造情報を保持できる。
論文 参考訳(メタデータ) (2020-11-25T11:03:11Z) - A Strong Baseline for Crowd Counting and Unsupervised People
Localization [2.690502103971799]
本研究では,クラウドカウントのための強力なベースラインと,推定密度マップに基づく非教師なしの人物ローカライゼーションアルゴリズムについて検討する。
さまざまなバックボーンを収集して,その変更の影響を評価します。
そこで本研究では,KMeansと命名されたクラスタリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-11-07T08:29:03Z) - MetaBox+: A new Region Based Active Learning Method for Semantic
Segmentation using Priority Maps [4.396860522241306]
本稿では,MetaBox+と呼ばれるセマンティックイメージセグメンテーションのための新しい能動的学習手法を提案する。
取得にはメタ回帰モデルをトレーニングし、予測された未ラベル画像の各セグメントのセグメントワイド・インターセクション(IoU)を推定する。
提案手法をエントロピーに基づく手法と比較し,エントロピーを予測の不確実性とみなす。
論文 参考訳(メタデータ) (2020-10-05T09:36:47Z) - Adaptive Mixture Regression Network with Local Counting Map for Crowd
Counting [16.816382549827214]
そこで我々は,密度マップに基づくアプローチよりも正確な結果を得るために,LCM (Local counting map) という新しいターゲットを導入する。
また、3つのモジュールからなる適応型混合回帰フレームワークを粗大な方法で提案し、群衆推定の精度をさらに向上させる。
論文 参考訳(メタデータ) (2020-05-12T13:54:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。