論文の概要: Consistency-Aware Anchor Pyramid Network for Crowd Localization
- arxiv url: http://arxiv.org/abs/2212.04067v1
- Date: Thu, 8 Dec 2022 04:32:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-09 15:33:18.751101
- Title: Consistency-Aware Anchor Pyramid Network for Crowd Localization
- Title(参考訳): クラウドローカライズのための一貫性を考慮したアンカーピラミッドネットワーク
- Authors: Xinyan Liu, Guorong Li, Yuankai Qi, Zhenjun Han, Qingming Huang,
Ming-Hsuan Yang, Nicu Sebe
- Abstract要約: クラウドローカライゼーションは、群衆シナリオにおける人間の空間的位置を予測することを目的としている。
本稿では,各画像領域のアンカー密度を適応的に決定するアンカーピラミッド方式を提案する。
- 参考スコア(独自算出の注目度): 167.93943981468348
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Crowd localization aims to predict the spatial position of humans in a crowd
scenario. We observe that the performance of existing methods is challenged
from two aspects: (i) ranking inconsistency between test and training phases;
and (ii) fixed anchor resolution may underfit or overfit crowd densities of
local regions. To address these problems, we design a supervision target
reassignment strategy for training to reduce ranking inconsistency and propose
an anchor pyramid scheme to adaptively determine the anchor density in each
image region. Extensive experimental results on three widely adopted datasets
(ShanghaiTech A\&B, JHU-CROWD++, UCF-QNRF) demonstrate the favorable
performance against several state-of-the-art methods.
- Abstract(参考訳): crowd localizationは、群衆シナリオにおける人間の空間的位置を予測することを目的としている。
我々は、既存のメソッドのパフォーマンスが2つの側面から挑戦されていることを観察する。
(i)試験段階と訓練段階の間の非一貫性のランキング
(ii)固定アンカー決議は、地域の群衆密度を過小評価し、過小評価することができる。
これらの問題に対処するため,我々は,ランキング不整合を軽減するためのトレーニングのための監督対象再割り当て戦略を設計し,各画像領域におけるアンカー密度を適応的に決定するアンカーピラミッドスキームを提案する。
広く採用されている3つのデータセット(ShanghaiTech A\&B, JHU-CROWD++, UCF-QNRF)の大規模な実験結果は、いくつかの最先端手法に対する好成績を示している。
関連論文リスト
- Improving Point-based Crowd Counting and Localization Based on Auxiliary Point Guidance [59.71186244597394]
本稿では,提案手法における提案対象マッチングの安定化に有効な手法を提案する。
本稿では,提案手法の選択と最適化のために,Auxiliary Point Guidance (APG)を提案する。
また,多様な群集シナリオにおける適応的特徴抽出を可能にするために,IFI(Implicit Feature Interpolation)を開発した。
論文 参考訳(メタデータ) (2024-05-17T07:23:27Z) - Image Copy-Move Forgery Detection via Deep PatchMatch and Pairwise Ranking Learning [39.85737063875394]
本研究では,従来の学習手法と深層学習手法の強みを統合した,エンドツーエンドのCMFDフレームワークを開発した。
既存のディープモデルとは異なり,提案手法では,高分解能スケールから抽出した特徴を利用して,明示的で信頼性の高いポイント・ツー・ポイントマッチングを求める。
このフレームワークは、ポイント・ツー・ポイントマッチングの強い先行性を活用することで、微妙な違いを識別し、ソースとターゲットの領域を効果的に識別することができる。
論文 参考訳(メタデータ) (2024-04-26T10:38:17Z) - Digging Into Normal Incorporated Stereo Matching [18.849192633442453]
NDP(Non-local Disparity propagation)とARL(Affinity-aware residual Learning)という2つのモジュールからなる通常の統合型共同学習フレームワークを提案する。
この作業が完了するまでに、我々のアプローチは、KITTI 2015データセットにおける前景ピクセル間のステレオマッチングで1位、Scene Flowデータセットで3位にランクインしました。
論文 参考訳(メタデータ) (2024-02-28T09:01:50Z) - Two-Stage Adaptive Network for Semi-Supervised Cross-Domain Crater Detection under Varying Scenario Distributions [17.28368878719324]
クロスクレーター検出のための2段階適応ネットワーク(TAN)を提案する。
我々のネットワークはYOLOv5検出器上に構築されており、そこではクロスドメインの一般化能力を高めるために一連の戦略が採用されている。
ベンチマークデータセットによる実験結果から,提案するネットワークは,様々なシナリオ分布下でのクレーター検出の領域適応性を向上できることが示された。
論文 参考訳(メタデータ) (2023-12-11T07:16:49Z) - Implicit neural representation for change detection [15.741202788959075]
点雲の変化を検出する最も一般的なアプローチは、教師付き手法に基づいている。
Inlicit Neural Representation (INR) for continuous shape reconstruction と Gaussian Mixture Model for categorising change の2つのコンポーネントからなる教師なしアプローチを提案する。
本手法を都市スプロールのためのシミュレーションLiDAR点雲からなるベンチマークデータセットに適用する。
論文 参考訳(メタデータ) (2023-07-28T09:26:00Z) - Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。
SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T06:11:16Z) - Enhancing Prototypical Few-Shot Learning by Leveraging the Local-Level
Strategy [75.63022284445945]
既存の作業では、ローカルレベルの機能をすべて混ぜることで、イメージレベルの機能に基づいた、いくつかのショットモデルを構築することがよくあります。
a) 基地と新規カテゴリーの識別的位置バイアスを回避するための地域非依存のトレーニング戦略,(b) 地域レベルの特徴の正確な比較を捉えるための新しい地域レベルの類似度尺度を提案する。
論文 参考訳(メタデータ) (2021-11-08T08:45:15Z) - Domain Adaptive Semantic Segmentation with Regional Contrastive
Consistency Regularization [19.279884432843822]
本稿では,領域適応型セマンティックセマンティックセグメンテーションのための局所コントラスト整合正規化(RCCR)と呼ばれる,新しいエンドツーエンドのトレーニング可能なアプローチを提案する。
私たちの中核となる考え方は、異なる画像の同じ位置から抽出された類似の地域的特徴を取り除き、その一方、2つの画像の異なる位置から特徴を分離することです。
論文 参考訳(メタデータ) (2021-10-11T11:45:00Z) - Hierarchical Deep CNN Feature Set-Based Representation Learning for
Robust Cross-Resolution Face Recognition [59.29808528182607]
クロスリゾリューション顔認識(CRFR)は、インテリジェントな監視およびバイオメトリックフォレンジックにおいて重要である。
既存の浅層学習と深層学習に基づく手法は、HR-LR対を共同特徴空間にマッピングすることに焦点を当てている。
本研究では,多レベル深層畳み込みニューラルネットワーク(CNN)の機能を完全に活用し,堅牢なCRFRを実現することを目的とする。
論文 参考訳(メタデータ) (2021-03-25T14:03:42Z) - Contradictory Structure Learning for Semi-supervised Domain Adaptation [67.89665267469053]
現在の逆順応法は、クロスドメインの特徴を整列させようとする。
1)条件分布ミスマッチ、2)決定境界のソース領域へのバイアス。
本稿では,対向構造の学習を統一することで,半教師付きドメイン適応のための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-06T22:58:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。