論文の概要: Consistency-Aware Anchor Pyramid Network for Crowd Localization
- arxiv url: http://arxiv.org/abs/2212.04067v1
- Date: Thu, 8 Dec 2022 04:32:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-09 15:33:18.751101
- Title: Consistency-Aware Anchor Pyramid Network for Crowd Localization
- Title(参考訳): クラウドローカライズのための一貫性を考慮したアンカーピラミッドネットワーク
- Authors: Xinyan Liu, Guorong Li, Yuankai Qi, Zhenjun Han, Qingming Huang,
Ming-Hsuan Yang, Nicu Sebe
- Abstract要約: クラウドローカライゼーションは、群衆シナリオにおける人間の空間的位置を予測することを目的としている。
本稿では,各画像領域のアンカー密度を適応的に決定するアンカーピラミッド方式を提案する。
- 参考スコア(独自算出の注目度): 167.93943981468348
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Crowd localization aims to predict the spatial position of humans in a crowd
scenario. We observe that the performance of existing methods is challenged
from two aspects: (i) ranking inconsistency between test and training phases;
and (ii) fixed anchor resolution may underfit or overfit crowd densities of
local regions. To address these problems, we design a supervision target
reassignment strategy for training to reduce ranking inconsistency and propose
an anchor pyramid scheme to adaptively determine the anchor density in each
image region. Extensive experimental results on three widely adopted datasets
(ShanghaiTech A\&B, JHU-CROWD++, UCF-QNRF) demonstrate the favorable
performance against several state-of-the-art methods.
- Abstract(参考訳): crowd localizationは、群衆シナリオにおける人間の空間的位置を予測することを目的としている。
我々は、既存のメソッドのパフォーマンスが2つの側面から挑戦されていることを観察する。
(i)試験段階と訓練段階の間の非一貫性のランキング
(ii)固定アンカー決議は、地域の群衆密度を過小評価し、過小評価することができる。
これらの問題に対処するため,我々は,ランキング不整合を軽減するためのトレーニングのための監督対象再割り当て戦略を設計し,各画像領域におけるアンカー密度を適応的に決定するアンカーピラミッドスキームを提案する。
広く採用されている3つのデータセット(ShanghaiTech A\&B, JHU-CROWD++, UCF-QNRF)の大規模な実験結果は、いくつかの最先端手法に対する好成績を示している。
関連論文リスト
- Digging Into Normal Incorporated Stereo Matching [18.849192633442453]
NDP(Non-local Disparity propagation)とARL(Affinity-aware residual Learning)という2つのモジュールからなる通常の統合型共同学習フレームワークを提案する。
この作業が完了するまでに、我々のアプローチは、KITTI 2015データセットにおける前景ピクセル間のステレオマッチングで1位、Scene Flowデータセットで3位にランクインしました。
論文 参考訳(メタデータ) (2024-02-28T09:01:50Z) - DUA-DA: Distillation-based Unbiased Alignment for Domain Adaptive Object
Detection [38.87513465060913]
ドメイン適応オブジェクト検出(DAOD)のための蒸留法に基づく新しいunbiased Alignment(DUA)フレームワークを提案する。
DUAフレームワークは、トレーニングプロセス中にトレーニング済みの教師モデルを通じて、ソースの機能をよりバランスの取れた位置に向けて蒸留する。
我々は、これらの2つのメトリクスを利用して分類信頼性をさらに洗練するドメイン認識一貫性向上(DCE)戦略を実装している。
論文 参考訳(メタデータ) (2023-11-17T10:26:26Z) - Implicit neural representation for change detection [15.741202788959075]
点雲の変化を検出する最も一般的なアプローチは、教師付き手法に基づいている。
Inlicit Neural Representation (INR) for continuous shape reconstruction と Gaussian Mixture Model for categorising change の2つのコンポーネントからなる教師なしアプローチを提案する。
本手法を都市スプロールのためのシミュレーションLiDAR点雲からなるベンチマークデータセットに適用する。
論文 参考訳(メタデータ) (2023-07-28T09:26:00Z) - Entity-enhanced Adaptive Reconstruction Network for Weakly Supervised
Referring Expression Grounding [214.8003571700285]
Referring Expression Grounding (REG) は、言語表現によって記述されたイメージにおいて特定のターゲットをグラウンドすることを目的としている。
我々は、エンティティ強化適応再構築ネットワーク(EARN)を設計する。
EARNには、エンティティの強化、適応的な接地、協調的な再構築の3つのモジュールが含まれている。
論文 参考訳(メタデータ) (2022-07-18T05:30:45Z) - Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。
SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T06:11:16Z) - Enhancing Prototypical Few-Shot Learning by Leveraging the Local-Level
Strategy [75.63022284445945]
既存の作業では、ローカルレベルの機能をすべて混ぜることで、イメージレベルの機能に基づいた、いくつかのショットモデルを構築することがよくあります。
a) 基地と新規カテゴリーの識別的位置バイアスを回避するための地域非依存のトレーニング戦略,(b) 地域レベルの特徴の正確な比較を捉えるための新しい地域レベルの類似度尺度を提案する。
論文 参考訳(メタデータ) (2021-11-08T08:45:15Z) - Domain Adaptive Semantic Segmentation with Regional Contrastive
Consistency Regularization [19.279884432843822]
本稿では,領域適応型セマンティックセマンティックセグメンテーションのための局所コントラスト整合正規化(RCCR)と呼ばれる,新しいエンドツーエンドのトレーニング可能なアプローチを提案する。
私たちの中核となる考え方は、異なる画像の同じ位置から抽出された類似の地域的特徴を取り除き、その一方、2つの画像の異なる位置から特徴を分離することです。
論文 参考訳(メタデータ) (2021-10-11T11:45:00Z) - Hierarchical Deep CNN Feature Set-Based Representation Learning for
Robust Cross-Resolution Face Recognition [59.29808528182607]
クロスリゾリューション顔認識(CRFR)は、インテリジェントな監視およびバイオメトリックフォレンジックにおいて重要である。
既存の浅層学習と深層学習に基づく手法は、HR-LR対を共同特徴空間にマッピングすることに焦点を当てている。
本研究では,多レベル深層畳み込みニューラルネットワーク(CNN)の機能を完全に活用し,堅牢なCRFRを実現することを目的とする。
論文 参考訳(メタデータ) (2021-03-25T14:03:42Z) - Shape Consistent 2D Keypoint Estimation under Domain Shift [35.15266729401601]
ドメインシフトの下でキーポイントを推定するための新しい深層適応フレームワークを提案する。
本手法は,機能アライメント,対人訓練,自己超越という3つの構成要素をシームレスに結合する。
提案手法は,2次元キーポイント予測タスクにおける最先端領域適応手法より優れている。
論文 参考訳(メタデータ) (2020-08-04T14:32:06Z) - Contradictory Structure Learning for Semi-supervised Domain Adaptation [67.89665267469053]
現在の逆順応法は、クロスドメインの特徴を整列させようとする。
1)条件分布ミスマッチ、2)決定境界のソース領域へのバイアス。
本稿では,対向構造の学習を統一することで,半教師付きドメイン適応のための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-06T22:58:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。