Fugu-MT 論文翻訳(概要): Consistency-Aware Anchor Pyramid Network for Crowd Localization

論文の概要: Consistency-Aware Anchor Pyramid Network for Crowd Localization

arxiv url: http://arxiv.org/abs/2212.04067v1
Date: Thu, 8 Dec 2022 04:32:01 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-09 15:33:18.751101
Title: Consistency-Aware Anchor Pyramid Network for Crowd Localization
Title（参考訳）: クラウドローカライズのための一貫性を考慮したアンカーピラミッドネットワーク
Authors: Xinyan Liu, Guorong Li, Yuankai Qi, Zhenjun Han, Qingming Huang, Ming-Hsuan Yang, Nicu Sebe
Abstract要約: クラウドローカライゼーションは、群衆シナリオにおける人間の空間的位置を予測することを目的としている。本稿では,各画像領域のアンカー密度を適応的に決定するアンカーピラミッド方式を提案する。
参考スコア（独自算出の注目度）: 167.93943981468348
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Crowd localization aims to predict the spatial position of humans in a crowd scenario. We observe that the performance of existing methods is challenged from two aspects: (i) ranking inconsistency between test and training phases; and (ii) fixed anchor resolution may underfit or overfit crowd densities of local regions. To address these problems, we design a supervision target reassignment strategy for training to reduce ranking inconsistency and propose an anchor pyramid scheme to adaptively determine the anchor density in each image region. Extensive experimental results on three widely adopted datasets (ShanghaiTech A\&B, JHU-CROWD++, UCF-QNRF) demonstrate the favorable performance against several state-of-the-art methods.
Abstract（参考訳）: crowd localizationは、群衆シナリオにおける人間の空間的位置を予測することを目的としている。我々は、既存のメソッドのパフォーマンスが2つの側面から挑戦されていることを観察する。 (i)試験段階と訓練段階の間の非一貫性のランキング (ii)固定アンカー決議は、地域の群衆密度を過小評価し、過小評価することができる。これらの問題に対処するため,我々は,ランキング不整合を軽減するためのトレーニングのための監督対象再割り当て戦略を設計し,各画像領域におけるアンカー密度を適応的に決定するアンカーピラミッドスキームを提案する。広く採用されている3つのデータセット(ShanghaiTech A\&B, JHU-CROWD++, UCF-QNRF)の大規模な実験結果は、いくつかの最先端手法に対する好成績を示している。

関連論文リスト

Integrating Disparity Confidence Estimation into Relative Depth Prior-Guided Unsupervised Stereo Matching [55.784713740698365]
教師なしのステレオマッチングは、コストのかかる不均一なアノテーションから独立して、大きな注目を集めている。実現可能な解決策は、相対深度マップからステレオマッチングネットワークへの3次元幾何学的知識の転送にある。本研究は,これらの課題に対処する新しい教師なし学習フレームワークを提案する。
論文参考訳（メタデータ） (2025-08-02T09:11:05Z)
Consistent-Point: Consistent Pseudo-Points for Semi-Supervised Crowd Counting and Localization [28.018688635859156]
そこで本研究では,コンシスタントポイント(Consistent-Point)と呼ばれる,ポイントローカライズに基づく半教師付きクラウドカウントとローカライズ手法を提案する。適切な調査が行われていない2つの疑似点の矛盾を特定し,対処する。提案手法は,群集定位における最先端のパフォーマンスを達成し,また,群集計数の結果も得られた。
論文参考訳（メタデータ） (2025-03-16T10:31:52Z)
Improving Point-based Crowd Counting and Localization Based on Auxiliary Point Guidance [59.71186244597394]
本稿では,提案手法における提案対象マッチングの安定化に有効な手法を提案する。本稿では,提案手法の選択と最適化のために,Auxiliary Point Guidance (APG)を提案する。また,多様な群集シナリオにおける適応的特徴抽出を可能にするために,IFI(Implicit Feature Interpolation)を開発した。
論文参考訳（メタデータ） (2024-05-17T07:23:27Z)
Image Copy-Move Forgery Detection via Deep PatchMatch and Pairwise Ranking Learning [39.85737063875394]
本研究では,従来の学習手法と深層学習手法の強みを統合した,エンドツーエンドのCMFDフレームワークを開発した。既存のディープモデルとは異なり,提案手法では,高分解能スケールから抽出した特徴を利用して,明示的で信頼性の高いポイント・ツー・ポイントマッチングを求める。このフレームワークは、ポイント・ツー・ポイントマッチングの強い先行性を活用することで、微妙な違いを識別し、ソースとターゲットの領域を効果的に識別することができる。
論文参考訳（メタデータ） (2024-04-26T10:38:17Z)
Digging Into Normal Incorporated Stereo Matching [18.849192633442453]
NDP(Non-local Disparity propagation)とARL(Affinity-aware residual Learning)という2つのモジュールからなる通常の統合型共同学習フレームワークを提案する。この作業が完了するまでに、我々のアプローチは、KITTI 2015データセットにおける前景ピクセル間のステレオマッチングで1位、Scene Flowデータセットで3位にランクインしました。
論文参考訳（メタデータ） (2024-02-28T09:01:50Z)
Two-Stage Adaptive Network for Semi-Supervised Cross-Domain Crater Detection under Varying Scenario Distributions [17.28368878719324]
クロスクレーター検出のための2段階適応ネットワーク(TAN)を提案する。我々のネットワークはYOLOv5検出器上に構築されており、そこではクロスドメインの一般化能力を高めるために一連の戦略が採用されている。ベンチマークデータセットによる実験結果から,提案するネットワークは,様々なシナリオ分布下でのクレーター検出の領域適応性を向上できることが示された。
論文参考訳（メタデータ） (2023-12-11T07:16:49Z)
Implicit neural representation for change detection [15.741202788959075]
点雲の変化を検出する最も一般的なアプローチは、教師付き手法に基づいている。 Inlicit Neural Representation (INR) for continuous shape reconstruction と Gaussian Mixture Model for categorising change の2つのコンポーネントからなる教師なしアプローチを提案する。本手法を都市スプロールのためのシミュレーションLiDAR点雲からなるベンチマークデータセットに適用する。
論文参考訳（メタデータ） (2023-07-28T09:26:00Z)
Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。 SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文参考訳（メタデータ） (2021-12-12T06:11:16Z)
Enhancing Prototypical Few-Shot Learning by Leveraging the Local-Level Strategy [75.63022284445945]
既存の作業では、ローカルレベルの機能をすべて混ぜることで、イメージレベルの機能に基づいた、いくつかのショットモデルを構築することがよくあります。 a) 基地と新規カテゴリーの識別的位置バイアスを回避するための地域非依存のトレーニング戦略,(b) 地域レベルの特徴の正確な比較を捉えるための新しい地域レベルの類似度尺度を提案する。
論文参考訳（メタデータ） (2021-11-08T08:45:15Z)
Domain Adaptive Semantic Segmentation with Regional Contrastive Consistency Regularization [19.279884432843822]
本稿では,領域適応型セマンティックセマンティックセグメンテーションのための局所コントラスト整合正規化(RCCR)と呼ばれる,新しいエンドツーエンドのトレーニング可能なアプローチを提案する。私たちの中核となる考え方は、異なる画像の同じ位置から抽出された類似の地域的特徴を取り除き、その一方、2つの画像の異なる位置から特徴を分離することです。
論文参考訳（メタデータ） (2021-10-11T11:45:00Z)
Hierarchical Deep CNN Feature Set-Based Representation Learning for Robust Cross-Resolution Face Recognition [59.29808528182607]
クロスリゾリューション顔認識(CRFR)は、インテリジェントな監視およびバイオメトリックフォレンジックにおいて重要である。既存の浅層学習と深層学習に基づく手法は、HR-LR対を共同特徴空間にマッピングすることに焦点を当てている。本研究では,多レベル深層畳み込みニューラルネットワーク(CNN)の機能を完全に活用し,堅牢なCRFRを実現することを目的とする。
論文参考訳（メタデータ） (2021-03-25T14:03:42Z)
Contradictory Structure Learning for Semi-supervised Domain Adaptation [67.89665267469053]
現在の逆順応法は、クロスドメインの特徴を整列させようとする。 1)条件分布ミスマッチ、2)決定境界のソース領域へのバイアス。本稿では,対向構造の学習を統一することで,半教師付きドメイン適応のための新しいフレームワークを提案する。
論文参考訳（メタデータ） (2020-02-06T22:58:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。