論文の概要: Density-based Object Detection in Crowded Scenes
- arxiv url: http://arxiv.org/abs/2504.09819v1
- Date: Mon, 14 Apr 2025 02:41:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-15 16:51:49.948229
- Title: Density-based Object Detection in Crowded Scenes
- Title(参考訳): 群集シーンにおける密度に基づく物体検出
- Authors: Chenyang Zhao, Jia Wan, Antoni B. Chan,
- Abstract要約: 密度誘導型アンカー(DGA)と密度誘導型NMS(DG-NMS)を提案する。
DGAは最適なアンカー割り当てとリウィーリング、および適応的なNMSを計算する。
Citypersonsデータセットを用いたCrowdHumanデータセットの挑戦実験により、提案した密度誘導検出器は、混雑に対して有効で堅牢であることが示された。
- 参考スコア(独自算出の注目度): 54.037103707572136
- License:
- Abstract: Compared with the generic scenes, crowded scenes contain highly-overlapped instances, which result in: 1) more ambiguous anchors during training of object detectors, and 2) more predictions are likely to be mistakenly suppressed in post-processing during inference. To address these problems, we propose two new strategies, density-guided anchors (DGA) and density-guided NMS (DG-NMS), which uses object density maps to jointly compute optimal anchor assignments and reweighing, as well as an adaptive NMS. Concretely, based on an unbalanced optimal transport (UOT) problem, the density owned by each ground-truth object is transported to each anchor position at a minimal transport cost. And density on anchors comprises an instance-specific density distribution, from which DGA decodes the optimal anchor assignment and re-weighting strategy. Meanwhile, DG-NMS utilizes the predicted density map to adaptively adjust the NMS threshold to reduce mistaken suppressions. In the UOT, a novel overlap-aware transport cost is specifically designed for ambiguous anchors caused by overlapped neighboring objects. Extensive experiments on the challenging CrowdHuman dataset with Citypersons dataset demonstrate that our proposed density-guided detector is effective and robust to crowdedness. The code and pre-trained models will be made available later.
- Abstract(参考訳): 一般的な場面と比較すると、密集した場面は重なりがちな場面があり、結果として次のようになる。
1)物体検出器の訓練中にさらにあいまいなアンカー、及び
2) 推論中の後処理において, 予測が誤って抑制される可能性が示唆された。
これらの問題に対処するために、オブジェクト密度マップを用いて最適なアンカー割り当てとリウィーリングを共同で計算する2つの新しい戦略、密度誘導アンカー(DGA)と密度誘導NMS(DG-NMS)を提案する。
具体的には、不均衡な最適輸送(UOT)問題に基づいて、各接地トラス物体が所有する密度を最小の輸送コストで各アンカー位置へ輸送する。
そして、アンカー上の密度はインスタンス固有の密度分布を含み、そこからDGAは最適なアンカー割り当てと再重み付け戦略をデコードする。
一方、DG-NMSは予測密度マップを用いてNMS閾値を適応的に調整し、誤った抑制を減らす。
UOTでは、隣接するオブジェクトの重複に起因するあいまいなアンカーに対して、新しい重複認識輸送コストが特別に設計されている。
Citypersonsデータセットを用いたCrowdHumanデータセットの大規模な実験により、提案した密度誘導検出器は、混雑に対して有効で堅牢であることが示された。
コードと事前訓練されたモデルは、後で利用可能になる。
関連論文リスト
- Towards the Uncharted: Density-Descending Feature Perturbation for Semi-supervised Semantic Segmentation [51.66997548477913]
本稿では,DDFP(Dedentity-Descending Feature Perturbation)という特徴レベルの一貫性学習フレームワークを提案する。
半教師付き学習における低密度分離仮定にインスパイアされた私たちの重要な洞察は、特徴密度はセグメンテーション分類器が探索する最も有望な方向の光を放つことができるということである。
提案したDFFPは、機能レベルの摂動に関する他の設計よりも優れており、Pascal VOCとCityscapesのデータセット上でのアートパフォーマンスの状態を示している。
論文 参考訳(メタデータ) (2024-03-11T06:59:05Z) - Semantic Segmentation on 3D Point Clouds with High Density Variations [44.467561618769714]
HDVNetにはネストしたエンコーダとデコーダの経路があり、それぞれが特定の点密度範囲を扱う。
入力密度の変動を効果的に処理することにより、HDVNetは、非一貫性密度の実点雲上でのセグメンテーション精度において最先端のモデルより優れる。
論文 参考訳(メタデータ) (2023-07-04T05:44:13Z) - HDNet: A Hierarchically Decoupled Network for Crowd Counting [11.530565995318696]
本稿では,階層型分離ネットワーク(HDNet)を提案する。
HDNetは、いくつかの人気のあるカウントベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-12-12T06:01:26Z) - Semi-supervised Crowd Counting via Density Agency [57.3635501421658]
我々は、学習可能な補助構造、すなわち密度エージェンシーを構築し、認識された前景の地域特徴を対応する密度サブクラスに近づける。
第2に,バックボーン特徴抽出器を統合するために,密度誘導型コントラスト学習損失を提案する。
第3に,前景の機能を改良するためにトランス構造を用いて回帰ヘッドを構築する。
論文 参考訳(メタデータ) (2022-09-07T06:34:00Z) - Efficient LiDAR Point Cloud Geometry Compression Through Neighborhood
Point Attention [25.054578678654796]
この研究は、それらに取り組むための近隣点注意(NPA)を示唆している。
まず、k近辺(kNN)を用いて、適応的な地域地区を構築する。
そして、この地区内の情報を動的に集約するために自己認識機構を利用する。
論文 参考訳(メタデータ) (2022-08-26T10:44:30Z) - Cascaded Residual Density Network for Crowd Counting [63.714719914701014]
本研究では, 群衆数に対する高品質な密度マップを高精度に作成するために, 粗大なアプローチで新しいカスケード残差密度ネットワーク(CRDNet)を提案する。
新たな局所的カウント損失が示され、群衆カウントの精度が向上する。
論文 参考訳(メタデータ) (2021-07-29T03:07:11Z) - Tracking-by-Counting: Using Network Flows on Crowd Density Maps for
Tracking Multiple Targets [96.98888948518815]
State-of-the-art multi-object tracking(MOT)法は、トラッキング・バイ・検出のパラダイムに従っている。
混み合ったシーンに適したMOTパラダイムであるトラッキング・バイ・カウントを提案する。
論文 参考訳(メタデータ) (2020-07-18T19:51:53Z) - Density-Aware Graph for Deep Semi-Supervised Visual Recognition [102.9484812869054]
半教師付き学習(SSL)は、視覚認識のためのディープニューラルネットワークの一般化能力を改善するために広く研究されている。
本稿では,周辺情報を容易に活用できる新しい密度対応グラフを構築することでSSL問題を解決することを提案する。
論文 参考訳(メタデータ) (2020-03-30T02:52:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。