論文の概要: NMS by Representative Region: Towards Crowded Pedestrian Detection by
Proposal Pairing
- arxiv url: http://arxiv.org/abs/2003.12729v2
- Date: Tue, 21 Apr 2020 09:05:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-18 23:46:20.589731
- Title: NMS by Representative Region: Towards Crowded Pedestrian Detection by
Proposal Pairing
- Title(参考訳): 代表地域別nms:提案ペアリングによる混雑歩行者検出に向けて
- Authors: Xin Huang, Zheng Ge, Zequn Jie and Osamu Yoshie
- Abstract要約: 歩行者間の重閉塞は、標準的非最大抑圧(NMS)に大きな課題を課す
本稿では,非閉塞な可視部分を活用するために,多くの偽陽性を伴わずに冗長なボックスを効果的に除去する,新しい代表領域NMS手法を提案する。
CrowdHumanとCityPersonsのベンチマーク実験は、混雑した状況下での歩行者検出に対する提案手法の有効性を十分に検証している。
- 参考スコア(独自算出の注目度): 25.050500817717108
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Although significant progress has been made in pedestrian detection recently,
pedestrian detection in crowded scenes is still challenging. The heavy
occlusion between pedestrians imposes great challenges to the standard
Non-Maximum Suppression (NMS). A relative low threshold of intersection over
union (IoU) leads to missing highly overlapped pedestrians, while a higher one
brings in plenty of false positives. To avoid such a dilemma, this paper
proposes a novel Representative Region NMS approach leveraging the less
occluded visible parts, effectively removing the redundant boxes without
bringing in many false positives. To acquire the visible parts, a novel
Paired-Box Model (PBM) is proposed to simultaneously predict the full and
visible boxes of a pedestrian. The full and visible boxes constitute a pair
serving as the sample unit of the model, thus guaranteeing a strong
correspondence between the two boxes throughout the detection pipeline.
Moreover, convenient feature integration of the two boxes is allowed for the
better performance on both full and visible pedestrian detection tasks.
Experiments on the challenging CrowdHuman and CityPersons benchmarks
sufficiently validate the effectiveness of the proposed approach on pedestrian
detection in the crowded situation.
- Abstract(参考訳): 近年,歩行者検出は大きな進歩を遂げているが,混雑するシーンでの歩行者検出はいまだに困難である。
歩行者間の激しい閉塞は、標準的な非最大抑圧(NMS)に大きな課題を課している。
iou(intersection over union)の相対的に低い閾値は、非常に重複する歩行者の欠落につながる。
このようなジレンマを避けるため,本論文では,非閉塞の可視部分を活用する新しい代表領域NMSアプローチを提案し,多くの偽陽性を伴わずに冗長ボックスを効果的に除去する。
可視部分を取得するために,歩行者のフルボックスと可視ボックスを同時に予測するために,新しいペアボックスモデル(pbm)を提案する。
フルと可視のボックスはモデルのサンプルユニットとして機能するペアを構成するため、検出パイプライン全体を通して2つのボックス間の強い対応が保証される。
さらに、2つのボックスの便利な機能統合は、フルおよび可視の歩行者検出タスクにおいて、より良いパフォーマンスを実現することができる。
CrowdHumanとCityPersonsのベンチマーク実験は、混雑した状況下での歩行者検出に対する提案手法の有効性を十分に検証している。
関連論文リスト
- A PST Algorithm for FPs Suppression in Two-stage CNN Detection Methods [2.288618928064061]
本稿では,歩行者と歩行者以外のサンプルを識別する2段階CNN検出手法の学習を支援するために,歩行者に敏感な学習アルゴリズムを提案する。
提案アルゴリズムの助けを借りて,より小型で高精度なメトロ旅客検出器であるMetroNextの検出精度がさらに向上した。
論文 参考訳(メタデータ) (2024-05-24T08:26:14Z) - PSDiff: Diffusion Model for Person Search with Iterative and
Collaborative Refinement [59.6260680005195]
本稿では,拡散モデルであるPSDiffに基づく新しいPerson Searchフレームワークを提案する。
PSDiffは、ノイズの多いボックスとReID埋め込みから地上の真実へのデュアルデノケーションプロセスとして検索する人を定式化する。
新しいパラダイムに従って、我々は、反復的かつ協調的な方法で検出とReIDサブタスクを最適化する新しいコラボレーティブ・デノナイジング・レイヤ(CDL)を設計する。
論文 参考訳(メタデータ) (2023-09-20T08:16:39Z) - Multi-view Tracking Using Weakly Supervised Human Motion Prediction [60.972708589814125]
さらに効果的なアプローチは、時間とともに人々の動きを予測し、それらから個々のフレームにおける人々の存在を推定することである、と我々は主張する。
これにより、時間とともに、また1つの時間フレームのビューにわたって一貫性を強制できる。
PETS2009およびWILDTRACKデータセットに対する我々のアプローチを検証するとともに、最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-10-19T17:58:23Z) - STCrowd: A Multimodal Dataset for Pedestrian Perception in Crowded
Scenes [78.95447086305381]
3D空間における歩行者の正確な検出と追跡は、回転、ポーズ、スケールの大きなバリエーションのために困難である。
既存のベンチマークは2Dアノテーションのみを提供するか、あるいは低密度の歩行者分布を持つ限定的な3Dアノテーションを持つ。
混み合ったシナリオにおける歩行者認識アルゴリズムをよりよく評価するために,大規模なマルチモーダルデータセットSTCrowdを導入する。
論文 参考訳(メタデータ) (2022-04-03T08:26:07Z) - DETR for Crowd Pedestrian Detection [114.00860636622949]
提案した検出器PED(Pedestrian End-to-end Detector)は、CityPersonsとCrowdHumanの以前のEDとFaster-RCNNの両方より優れている。
また、最先端の歩行者検出手法と同等の性能を達成している。
論文 参考訳(メタデータ) (2020-12-12T11:02:05Z) - Mutual-Supervised Feature Modulation Network for Occluded Pedestrian
Detection [10.497367073305806]
そこで本稿では,閉鎖型歩行者検出をより効果的に扱うために,Multual-Supervised Feature Modulation (MSFM) ネットワークを提案する。
MSFMモジュールは、同じ歩行者に対応するフルボディボックスと可視ボディボックスの類似度損失を算出する。
提案手法は,2つの課題のある歩行者データセット上での他の最先端手法と比較して,優れた性能を実現する。
論文 参考訳(メタデータ) (2020-10-21T03:42:22Z) - Visible Feature Guidance for Crowd Pedestrian Detection [12.8128512764041]
トレーニングと推論の両方に対して,可視的特徴ガイダンス(VFG)を提案する。
トレーニング中、可視的特徴を取り入れて、可視的有界箱と完全有界箱の同時出力を抑える。
次に,視覚的バウンディングボックス上でのみNMSを実行し,推論において最も適したフルボックスを実現する。
論文 参考訳(メタデータ) (2020-08-23T08:52:52Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - Do Not Disturb Me: Person Re-identification Under the Interference of
Other Pedestrians [97.45805377769354]
本稿では,Pedestrian-Interference Suppression Network (PISNet)と呼ばれる新しいディープネットワークを提案する。
PISNetはクエリガイド付アテンションブロック(QGAB)を活用して、クエリのガイダンスの下でギャラリー内のターゲットの機能を強化する。
その結果,提案手法は既存のRe-ID手法に対して良好に動作することがわかった。
論文 参考訳(メタデータ) (2020-08-16T17:45:14Z) - Resisting Crowd Occlusion and Hard Negatives for Pedestrian Detection in
the Wild [36.39830329023875]
群衆と強烈なネガティブはいまだに最先端の歩行者探知機に挑戦している。
これらの課題に対処するために、一般的な地域ベースの検出フレームワークに基づく2つのアプローチを提案する。
Caltech-USAベンチマークとCityPersonsベンチマークで継続的にハイパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2020-05-15T03:47:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。