論文の概要: Visible Feature Guidance for Crowd Pedestrian Detection
- arxiv url: http://arxiv.org/abs/2008.09993v2
- Date: Wed, 16 Sep 2020 11:23:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-26 03:02:35.871555
- Title: Visible Feature Guidance for Crowd Pedestrian Detection
- Title(参考訳): 群衆歩行者検出のための可視的特徴ガイダンス
- Authors: Zhida Huang, Kaiyu Yue, Jiangfan Deng, Feng Zhou
- Abstract要約: トレーニングと推論の両方に対して,可視的特徴ガイダンス(VFG)を提案する。
トレーニング中、可視的特徴を取り入れて、可視的有界箱と完全有界箱の同時出力を抑える。
次に,視覚的バウンディングボックス上でのみNMSを実行し,推論において最も適したフルボックスを実現する。
- 参考スコア(独自算出の注目度): 12.8128512764041
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Heavy occlusion and dense gathering in crowd scene make pedestrian detection
become a challenging problem, because it's difficult to guess a precise full
bounding box according to the invisible human part. To crack this nut, we
propose a mechanism called Visible Feature Guidance (VFG) for both training and
inference. During training, we adopt visible feature to regress the
simultaneous outputs of visible bounding box and full bounding box. Then we
perform NMS only on visible bounding boxes to achieve the best fitting full box
in inference. This manner can alleviate the incapable influence brought by NMS
in crowd scene and make full bounding box more precisely. Furthermore, in order
to ease feature association in the post application process, such as pedestrian
tracking, we apply Hungarian algorithm to associate parts for a human instance.
Our proposed method can stably bring about 2~3% improvements in mAP and AP50
for both two-stage and one-stage detector. It's also more effective for MR-2
especially with the stricter IoU. Experiments on Crowdhuman, Cityperson,
Caltech and KITTI datasets show that visible feature guidance can help detector
achieve promisingly better performances. Moreover, parts association produces a
strong benchmark on Crowdhuman for the vision community.
- Abstract(参考訳): 目立たない人間の部分に応じて、正確なフルバウンディングボックスを推測することは難しいため、群衆シーンの激しい閉塞と密集した集まりは歩行者検出を困難な問題にしています。
そこで本研究では,VFG(Visible Feature Guidance, Visible Feature Guidance)と呼ばれるメカニズムを提案する。
訓練中,可視的特徴を用いて可視的境界ボックスとフルバウンディングボックスの同時出力をレグレッションする。
次に,視覚的バウンディングボックス上でのみNMSを実行し,推論において最高の適合フルボックスを実現する。
この方法は、群衆シーンにおけるNMSの影響を緩和し、フルバウンディングボックスをより正確にすることができる。
さらに,歩行者追跡などのポスト・アプリケーション・プロセスにおける特徴連想を緩和するために,ハンガリーのアルゴリズムを人間インスタンスのアソシエイト部品に適用する。
提案手法は,2段検出器と1段検出器の両方において,mAPおよびAP50の約2~3%の改善を安定的に得ることができる。
特に厳格なIoUではMR-2の方が有効です。
Crowd Human、Cityperson、Caltech、KITTIのデータセットに関する実験は、可視的特徴ガイダンスが検出者にとって有望なパフォーマンスを達成するのに役立つことを示している。
さらに、parts associationは、ビジョンコミュニティのためのcrowdhumanに関する強力なベンチマークを作成している。
関連論文リスト
- Occlusion-Aware Detection and Re-ID Calibrated Network for Multi-Object
Tracking [38.36872739816151]
検出器内のOAA(Occlusion-Aware Attention)モジュールは、隠蔽された背景領域を抑えながらオブジェクトの特徴を強調する。
OAAは、隠蔽される可能性のある物体の検出器を強化する変調器として機能する。
最適輸送問題に基づくRe-ID埋め込みマッチングブロックを設計する。
論文 参考訳(メタデータ) (2023-08-30T06:56:53Z) - An Effective Motion-Centric Paradigm for 3D Single Object Tracking in
Point Clouds [50.19288542498838]
LiDARポイントクラウド(LiDAR SOT)における3Dシングルオブジェクトトラッキングは、自動運転において重要な役割を果たす。
現在のアプローチはすべて、外観マッチングに基づくシームズパラダイムに従っている。
我々は新たな視点からLiDAR SOTを扱うための動き中心のパラダイムを導入する。
論文 参考訳(メタデータ) (2023-03-21T17:28:44Z) - Multi-view Tracking Using Weakly Supervised Human Motion Prediction [60.972708589814125]
さらに効果的なアプローチは、時間とともに人々の動きを予測し、それらから個々のフレームにおける人々の存在を推定することである、と我々は主張する。
これにより、時間とともに、また1つの時間フレームのビューにわたって一貫性を強制できる。
PETS2009およびWILDTRACKデータセットに対する我々のアプローチを検証するとともに、最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-10-19T17:58:23Z) - STCrowd: A Multimodal Dataset for Pedestrian Perception in Crowded
Scenes [78.95447086305381]
3D空間における歩行者の正確な検出と追跡は、回転、ポーズ、スケールの大きなバリエーションのために困難である。
既存のベンチマークは2Dアノテーションのみを提供するか、あるいは低密度の歩行者分布を持つ限定的な3Dアノテーションを持つ。
混み合ったシナリオにおける歩行者認識アルゴリズムをよりよく評価するために,大規模なマルチモーダルデータセットSTCrowdを導入する。
論文 参考訳(メタデータ) (2022-04-03T08:26:07Z) - Exploring Visual Context for Weakly Supervised Person Search [155.46727990750227]
人探索は、歩行者の検出と人物の再識別を共同で扱う、困難なタスクとして最近登場した。
既存のアプローチは、バウンディングボックスとIDアノテーションの両方が利用可能な完全に教師付き設定に従っている。
本稿では,ボックスアノテーションのみを用いた弱教師付き人物検索について実験的に考察する。
論文 参考訳(メタデータ) (2021-06-19T14:47:13Z) - DETR for Crowd Pedestrian Detection [114.00860636622949]
提案した検出器PED(Pedestrian End-to-end Detector)は、CityPersonsとCrowdHumanの以前のEDとFaster-RCNNの両方より優れている。
また、最先端の歩行者検出手法と同等の性能を達成している。
論文 参考訳(メタデータ) (2020-12-12T11:02:05Z) - Mutual-Supervised Feature Modulation Network for Occluded Pedestrian
Detection [10.497367073305806]
そこで本稿では,閉鎖型歩行者検出をより効果的に扱うために,Multual-Supervised Feature Modulation (MSFM) ネットワークを提案する。
MSFMモジュールは、同じ歩行者に対応するフルボディボックスと可視ボディボックスの類似度損失を算出する。
提案手法は,2つの課題のある歩行者データセット上での他の最先端手法と比較して,優れた性能を実現する。
論文 参考訳(メタデータ) (2020-10-21T03:42:22Z) - Dense Scene Multiple Object Tracking with Box-Plane Matching [73.54369833671772]
マルチオブジェクトトラッキング(MOT)はコンピュータビジョンにおいて重要なタスクである。
密集したシーンにおけるMOT性能を改善するために,Box-Plane Matching (BPM)法を提案する。
3つのモジュールの有効性により、ACM MM Grand Challenge HiEve 2020において、私たちのチームはトラック1のリーダーボードで1位を獲得しました。
論文 参考訳(メタデータ) (2020-07-30T16:39:22Z) - NMS by Representative Region: Towards Crowded Pedestrian Detection by
Proposal Pairing [25.050500817717108]
歩行者間の重閉塞は、標準的非最大抑圧(NMS)に大きな課題を課す
本稿では,非閉塞な可視部分を活用するために,多くの偽陽性を伴わずに冗長なボックスを効果的に除去する,新しい代表領域NMS手法を提案する。
CrowdHumanとCityPersonsのベンチマーク実験は、混雑した状況下での歩行者検出に対する提案手法の有効性を十分に検証している。
論文 参考訳(メタデータ) (2020-03-28T06:33:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。