論文の概要: DETR for Crowd Pedestrian Detection
- arxiv url: http://arxiv.org/abs/2012.06785v3
- Date: Thu, 18 Feb 2021 09:46:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-10 08:00:17.623907
- Title: DETR for Crowd Pedestrian Detection
- Title(参考訳): 群衆歩行者検出のためのDETR
- Authors: Matthieu Lin and Chuming Li and Xingyuan Bu and Ming Sun and Chen Lin
and Junjie Yan and Wanli Ouyang and Zhidong Deng
- Abstract要約: 提案した検出器PED(Pedestrian End-to-end Detector)は、CityPersonsとCrowdHumanの以前のEDとFaster-RCNNの両方より優れている。
また、最先端の歩行者検出手法と同等の性能を達成している。
- 参考スコア(独自算出の注目度): 114.00860636622949
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Pedestrian detection in crowd scenes poses a challenging problem due to the
heuristic defined mapping from anchors to pedestrians and the conflict between
NMS and highly overlapped pedestrians. The recently proposed end-to-end
detectors(ED), DETR and deformable DETR, replace hand designed components such
as NMS and anchors using the transformer architecture, which gets rid of
duplicate predictions by computing all pairwise interactions between queries.
Inspired by these works, we explore their performance on crowd pedestrian
detection. Surprisingly, compared to Faster-RCNN with FPN, the results are
opposite to those obtained on COCO. Furthermore, the bipartite match of ED
harms the training efficiency due to the large ground truth number in crowd
scenes. In this work, we identify the underlying motives driving ED's poor
performance and propose a new decoder to address them. Moreover, we design a
mechanism to leverage the less occluded visible parts of pedestrian
specifically for ED, and achieve further improvements. A faster bipartite match
algorithm is also introduced to make ED training on crowd dataset more
practical. The proposed detector PED(Pedestrian End-to-end Detector)
outperforms both previous EDs and the baseline Faster-RCNN on CityPersons and
CrowdHuman. It also achieves comparable performance with state-of-the-art
pedestrian detection methods. Code will be released soon.
- Abstract(参考訳): 歩行者の群集シーンにおける歩行者検出は、アンカーから歩行者へのヒューリスティックなマッピングと、NMSと高度に重なる歩行者の衝突により、困難な問題を引き起こす。
最近提案されたend-to-end detectors(ed)、detr、deformable detrは、クエリ間のすべてのペアワイズインタラクションを計算して重複予測を排除するtransformerアーキテクチャを使用して、nmsやアンカーといった手設計のコンポーネントを置き換える。
これらの研究に触発されて,観衆の歩行者検出におけるパフォーマンスについて検討する。
驚くべきことに、FPNのFaster-RCNNと比較すると、COCOで得られたものとは逆である。
さらに, エドの2部作一致は, 群衆シーンにおける地上真実数が大きいため, トレーニング効率を損なう。
本研究では,EDの性能低下の原因を解明し,それに対応するためのデコーダを提案する。
さらに, 歩行者の目に見える部分の可視性を, ed専用に活用する機構を考案し, さらなる改善を図る。
より高速な二部マッチングアルゴリズムも導入され、群衆データセットでのEDトレーニングをより実用的なものにしている。
提案した検出器PED(Pedestrian End-to-end Detector)は、CityPersonsとCrowdHumanの以前のEDとFaster-RCNNの両方より優れている。
また、最先端の歩行者検出手法と同等の性能を発揮する。
コードはまもなくリリースされる。
関連論文リスト
- A PST Algorithm for FPs Suppression in Two-stage CNN Detection Methods [2.288618928064061]
本稿では,歩行者と歩行者以外のサンプルを識別する2段階CNN検出手法の学習を支援するために,歩行者に敏感な学習アルゴリズムを提案する。
提案アルゴリズムの助けを借りて,より小型で高精度なメトロ旅客検出器であるMetroNextの検出精度がさらに向上した。
論文 参考訳(メタデータ) (2024-05-24T08:26:14Z) - PSDiff: Diffusion Model for Person Search with Iterative and
Collaborative Refinement [59.6260680005195]
本稿では,拡散モデルであるPSDiffに基づく新しいPerson Searchフレームワークを提案する。
PSDiffは、ノイズの多いボックスとReID埋め込みから地上の真実へのデュアルデノケーションプロセスとして検索する人を定式化する。
新しいパラダイムに従って、我々は、反復的かつ協調的な方法で検出とReIDサブタスクを最適化する新しいコラボレーティブ・デノナイジング・レイヤ(CDL)を設計する。
論文 参考訳(メタデータ) (2023-09-20T08:16:39Z) - DiffTAD: Temporal Action Detection with Proposal Denoising Diffusion [137.8749239614528]
そこで我々は,時間的行動検出(TAD)の新しい定式化を提案し,拡散を抑えるDiffTADを提案する。
入力されたランダムな時間的提案を考慮すれば、トリミングされていない長いビデオが与えられたアクションの提案を正確に得ることができる。
論文 参考訳(メタデータ) (2023-03-27T00:40:52Z) - Be Your Own Neighborhood: Detecting Adversarial Example by the
Neighborhood Relations Built on Self-Supervised Learning [64.78972193105443]
本稿では,予測に有効な新しいAE検出フレームワークを提案する。
AEの異常な関係と拡張バージョンを区別して検出を行う。
表現を抽出し、ラベルを予測するために、既製の自己監視学習(SSL)モデルが使用される。
論文 参考訳(メタデータ) (2022-08-31T08:18:44Z) - Variational Pedestrian Detection [33.52588723666144]
変動推定問題として,歩行者検出の特異な視点を定めている。
密集した提案を潜在変数としてモデル化し,歩行者検出のための新規かつ効率的なアルゴリズムを考案する。
また, この手法は2段階検出器に柔軟に適用でき, 顕著な性能向上を実現する。
論文 参考訳(メタデータ) (2021-04-26T08:06:41Z) - Visible Feature Guidance for Crowd Pedestrian Detection [12.8128512764041]
トレーニングと推論の両方に対して,可視的特徴ガイダンス(VFG)を提案する。
トレーニング中、可視的特徴を取り入れて、可視的有界箱と完全有界箱の同時出力を抑える。
次に,視覚的バウンディングボックス上でのみNMSを実行し,推論において最も適したフルボックスを実現する。
論文 参考訳(メタデータ) (2020-08-23T08:52:52Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - NMS by Representative Region: Towards Crowded Pedestrian Detection by
Proposal Pairing [25.050500817717108]
歩行者間の重閉塞は、標準的非最大抑圧(NMS)に大きな課題を課す
本稿では,非閉塞な可視部分を活用するために,多くの偽陽性を伴わずに冗長なボックスを効果的に除去する,新しい代表領域NMS手法を提案する。
CrowdHumanとCityPersonsのベンチマーク実験は、混雑した状況下での歩行者検出に対する提案手法の有効性を十分に検証している。
論文 参考訳(メタデータ) (2020-03-28T06:33:54Z) - Detection in Crowded Scenes: One Proposal, Multiple Predictions [79.28850977968833]
混み合ったシーンにおける高過度なインスタンスを検出することを目的とした,提案手法によるオブジェクト検出手法を提案する。
このアプローチの鍵は、各提案が以前の提案ベースのフレームワークの1つではなく、関連したインスタンスのセットを予測できるようにすることです。
我々の検出器は、CrowdHumanデータセットの挑戦に対して4.9%のAPゲインを得ることができ、CityPersonsデータセットでは1.0%$textMR-2$の改善がある。
論文 参考訳(メタデータ) (2020-03-20T09:48:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。