論文の概要: From Handcrafted to Deep Features for Pedestrian Detection: A Survey
- arxiv url: http://arxiv.org/abs/2010.00456v2
- Date: Wed, 12 May 2021 03:59:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-12 08:19:31.686399
- Title: From Handcrafted to Deep Features for Pedestrian Detection: A Survey
- Title(参考訳): 歩行者検出のための手技から深い機能へ:調査
- Authors: Jiale Cao, Yanwei Pang, Jin Xie, Fahad Shahbaz Khan, Ling Shao
- Abstract要約: 歩行者検出はコンピュータビジョンにおいて重要であるが難しい問題である。
過去10年間で、手作りの機能と深い機能によって、大幅な改善が見られた。
単スペクトル歩行者検出に加えて,多スペクトル歩行者検出も検討した。
- 参考スコア(独自算出の注目度): 148.35460817092908
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pedestrian detection is an important but challenging problem in computer
vision, especially in human-centric tasks. Over the past decade, significant
improvement has been witnessed with the help of handcrafted features and deep
features. Here we present a comprehensive survey on recent advances in
pedestrian detection. First, we provide a detailed review of single-spectral
pedestrian detection that includes handcrafted features based methods and deep
features based approaches. For handcrafted features based methods, we present
an extensive review of approaches and find that handcrafted features with large
freedom degrees in shape and space have better performance. In the case of deep
features based approaches, we split them into pure CNN based methods and those
employing both handcrafted and CNN based features. We give the statistical
analysis and tendency of these methods, where feature enhanced, part-aware, and
post-processing methods have attracted main attention. In addition to
single-spectral pedestrian detection, we also review multi-spectral pedestrian
detection, which provides more robust features for illumination variance.
Furthermore, we introduce some related datasets and evaluation metrics, and
compare some representative methods. We conclude this survey by emphasizing
open problems that need to be addressed and highlighting various future
directions. Researchers can track an up-to-date list at
https://github.com/JialeCao001/PedSurvey.
- Abstract(参考訳): 歩行者検出はコンピュータビジョン、特に人間中心のタスクにおいて重要であるが難しい問題である。
過去10年間で、手作りの機能と深い機能によって、大幅な改善が見られた。
本稿では,歩行者検出の最近の進歩に関する包括的調査を行う。
まず,手作りの特徴に基づく手法と深い特徴に基づくアプローチを含む,単一スペクトル歩行者検出の詳細なレビューを行う。
手作りの特徴に基づく手法について,提案手法の広範なレビューを行い,形状や空間の自由度が大きい手作り特徴の方が優れた性能を有することを示す。
深い特徴に基づくアプローチでは、それらを純粋なCNNベースの方法と、手作りとCNNベースの両方の機能を使用する方法に分割する。
本稿では,特徴の強化,部分認識,後処理が注目されるこれらの手法の統計的分析と傾向について述べる。
また, 単スペクトル歩行者検出に加えて, 多スペクトル歩行者検出も検討した。
さらに,関連するデータセットと評価指標を紹介し,いくつかの代表的な手法を比較した。
この調査は,解決すべきオープンな問題を強調し,今後の方向性を強調することで結論づける。
研究者は最新リストをhttps://github.com/jialecao001/pedsurveyで追跡できる。
関連論文リスト
- Underwater Object Detection in the Era of Artificial Intelligence: Current, Challenge, and Future [119.88454942558485]
水中物体検出(UOD)は、水中の画像やビデオ中の物体を識別し、ローカライズすることを目的としている。
近年、人工知能(AI)に基づく手法、特に深層学習法は、UODにおいて有望な性能を示している。
論文 参考訳(メタデータ) (2024-10-08T00:25:33Z) - Imagine the Unseen: Occluded Pedestrian Detection via Adversarial Feature Completion [31.488897675973657]
そこで本稿では,歩行者の特徴を異なる閉塞パターンに整合させるため,閉鎖領域の特徴を完備する。
完成した特徴と実際の完全に見える特徴とのギャップを狭めるために,逆学習法を提案する。
本稿では,CityPersons,Caltech,CrowdHumanの各データセットに関する実験結果について報告する。
論文 参考訳(メタデータ) (2024-05-02T14:20:20Z) - Robust Pedestrian Detection via Constructing Versatile Pedestrian Knowledge Bank [51.66174565170112]
本稿では,多目的な歩行者知識銀行を構築するための新しいアプローチを提案する。
我々は大規模な事前訓練モデルから歩行者の知識を抽出する。
次に、ほとんどの代表的特徴を定量化し、背景のシーンと区別できるように指導することで、それらをキュレートする。
論文 参考訳(メタデータ) (2024-04-30T07:01:05Z) - Cascaded information enhancement and cross-modal attention feature
fusion for multispectral pedestrian detection [6.167053377021009]
本稿では、主にカスケード情報強調モジュールと、モーダル間注目機能融合モジュールからなる多スペクトル歩行者検出アルゴリズムを提案する。
提案手法は,提案手法と比較して,歩行者のミス率と歩行者検出ボックスの精度が低いことを示す。
論文 参考訳(メタデータ) (2023-02-17T03:30:00Z) - Revisiting Crowd Counting: State-of-the-art, Trends, and Future
Perspectives [3.2575001434344286]
群衆カウントは公共の場での状況認識に有効なツールである。
最先端の性能を達成するためのディープラーニング手法が開発されている。
論文 参考訳(メタデータ) (2022-09-14T08:51:02Z) - Pedestrian Detection: Domain Generalization, CNNs, Transformers and
Beyond [82.37430109152383]
その結果、現在の歩行者検知器は、クロスデータセット評価において、たとえ小さな領域シフトであっても処理が不十分であることがわかった。
限定的な一般化は、その方法と現在のデータ源の2つの主要な要因に帰着する。
本稿では、一般化を改善する進歩的な微調整戦略を提案する。
論文 参考訳(メタデータ) (2022-01-10T06:00:26Z) - Probabilistic and Geometric Depth: Detecting Objects in Perspective [78.00922683083776]
3次元物体検出は、運転支援システムなどの様々な実用用途で必要とされる重要な機能である。
双眼視やLiDARに頼っている従来の設定に比べて、経済的な解決策として単眼3D検出が注目されているが、それでも満足のいく結果が得られていない。
本稿ではまず,この問題に関する系統的研究を行い,現在の単分子3次元検出問題をインスタンス深度推定問題として単純化できることを考察する。
論文 参考訳(メタデータ) (2021-07-29T16:30:33Z) - Pretrained equivariant features improve unsupervised landmark discovery [69.02115180674885]
我々は、この課題を克服する2段階の教師なしアプローチを、強力なピクセルベースの特徴を初めて学習することによって定式化する。
本手法は,いくつかの難解なランドマーク検出データセットにおいて最先端の結果を生成する。
論文 参考訳(メタデータ) (2021-04-07T05:42:11Z) - A Simple and Effective Self-Supervised Contrastive Learning Framework
for Aspect Detection [15.36713547251997]
UADタスクのための新しいスムーズな自己意識(SSA)モジュールを備えた自己教師付きコントラスト学習フレームワークとアテンションベースモデルを提案する。
提案手法は, 公開されているベンチマークユーザレビューデータセットにおいて, 教師なし, 弱教師付きアプローチよりも優れている。
論文 参考訳(メタデータ) (2020-09-18T22:13:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。