論文の概要: Generalizable Pedestrian Detection: The Elephant In The Room
- arxiv url: http://arxiv.org/abs/2003.08799v7
- Date: Wed, 9 Dec 2020 08:56:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-22 04:34:33.084390
- Title: Generalizable Pedestrian Detection: The Elephant In The Room
- Title(参考訳): 一般化可能な歩行者検出:部屋のエレファント
- Authors: Irtiza Hasan, Shengcai Liao, Jinpeng Li, Saad Ullah Akram, and Ling
Shao
- Abstract要約: 既存の最先端の歩行者検出器は、同じデータセット上でトレーニングやテストを行う際には、非常によく機能するが、データセット間の評価では、十分に一般化されていない。
ウェブをクロールすることで収集される多様で高密度なデータセットは、歩行者検出のための事前学習の効率的な情報源であることを示す。
- 参考スコア(独自算出の注目度): 82.37430109152383
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pedestrian detection is used in many vision based applications ranging from
video surveillance to autonomous driving. Despite achieving high performance,
it is still largely unknown how well existing detectors generalize to unseen
data. This is important because a practical detector should be ready to use in
various scenarios in applications. To this end, we conduct a comprehensive
study in this paper, using a general principle of direct cross-dataset
evaluation. Through this study, we find that existing state-of-the-art
pedestrian detectors, though perform quite well when trained and tested on the
same dataset, generalize poorly in cross dataset evaluation. We demonstrate
that there are two reasons for this trend. Firstly, their designs (e.g. anchor
settings) may be biased towards popular benchmarks in the traditional
single-dataset training and test pipeline, but as a result largely limit their
generalization capability. Secondly, the training source is generally not dense
in pedestrians and diverse in scenarios. Under direct cross-dataset evaluation,
surprisingly, we find that a general purpose object detector, without
pedestrian-tailored adaptation in design, generalizes much better compared to
existing state-of-the-art pedestrian detectors. Furthermore, we illustrate that
diverse and dense datasets, collected by crawling the web, serve to be an
efficient source of pre-training for pedestrian detection. Accordingly, we
propose a progressive training pipeline and find that it works well for
autonomous-driving oriented pedestrian detection. Consequently, the study
conducted in this paper suggests that more emphasis should be put on
cross-dataset evaluation for the future design of generalizable pedestrian
detectors. Code and models can be accessed at
https://github.com/hasanirtiza/Pedestron.
- Abstract(参考訳): 歩行者検出は、ビデオ監視から自動運転まで、多くのビジョンベースのアプリケーションで使われている。
高い性能を達成しているにもかかわらず、既存の検出器がいかによく検出されていないデータに一般化しているかは、いまだにほとんど分かっていない。
これは、実用的な検出器がアプリケーションの様々なシナリオで使えるようにする必要があるためである。
そこで本稿では,直交データセット評価の一般的な原理を用いて,包括的研究を行う。
本研究では,既存の歩行者検出装置が,同じデータセット上でトレーニングやテストを行う場合,非常によく機能するが,クロスデータセットの評価が不十分であることを示す。
この傾向には2つの理由があることを示す。
第一に、その設計(例えばアンカー設定)は、従来の単一データセットのトレーニングとテストパイプラインで人気のあるベンチマークに偏っているかもしれないが、結果として、その一般化能力はほとんど制限される。
第2に、トレーニングソースは一般的に歩行者では密集せず、シナリオでは多様である。
直接のクロスデータセット評価では、意外なことに、歩行者に適応しない汎用の物体検出器は、既存の最先端の歩行者検出器と比較してはるかによく一般化されている。
さらに, web をクロールして収集した多様で密集したデータセットが,歩行者検出のための事前学習の効率的な情報源であることを示す。
そこで本研究では,プログレッシブトレーニングパイプラインを提案し,自動運転指向の歩行者検出に有効であることを示す。
そこで,本論文では,歩行者検知器の汎用設計に向けてのクロスデータセット評価に重点を置く必要があることを示唆する。
コードとモデルはhttps://github.com/hasanirtiza/pedestronからアクセスできる。
関連論文リスト
- Mean Height Aided Post-Processing for Pedestrian Detection [9.654938705603312]
本稿では,歩行者データセットの視点効果を例として捉え,ポストプロセッシングにおける平均高さ支援抑制法を提案する。
提案手法は実装が容易で,プラグアンドプレイである。
平均身長が特定の検出器で抑制されたことの組み合わせは、カルテックとシティパーソンズのデータセットで最先端の歩行者検出器を上回っている。
論文 参考訳(メタデータ) (2024-08-24T18:20:47Z) - Robust Pedestrian Detection via Constructing Versatile Pedestrian Knowledge Bank [51.66174565170112]
本稿では,多目的な歩行者知識銀行を構築するための新しいアプローチを提案する。
我々は大規模な事前訓練モデルから歩行者の知識を抽出する。
次に、ほとんどの代表的特徴を定量化し、背景のシーンと区別できるように指導することで、それらをキュレートする。
論文 参考訳(メタデータ) (2024-04-30T07:01:05Z) - Unsupervised Domain Adaptation for Self-Driving from Past Traversal
Features [69.47588461101925]
本研究では,新しい運転環境に3次元物体検出器を適応させる手法を提案する。
提案手法は,空間的量子化履歴特徴を用いたLiDARに基づく検出モデルを強化する。
実世界のデータセットの実験では、大幅な改善が示されている。
論文 参考訳(メタデータ) (2023-09-21T15:00:31Z) - Pedestrian Detection: Domain Generalization, CNNs, Transformers and
Beyond [82.37430109152383]
その結果、現在の歩行者検知器は、クロスデータセット評価において、たとえ小さな領域シフトであっても処理が不十分であることがわかった。
限定的な一般化は、その方法と現在のデータ源の2つの主要な要因に帰着する。
本稿では、一般化を改善する進歩的な微調整戦略を提案する。
論文 参考訳(メタデータ) (2022-01-10T06:00:26Z) - Self-supervised Audiovisual Representation Learning for Remote Sensing Data [96.23611272637943]
遠隔センシングにおける深層ニューラルネットワークの事前学習のための自己教師型アプローチを提案する。
ジオタグ付きオーディオ記録とリモートセンシングの対応を利用して、これは完全にラベルなしの方法で行われる。
提案手法は,既存のリモートセンシング画像の事前学習方法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-08-02T07:50:50Z) - Benchmarking Intent Detection for Task-Oriented Dialog Systems [6.54201796167054]
Intent Detectionは、ユーザのテキスト入力の意図を予測してユーザタスクを達成する、現代の目標指向のダイアログシステムの鍵となるコンポーネントである。
堅牢で正確な意図検出モデルの設計には3つの大きな課題がある。
その結果,watson assistantの意図検出モデルは,他の商用ソリューションよりも優れていることがわかった。
論文 参考訳(メタデータ) (2020-12-07T18:58:57Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - RetinaTrack: Online Single Stage Joint Detection and Tracking [22.351109024452462]
両タスクがミッションクリティカルな自律運転におけるトラッキング・バイ・検出パラダイムに注目した。
本稿では、一般的な単一ステージのRetinaNetアプローチを改良したRetinaTrackと呼ばれる、概念的にシンプルで効率的な検出と追跡のジョイントモデルを提案する。
論文 参考訳(メタデータ) (2020-03-30T23:46:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。