論文の概要: SADet: Learning An Efficient and Accurate Pedestrian Detector
- arxiv url: http://arxiv.org/abs/2007.13119v1
- Date: Sun, 26 Jul 2020 12:32:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-06 20:03:27.188525
- Title: SADet: Learning An Efficient and Accurate Pedestrian Detector
- Title(参考訳): SADet: 効率的かつ正確な歩行者検出器の学習
- Authors: Chubin Zhuang and Zhen Lei and Stan Z. Li
- Abstract要約: 本稿では,一段検出器の検出パイプラインに対する一連の最適化手法を提案する。
効率的な歩行者検出のための単発アンカーベース検出器(SADet)を形成する。
構造的には単純だが、VGA解像度の画像に対して最先端の結果と20ドルFPSのリアルタイム速度を示す。
- 参考スコア(独自算出の注目度): 68.66857832440897
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Although the anchor-based detectors have taken a big step forward in
pedestrian detection, the overall performance of algorithm still needs further
improvement for practical applications, \emph{e.g.}, a good trade-off between
the accuracy and efficiency. To this end, this paper proposes a series of
systematic optimization strategies for the detection pipeline of one-stage
detector, forming a single shot anchor-based detector (SADet) for efficient and
accurate pedestrian detection, which includes three main improvements. Firstly,
we optimize the sample generation process by assigning soft tags to the outlier
samples to generate semi-positive samples with continuous tag value between $0$
and $1$, which not only produces more valid samples, but also strengthens the
robustness of the model. Secondly, a novel Center-$IoU$ loss is applied as a
new regression loss for bounding box regression, which not only retains the
good characteristics of IoU loss, but also solves some defects of it. Thirdly,
we also design Cosine-NMS for the postprocess of predicted bounding boxes, and
further propose adaptive anchor matching to enable the model to adaptively
match the anchor boxes to full or visible bounding boxes according to the
degree of occlusion, making the NMS and anchor matching algorithms more
suitable for occluded pedestrian detection. Though structurally simple, it
presents state-of-the-art result and real-time speed of $20$ FPS for
VGA-resolution images ($640 \times 480$) on challenging pedestrian detection
benchmarks, i.e., CityPersons, Caltech, and human detection benchmark
CrowdHuman, leading to a new attractive pedestrian detector.
- Abstract(参考訳): アンカーベースの検出器は、歩行者検出において大きな進歩を遂げているが、アルゴリズムの全体的な性能は、精度と効率の良好なトレードオフである、実用的な応用のためにさらに改善する必要がある。
そこで本研究では,一段階検出器の検出パイプラインにおける一連の系統的最適化戦略を提案し,3つの主な改善点を含む,効率的かつ正確な歩行者検出のためのシングルショットアンカー型検出器(sadet)を開発した。
まず, ソフトタグを外付けサンプルに割り当ててサンプル生成プロセスを最適化し, 連続的なタグ値が0ドルから1ドルの間で半正のサンプルを生成し, より有効なサンプルを生成するだけでなく, モデルの堅牢性を高める。
第二に、新しいCenter-$IoU$損失は、境界ボックス回帰に対する新たな回帰損失として適用され、IoU損失の優れた特性を保持するだけでなく、いくつかの欠陥も解決する。
第3に,予測された境界ボックスのポストプロセスのためのコサインnmを設計,さらに,モデルがアンカーボックスをオクルージョンの程度に応じてフルまたは可視境界ボックスに適応的にマッチングできるように適応アンカーマッチングを提案し,nmsとアンカーマッチングアルゴリズムが歩行者検出に適するようにした。
構造的には単純だが、VGA解像度画像の最先端結果と20ドルFPS(約2万2000円)のリアルタイムスピードを、挑戦的な歩行者検出ベンチマーク、すなわちCityPersons、Caltech、そして人間検出ベンチマークCrowdHumanに提示する。
関連論文リスト
- Match and Locate: low-frequency monocular odometry based on deep feature
matching [0.65268245109828]
本稿では,1台のカメラしか必要としないロボットオドメトリーの新たなアプローチを提案する。
アプローチは、深い特徴マッチングモデルを用いて、ビデオストリームの連続フレーム間の画像特徴のマッチングに基づいている。
本研究では,AISG-SLAビジュアルローカライゼーションチャレンジにおける手法の性能評価を行い,計算効率が高く,実装が容易であるにもかかわらず,競合する結果が得られた。
論文 参考訳(メタデータ) (2023-11-16T17:32:58Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - KECOR: Kernel Coding Rate Maximization for Active 3D Object Detection [48.66703222700795]
我々は、ラベルの取得に最も有用なポイントクラウドを特定するために、新しいカーネル戦略を利用する。
1段目(SECOND)と2段目(SECOND)の両方に対応するため、アノテーションに選択した境界ボックスの総数と検出性能のトレードオフをよく組み込んだ分類エントロピー接点を組み込んだ。
その結果,ボックスレベルのアノテーションのコストは約44%,計算時間は26%削減された。
論文 参考訳(メタデータ) (2023-07-16T04:27:03Z) - Efficient Decoder-free Object Detection with Transformers [75.00499377197475]
視覚変換器(ViT)は、物体検出アプローチのランドスケープを変化させている。
本稿では,デコーダフリー完全トランス(DFFT)オブジェクト検出器を提案する。
DFFT_SMALLは、トレーニングおよび推論段階で高い効率を達成する。
論文 参考訳(メタデータ) (2022-06-14T13:22:19Z) - The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。
具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。
KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文 参考訳(メタデータ) (2022-01-29T10:54:57Z) - Sample and Computation Redistribution for Efficient Face Detection [137.19388513633484]
トレーニングデータサンプリングと計算分布戦略は、効率的で正確な顔検出の鍵です。
scrfdf34は、最高の競合製品であるTinaFaceを3.86%(ハードセットでのAP)で上回り、GPU上でVGA解像度画像でmph3$times$より高速です。
論文 参考訳(メタデータ) (2021-05-10T23:51:14Z) - Lite-FPN for Keypoint-based Monocular 3D Object Detection [18.03406686769539]
keypointベースのモノクロ3dオブジェクト検出は、非常に進歩し、高い速度精度のトレードオフを達成した。
マルチスケール機能融合を実現する軽量機能ピラミッドネットワークLite-FPNを提案します。
提案手法は,高い精度とフレームレートを同時に達成する。
論文 参考訳(メタデータ) (2021-05-01T14:44:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。