論文の概要: Anchor-free Small-scale Multispectral Pedestrian Detection
- arxiv url: http://arxiv.org/abs/2008.08418v2
- Date: Thu, 20 Aug 2020 15:01:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 12:10:50.034337
- Title: Anchor-free Small-scale Multispectral Pedestrian Detection
- Title(参考訳): アンカーレス小型マルチスペクトルペデストリアン検出
- Authors: Alexander Wolpert, Michael Teutsch, M. Saquib Sarfraz, Rainer
Stiefelhagen
- Abstract要約: 適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
- 参考スコア(独自算出の注目度): 88.7497134369344
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multispectral images consisting of aligned visual-optical (VIS) and thermal
infrared (IR) image pairs are well-suited for practical applications like
autonomous driving or visual surveillance. Such data can be used to increase
the performance of pedestrian detection especially for weakly illuminated,
small-scaled, or partially occluded instances. The current state-of-the-art is
based on variants of Faster R-CNN and thus passes through two stages: a
proposal generator network with handcrafted anchor boxes for object
localization and a classification network for verifying the object category. In
this paper we propose a method for effective and efficient multispectral fusion
of the two modalities in an adapted single-stage anchor-free base architecture.
We aim at learning pedestrian representations based on object center and scale
rather than direct bounding box predictions. In this way, we can both simplify
the network architecture and achieve higher detection performance, especially
for pedestrians under occlusion or at low object resolution. In addition, we
provide a study on well-suited multispectral data augmentation techniques that
improve the commonly used augmentations. The results show our method's
effectiveness in detecting small-scaled pedestrians. We achieve 5.68%
log-average miss rate in comparison to the best current state-of-the-art of
7.49% (25% improvement) on the challenging KAIST Multispectral Pedestrian
Detection Benchmark.
Code: https://github.com/HensoldtOptronicsCV/MultispectralPedestrianDetection
- Abstract(参考訳): 直列視覚光学(VIS)と熱赤外画像(IR)からなるマルチスペクトル画像は、自律運転や視覚監視といった実用用途に適している。
このようなデータは、特に弱い照明、小規模、あるいは部分的に禁止されたインスタンスに対して、歩行者検出の性能を高めるために使用できる。
現在の最先端技術は、Faster R-CNNの変種に基づいており、オブジェクトローカライゼーションのための手作りアンカーボックスを備えた提案生成ネットワークと、オブジェクトカテゴリを検証するための分類ネットワークである。
本稿では,単段アンカーフリーベースアーキテクチャにおける2つのモダリティの効率的かつ効率的なマルチスペクトル融合手法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
このようにして、ネットワークアーキテクチャを単純化し、特に閉塞状態の歩行者や低オブジェクト解像度の歩行者に対して高い検出性能を達成することができる。
さらに, 一般的に使用される拡張性を改善するための, 適切に適合したマルチスペクトルデータ拡張技術について検討する。
その結果,小型歩行者の検出に本手法の有効性が示された。
KAIST Multispectral Pedestrian Detection Benchmarkでは,現在最先端の7.49%(25%改善)と比較して5.68%のログ平均誤差率を実現している。
コード: https://github.com/hensoldtoptronicscv/multispectralpedestriandetection
関連論文リスト
- A Dual Attentive Generative Adversarial Network for Remote Sensing Image
Change Detection [6.906936669510404]
本稿では,高分解能なリモートセンシング画像変化検出タスクを実現するために,二重注意生成対向ネットワークを提案する。
DAGANフレームワークは、85.01%がIoU、91.48%がF1スコアであり、LEVIRデータセットの先進的な手法よりもパフォーマンスが良い。
論文 参考訳(メタデータ) (2023-10-03T08:26:27Z) - A Multi-task Framework for Infrared Small Target Detection and
Segmentation [9.033048310220346]
赤外線小ターゲット検出とセグメンテーションのための新しいエンドツーエンドフレームワークを提案する。
UNetをバックボーンとして、解像度とセマンティック情報を維持するために使用しています。
我々は、赤外線小ターゲット検出とセグメンテーションのためのマルチタスクフレームワークを開発した。
論文 参考訳(メタデータ) (2022-06-14T15:43:34Z) - Activation to Saliency: Forming High-Quality Labels for Unsupervised
Salient Object Detection [54.92703325989853]
本稿では,高品質なサリエンシキューを効果的に生成する2段階アクティベーション・ツー・サリエンシ(A2S)フレームワークを提案する。
トレーニングプロセス全体において、私たちのフレームワークにヒューマンアノテーションは関与していません。
本フレームワークは,既存のUSOD法と比較して高い性能を示した。
論文 参考訳(メタデータ) (2021-12-07T11:54:06Z) - Enhancing Object Detection for Autonomous Driving by Optimizing Anchor
Generation and Addressing Class Imbalance [0.0]
本研究では,より高速なR-CNNに基づく拡張型2次元物体検出器を提案する。
より高速なr-cnnに対する修正は計算コストを増加させず、他のアンカーベースの検出フレームワークを最適化するために容易に拡張できる。
論文 参考訳(メタデータ) (2021-04-08T16:58:31Z) - Bidirectional Multi-scale Attention Networks for Semantic Segmentation
of Oblique UAV Imagery [30.524771772192757]
本稿では、より適応的で効果的な特徴抽出のために、複数スケールの特徴を双方向に融合する新しい双方向多スケールアテンションネットワークを提案する。
当モデルでは,平均和合(mIoU)スコア70.80%でSOTA(State-of-the-art)を達成した。
論文 参考訳(メタデータ) (2021-02-05T11:02:15Z) - MRDet: A Multi-Head Network for Accurate Oriented Object Detection in
Aerial Images [51.227489316673484]
水平アンカーから変換された指向性提案を生成するために、任意指向領域提案ネットワーク(AO-RPN)を提案する。
正確なバウンディングボックスを得るために,検出タスクを複数のサブタスクに分離し,マルチヘッドネットワークを提案する。
各ヘッドは、対応するタスクに最適な特徴を学習するために特別に設計されており、ネットワークがオブジェクトを正確に検出することができる。
論文 参考訳(メタデータ) (2020-12-24T06:36:48Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z) - FairMOT: On the Fairness of Detection and Re-Identification in Multiple
Object Tracking [92.48078680697311]
マルチオブジェクトトラッキング(MOT)はコンピュータビジョンにおいて重要な問題である。
本稿では,FairMOTと呼ばれる,アンカーフリーなオブジェクト検出アーキテクチャCenterNetをベースとした,シンプルかつ効果的なアプローチを提案する。
このアプローチは、検出と追跡の両方において高い精度を達成する。
論文 参考訳(メタデータ) (2020-04-04T08:18:00Z) - Depthwise Non-local Module for Fast Salient Object Detection Using a
Single Thread [136.2224792151324]
本稿では,高速な物体検出のための新しいディープラーニングアルゴリズムを提案する。
提案アルゴリズムは,1つのCPUスレッドと同時に,競合精度と高い推論効率を実現する。
論文 参考訳(メタデータ) (2020-01-22T15:23:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。