論文の概要: Advanced Efficient Strategy for Detection of Dark Objects Based on
Spiking Network with Multi-Box Detection
- arxiv url: http://arxiv.org/abs/2310.06370v1
- Date: Tue, 10 Oct 2023 07:20:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-11 18:31:09.964155
- Title: Advanced Efficient Strategy for Detection of Dark Objects Based on
Spiking Network with Multi-Box Detection
- Title(参考訳): マルチボックス検出によるスパイキングネットワークに基づく暗黒物体検出のための高精度戦略
- Authors: Munawar Ali, Baoqun Yin, Hazrat Bilal, Aakash Kumar, Ali Muhammad,
Avinash Rohra
- Abstract要約: 本研究は,エネルギー効率および信頼性の高い物体検出器モデルとして,スパイク層と通常の畳み込み層の組み合わせを提案する。
最先端のPythonライブラリでは、スパイク層を効率的にトレーニングすることができる。
提案したスパイク畳み込みオブジェクト検出器 (SCOD) はVOCおよびEx-Darkデータセット上で評価されている。
- 参考スコア(独自算出の注目度): 2.9659663708260777
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Several deep learning algorithms have shown amazing performance for existing
object detection tasks, but recognizing darker objects is the largest
challenge. Moreover, those techniques struggled to detect or had a slow
recognition rate, resulting in significant performance losses. As a result, an
improved and accurate detection approach is required to address the above
difficulty. The whole study proposes a combination of spiked and normal
convolution layers as an energy-efficient and reliable object detector model.
The proposed model is split into two sections. The first section is developed
as a feature extractor, which utilizes pre-trained VGG16, and the second
section of the proposal structure is the combination of spiked and normal
Convolutional layers to detect the bounding boxes of images. We drew a
pre-trained model for classifying detected objects. With state of the art
Python libraries, spike layers can be trained efficiently. The proposed spike
convolutional object detector (SCOD) has been evaluated on VOC and Ex-Dark
datasets. SCOD reached 66.01% and 41.25% mAP for detecting 20 different objects
in the VOC-12 and 12 objects in the Ex-Dark dataset. SCOD uses 14 Giga FLOPS
for its forward path calculations. Experimental results indicated superior
performance compared to Tiny YOLO, Spike YOLO, YOLO-LITE, Tinier YOLO and
Center of loc+Xception based on mAP for the VOC dataset.
- Abstract(参考訳): 既存のオブジェクト検出タスクでは、いくつかのディープラーニングアルゴリズムが素晴らしいパフォーマンスを示しているが、暗いオブジェクトを認識することが最大の課題である。
さらに、これらの技術は認識速度の低下や検出に苦労し、結果としてパフォーマンスが著しく低下した。
その結果、上記の困難に対処するために、改良され正確な検出手法が必要となる。
本研究は、エネルギー効率と信頼性の高い物体検出器モデルとして、スパイク層と通常の畳み込み層の組み合わせを提案する。
提案モデルは2つのセクションに分けられる。
第1のセクションは、予め訓練されたvgg16を利用する特徴抽出器として開発され、提案構造の第2のセクションは、スパイク層と通常の畳み込み層の組み合わせで画像の境界ボックスを検出する。
検出対象を分類するための事前学習モデルを構築した。
最先端のPythonライブラリでは、スパイク層を効率的にトレーニングすることができる。
提案したスパイク畳み込み物体検出器(SCOD)はVOCおよびEx-Darkデータセット上で評価されている。
SCOD は 66.01% と 41.25% mAP に達し、VOC-12 と Ex-Dark データセットの 12 の20 個の異なる物体を検出した。
SCODはフォワードパス計算に14ギガFLOPSを使用している。
実験結果から,VOCデータセットのmAPに基づく Tiny YOLO, Spike YOLO, YOLO-LITE, Tinier YOLO, Center of loc+Xception と比較した。
関連論文リスト
- SOOD++: Leveraging Unlabeled Data to Boost Oriented Object Detection [59.868772767818975]
本稿では,SOOD++ と呼ばれる簡易かつ効果的な半教師付きオブジェクト指向検出手法を提案する。
具体的には、空中画像からの物体は、通常任意の向き、小さなスケール、集約である。
様々なラベル付き環境下での多目的オブジェクトデータセットに対する大規模な実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2024-07-01T07:03:51Z) - SARDet-100K: Towards Open-Source Benchmark and ToolKit for Large-Scale SAR Object Detection [79.23689506129733]
我々は,大規模SARオブジェクト検出のための新しいベンチマークデータセットとオープンソース手法を構築した。
私たちのデータセットであるSARDet-100Kは、10の既存のSAR検出データセットの厳格な調査、収集、標準化の結果です。
私たちの知る限りでは、SARDet-100KはCOCOレベルの大規模マルチクラスSARオブジェクト検出データセットとしては初めてのものです。
論文 参考訳(メタデータ) (2024-03-11T09:20:40Z) - Improved Region Proposal Network for Enhanced Few-Shot Object Detection [23.871860648919593]
Few-shot Object Detection (FSOD) メソッドは、古典的なオブジェクト検出手法の限界に対する解決策として登場した。
FSODトレーニング段階において,未ラベルの新規物体を正のサンプルとして検出し,利用するための半教師付きアルゴリズムを開発した。
地域提案ネットワーク(RPN)の階層的サンプリング戦略の改善により,大規模オブジェクトに対するオブジェクト検出モデルの認識が向上する。
論文 参考訳(メタデータ) (2023-08-15T02:35:59Z) - PE-YOLO: Pyramid Enhancement Network for Dark Object Detection [9.949687351946038]
ピラミッド拡張ネットワーク (PENet) を提案し, YOLOv3 と結合して PE-YOLO というダークオブジェクト検出フレームワークを構築する。
PE-YOLOはエンドツーエンドのジョイントトレーニングアプローチを採用し、通常の検出損失のみを使用してトレーニングプロセスを簡素化する。
結果:PE-YOLOは、それぞれmAPが78.0%、FPSが53.6%であり、異なる低照度条件下での物体検出に適応できる。
論文 参考訳(メタデータ) (2023-07-20T15:25:55Z) - USD: Unknown Sensitive Detector Empowered by Decoupled Objectness and
Segment Anything Model [14.080744645704751]
Open World Object Detection (OWOD) は、新しいコンピュータビジョンタスクである。
本稿では,この2つの境界の学習をデコーダ層に分割する,シンプルで効果的な学習戦略であるDecoupled Objectness Learning(DOL)を提案する。
また、擬似ラベルとソフトウェイト戦略を用いてノイズの負の影響を緩和する補助的スーパービジョンフレームワーク(ASF)も導入する。
論文 参考訳(メタデータ) (2023-06-04T06:42:09Z) - Long Range Object-Level Monocular Depth Estimation for UAVs [0.0]
本稿では,画像からモノクロ物体を長距離検出するための最先端手法の新たな拡張法を提案する。
まず、回帰タスクとして深度推定をモデル化する際、SigmoidおよびReLUライクエンコーディングを提案する。
次に,深度推定を分類問題とし,訓練損失の計算にソフトアルグマックス関数を導入する。
論文 参考訳(メタデータ) (2023-02-17T15:26:04Z) - EAutoDet: Efficient Architecture Search for Object Detection [110.99532343155073]
EAutoDetフレームワークは、1.4GPU日でオブジェクト検出のための実用的なバックボーンとFPNアーキテクチャを検出できる。
本稿では,一方のエッジ上での候補演算の重みを共有し,それらを一つの畳み込みに集約することでカーネル再利用手法を提案する。
特に、発見されたアーキテクチャは最先端のオブジェクト検出NAS法を超越し、120 FPSで40.1 mAP、49.2 mAP、41.3 FPSをCOCOテストデブセットで達成している。
論文 参考訳(メタデータ) (2022-03-21T05:56:12Z) - Benchmarking Deep Models for Salient Object Detection [67.07247772280212]
汎用SALOD(General SALient Object Detection)ベンチマークを構築し,複数のSOD手法の総合的な比較を行った。
以上の実験では、既存の損失関数は、通常いくつかの指標に特化しているが、他の指標には劣る結果が報告されている。
我々は,深層ネットワークに画素レベルと画像レベルの両方の監視信号を統合することにより,より識別的な特徴を学習するためのエッジ・アウェア・ロス(EA)を提案する。
論文 参考訳(メタデータ) (2022-02-07T03:43:16Z) - Seeing BDD100K in dark: Single-Stage Night-time Object Detection via
Continual Fourier Contrastive Learning [3.4012007729454816]
夜間物体検出は、限られた論文のうち、一様でない評価プロトコルを通して、わずかにのみ研究されている。
本稿では,これら3つのギャップを橋渡しする。
均一な評価プロトコルの欠如(その有効性と効率のため、単段検出器を使用する)。
夜間オブジェクト検出のベンチマークのためのデータセットの選択。
現在の選択肢の限界に対処する新しい方法。
論文 参考訳(メタデータ) (2021-12-06T09:28:45Z) - EDN: Salient Object Detection via Extremely-Downsampled Network [66.38046176176017]
画像全体のグローバルビューを効果的に学ぶために、極端なダウンサンプリング技術を使用するExtremely-Downsampled Network(EDN)を紹介します。
実験は、ednがリアルタイム速度でsart性能を達成することを実証する。
論文 参考訳(メタデータ) (2020-12-24T04:23:48Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。