論文の概要: FSSD: Feature Fusion Single Shot Multibox Detector
- arxiv url: http://arxiv.org/abs/1712.00960v4
- Date: Fri, 23 Feb 2024 03:16:50 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-27 21:57:53.807534
- Title: FSSD: Feature Fusion Single Shot Multibox Detector
- Title(参考訳): FSSD:Feature Fusion Single Shot Multibox Detector
- Authors: Zuoxin Li, Lu Yang and Fuqiang Zhou
- Abstract要約: FSSD(Feature Fusion Single Shot Multibox Detector)は、新しい軽量機能融合モジュールを備えた拡張SSDである。
我々のネットワークは、Nvidia 1080Ti GPUを使用して、入力サイズ300$times$300の65.8 FPS(秒間フレーム)で82.7 mAP(平均精度)を達成することができる。
- 参考スコア(独自算出の注目度): 8.016875965887815
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: SSD (Single Shot Multibox Detector) is one of the best object detection
algorithms with both high accuracy and fast speed. However, SSD's feature
pyramid detection method makes it hard to fuse the features from different
scales. In this paper, we proposed FSSD (Feature Fusion Single Shot Multibox
Detector), an enhanced SSD with a novel and lightweight feature fusion module
which can improve the performance significantly over SSD with just a little
speed drop. In the feature fusion module, features from different layers with
different scales are concatenated together, followed by some down-sampling
blocks to generate new feature pyramid, which will be fed to multibox detectors
to predict the final detection results. On the Pascal VOC 2007 test, our
network can achieve 82.7 mAP (mean average precision) at the speed of 65.8 FPS
(frame per second) with the input size 300$\times$300 using a single Nvidia
1080Ti GPU. In addition, our result on COCO is also better than the
conventional SSD with a large margin. Our FSSD outperforms a lot of
state-of-the-art object detection algorithms in both aspects of accuracy and
speed. Code is available at https://github.com/lzx1413/CAFFE_SSD/tree/fssd.
- Abstract(参考訳): ssd(single shot multibox detector)は、高精度と高速の両方のオブジェクト検出アルゴリズムの1つである。
しかし、SSDの特徴ピラミッド検出方法は、異なるスケールの機能を融合させることが難しい。
本稿では,FSSD(Feature Fusion Single Shot Multibox Detector)を提案する。FSSD(Feature Fusion Single Shot Multibox Detector)は,軽量な機能融合モジュールを備えた拡張SSDである。
機能融合モジュールでは、異なるスケールの異なるレイヤからの特徴が結合され、続いていくつかのダウンサンプリングブロックが新しい特徴ピラミッドを生成し、最終検出結果を予測するためにマルチボックス検出器に供給される。
Pascal VOC 2007テストでは,1つのNvidia 1080Ti GPUを使用して,入力サイズ300$\times$300の65.8 FPS(フレーム毎秒)で82.7 mAP(平均精度)を達成した。
さらに、cocoの成果は、従来のssdよりも大きなマージンで良いのです。
fssdは精度と速度の両面で最先端の物体検出アルゴリズムを多く上回っている。
コードはhttps://github.com/lzx1413/CAFFE_SSD/tree/fssdで入手できる。
関連論文リスト
- FusionANNS: An Efficient CPU/GPU Cooperative Processing Architecture for Billion-scale Approximate Nearest Neighbor Search [9.724743360108835]
近似近接探索(ANNS)がデータベースとAIインフラストラクチャの重要なコンポーネントとして登場した。
数十億のデータセットを対象とした高スループット,低レイテンシ,低コスト,高精度なANNSシステムであるFusionANNSを提案する。
本稿では、CPUとGPU間のデータスワップを回避するための多層インデックス化、不要なI/Oや計算をなくすための再ランク付け、I/O効率をさらに向上するための冗長なI/Oデデューズという3つの新しい設計を提案する。
論文 参考訳(メタデータ) (2024-09-25T03:14:01Z) - ASAG: Building Strong One-Decoder-Layer Sparse Detectors via Adaptive
Sparse Anchor Generation [50.01244854344167]
適応スパースアンカージェネレータ(ASAG)の提案により、スパース検出器と密度検出器のパフォーマンスギャップを橋渡しする。
ASAGは、グリッドではなくパッチの動的なアンカーを予測することで、機能競合の問題を軽減する。
提案手法は高密度な手法より優れ,高速かつ高精度なトレードオフを実現する。
論文 参考訳(メタデータ) (2023-08-18T02:06:49Z) - Follow the Soldiers with Optimized Single-Shot Multibox Detection and
Reinforcement Learning [0.0]
私たちはDeepRacerを使って自律的なシステムを構築し、特定の人物(私たちのプロジェクト、兵士)がどんな方向に動いても追跡します。
このプロジェクトを達成するための2つの主要なコンポーネントは、最適化されたシングルショットマルチボックス検出(SSD)オブジェクト検出モデルと強化学習(RL)モデルである。
実験の結果,SSD Liteはこれらの3つの技術の中で優れた性能を示し,精度を損なうことなく,推論速度(2~3倍)を大幅に向上させることがわかった。
論文 参考訳(メタデータ) (2023-08-02T19:08:57Z) - Precise Single-stage Detector [2.2719729705587155]
我々は、PSSD(Precise Single Stage Detector)と呼ばれるシングルショットマルチボックス検出器(SSD)の修正版を提案する。
このような問題に対処するため,我々はPSSD(Precise Single Stage Detector)と呼ばれる新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-10-09T12:58:37Z) - Fully Sparse 3D Object Detection [57.05834683261658]
長距離LiDARオブジェクト検出のためのフルスパース3Dオブジェクト検出器(FSD)を構築した。
FSDは一般的なスパース・ボクセル・エンコーダと新しいスパース・インスタンス認識(SIR)モジュール上に構築されている。
SIRは、ポイントをインスタンスにグループ化することで、以前のポイントベースのメソッドでの待ち行列クエリを避ける。
論文 参考訳(メタデータ) (2022-07-20T17:01:33Z) - Embracing Single Stride 3D Object Detector with Sparse Transformer [63.179720817019096]
自律走行のためのLiDARを用いた3次元物体検出では、物体サイズと入力シーンサイズとの比が2次元検出の場合に比べて有意に小さい。
多くの3D検出器は2D検出器の一般的な慣習に従っており、点雲の定量化後も特徴マップを分解する。
本稿では,SST(Single-stride Sparse Transformer)を提案する。
論文 参考訳(メタデータ) (2021-12-13T02:12:02Z) - Detecting Small Objects in Thermal Images Using Single-Shot Detector [12.72157936831052]
SSD(Single Shot Multibox Detector)は、高速かつ高精度な物体検出装置として最も成功した。
本稿では,小型オブジェクト検出のためのSSD上の性能向上を実現するための,新しい機能融合モジュールを備えた拡張SSDを提案する。
論文 参考訳(メタデータ) (2021-08-25T07:54:36Z) - FastFlowNet: A Lightweight Network for Fast Optical Flow Estimation [81.76975488010213]
ディセンス光学フロー推定は、多くのロボットビジョンタスクで重要な役割を果たしています。
現在のネットワークはしばしば多くのパラメータを占有し、計算コストがかかる。
提案したFastFlowNetは、周知の粗大なやり方で、以下のイノベーションで機能する。
論文 参考訳(メタデータ) (2021-03-08T03:09:37Z) - CIA-SSD: Confident IoU-Aware Single-Stage Object Detector From Point
Cloud [40.871850077528485]
我々は、CIA-SSD(Confident IoU-Aware Single-Stage Object Detector)と呼ばれる新しい単段検出器を提案する。
CIA-SSDは、境界ボックスの正確な予測と分類信頼性のために、高レベルの抽象的特徴と低レベルの空間的特徴を適応的に融合する。
公式ランキングでトップパフォーマンスを記録し、32 FPSの推論速度を上回ります。
論文 参考訳(メタデータ) (2020-12-05T12:00:08Z) - Single Shot Video Object Detector [215.06904478667337]
Single Shot Video Object Detector (SSVD)は、新しいアーキテクチャであり、ビデオ内のオブジェクト検出のための1段階の検出器に機能集約を新規に統合する。
448の448ドルの入力で、SSVDはImageNet VIDデータセットで79.2%のmAPを達成した。
論文 参考訳(メタデータ) (2020-07-07T15:36:26Z) - ASFD: Automatic and Scalable Face Detector [129.82350993748258]
ASFD(Automatic and Scalable Face Detector)を提案する。
ASFDはニューラルアーキテクチャ検索技術の組み合わせと新たな損失設計に基づいている。
ASFD-D0は120FPS以上で動作し、MobilenetはVGA解像度の画像を撮影しています。
論文 参考訳(メタデータ) (2020-03-25T06:00:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。