論文の概要: FRDet: Balanced and Lightweight Object Detector based on Fire-Residual
Modules for Embedded Processor of Autonomous Driving
- arxiv url: http://arxiv.org/abs/2011.08061v1
- Date: Mon, 16 Nov 2020 16:15:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-25 00:59:52.464872
- Title: FRDet: Balanced and Lightweight Object Detector based on Fire-Residual
Modules for Embedded Processor of Autonomous Driving
- Title(参考訳): FRDet: 自動走行の組込みプロセッサのための消火モジュールに基づくバランスと軽量物体検出装置
- Authors: Seontaek Oh, Ji-Hwan You, Young-Keun Kim
- Abstract要約: 本稿では, 精度, モデルサイズ, リアルタイム処理の制約をすべて満たすために, バランスのとれた軽量一段物体検出器を提案する。
我々のネットワークは、YOLOv3の精度を達成または超えながら、モデルの圧縮を最大化することを目的としている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: For deployment on an embedded processor for autonomous driving, the object
detection network should satisfy all of the accuracy, real-time inference, and
light model size requirements. Conventional deep CNN-based detectors aim for
high accuracy, making their model size heavy for an embedded system with
limited memory space. In contrast, lightweight object detectors are greatly
compressed but at a significant sacrifice of accuracy. Therefore, we propose
FRDet, a lightweight one-stage object detector that is balanced to satisfy all
the constraints of accuracy, model size, and real-time processing on an
embedded GPU processor for autonomous driving applications. Our network aims to
maximize the compression of the model while achieving or surpassing YOLOv3
level of accuracy. This paper proposes the Fire-Residual (FR) module to design
a lightweight network with low accuracy loss by adapting fire modules with
residual skip connections. In addition, the Gaussian uncertainty modeling of
the bounding box is applied to further enhance the localization accuracy.
Experiments on the KITTI dataset showed that FRDet reduced the memory size by
50.8% but achieved higher accuracy by 1.12% mAP compared to YOLOv3. Moreover,
the real-time detection speed reached 31.3 FPS on an embedded GPU board(NVIDIA
Xavier). The proposed network achieved higher compression with comparable
accuracy compared to other deep CNN object detectors while showing improved
accuracy than the lightweight detector baselines. Therefore, the proposed FRDet
is a well-balanced and efficient object detector for practical application in
autonomous driving that can satisfies all the criteria of accuracy, real-time
inference, and light model size.
- Abstract(参考訳): 自動運転のための組み込みプロセッサにデプロイするには、オブジェクト検出ネットワークは、精度、リアルタイム推論、軽量モデルサイズ要件をすべて満たさなければならない。
従来のディープcnnベースの検出器は高精度を目指しており、メモリ容量の少ない組み込みシステムではモデルサイズが重くなる。
対照的に、軽量物体検出器は大幅に圧縮されるが、精度はかなり犠牲になる。
そこで本研究では,自動運転アプリケーションのための組込みgpuプロセッサにおいて,精度,モデルサイズ,リアルタイム処理の制約を満たした軽量な一段階物体検出器frdetを提案する。
我々のネットワークは、yolov3レベルの精度を達成または超えながら、モデルの圧縮を最大化することを目指している。
本稿では,残差のスキップ接続を持つファイアモジュールを適応させることにより,低精度な損失の軽量ネットワークを設計するための,ファイアレジシデント(fr)モジュールを提案する。
さらに、境界ボックスのガウス的不確実性モデリングを適用して、局所化精度をさらに高める。
KITTIデータセットの実験では、FRDetはメモリサイズを50.8%削減したが、YOLOv3に比べて1.12%精度が向上した。
さらに、リアルタイム検出速度は組み込みGPUボード(NVIDIA Xavier)で31.3FPSに達した。
提案ネットワークは他の深層cnnオブジェクト検出器と比較して高い圧縮率を達成し,軽量検出器ベースラインよりも精度が向上した。
したがって,提案するfrdetは,精度,実時間推定,光モデルサイズといったすべての基準を満たす自律走行の実用的応用のための,バランスの取れた効率的な物体検出器である。
関連論文リスト
- Global Context Aggregation Network for Lightweight Saliency Detection of
Surface Defects [70.48554424894728]
我々は,エンコーダ・デコーダ構造上の表面欠陥を簡易に検出するためのGCANet(Global Context Aggregation Network)を開発した。
まず、軽量バックボーンの上部層に新しいトランスフォーマーエンコーダを導入し、DSA(Depth-wise Self-Attention)モジュールを通じてグローバルなコンテキスト情報をキャプチャする。
3つの公開欠陥データセットの実験結果から,提案したネットワークは,他の17の最先端手法と比較して,精度と実行効率のトレードオフを良好に達成できることが示された。
論文 参考訳(メタデータ) (2023-09-22T06:19:11Z) - EdgeYOLO: An Edge-Real-Time Object Detector [69.41688769991482]
本稿では, 最先端のYOLOフレームワークをベースとした, 効率的で低複雑さかつアンカーフリーな物体検出器を提案する。
我々は,訓練中の過剰適合を効果的に抑制する拡張データ拡張法を開発し,小型物体の検出精度を向上させるためにハイブリッドランダム損失関数を設計する。
私たちのベースラインモデルは、MS 2017データセットで50.6%のAP50:95と69.8%のAP50、VisDrone 2019-DETデータセットで26.4%のAP50と44.8%のAP50に達し、エッジコンピューティングデバイスNvidia上でリアルタイム要求(FPS>=30)を満たす。
論文 参考訳(メタデータ) (2023-02-15T06:05:14Z) - Rethinking Lightweight Salient Object Detection via Network Depth-Width
Tradeoff [26.566339984225756]
既存の有能なオブジェクト検出手法では、より深いネットワークが採用され、性能が向上する。
本稿では,U字形構造を3つの相補枝に分解することで,新しい3方向デコーダフレームワークを提案する。
提案手法は,5つのベンチマークにおいて効率と精度のバランスが良くなることを示す。
論文 参考訳(メタデータ) (2023-01-17T03:43:25Z) - Rethinking Voxelization and Classification for 3D Object Detection [68.8204255655161]
LiDARポイントクラウドからの3Dオブジェクト検出の主な課題は、ネットワークの信頼性に影響を与えることなく、リアルタイムのパフォーマンスを実現することである。
本稿では,高速な動的ボキセラライザを実装することにより,ネットワークの推論速度と精度を同時に向上するソリューションを提案する。
さらに,予測対象を分類し,偽検出対象をフィルタリングする軽量検出サブヘッドモデルを提案する。
論文 参考訳(メタデータ) (2023-01-10T16:22:04Z) - Small Object Detection Based on Modified FSSD and Model Compression [7.387639662781843]
本稿では,FSSDに基づく小型物体検出アルゴリズムを提案する。
計算コストと記憶空間を削減するため, モデル圧縮を実現するためにプルーニングを行う。
アルゴリズムの平均精度(mAP)は、PASCAL VOCで80.4%、GTX1080tiで59.5 FPSに達する。
論文 参考訳(メタデータ) (2021-08-24T03:20:32Z) - Developing a Compressed Object Detection Model based on YOLOv4 for
Deployment on Embedded GPU Platform of Autonomous System [0.0]
CNNベースのオブジェクト検出モデルは極めて正確だが、リアルタイムに実行するには高性能なGPUが必要である。
検出精度を維持しつつ、検出ネットワークをできるだけ軽量に圧縮することが好ましい。
本稿では,ハイ比で圧縮されたYOffleNetと呼ばれる新しい物体検出モデルを提案する。
論文 参考訳(メタデータ) (2021-08-01T08:19:51Z) - ANNETTE: Accurate Neural Network Execution Time Estimation with Stacked
Models [56.21470608621633]
本稿では,アーキテクチャ検索を対象ハードウェアから切り離すための時間推定フレームワークを提案する。
提案手法は,マイクロカーネルと多層ベンチマークからモデルの集合を抽出し,マッピングとネットワーク実行時間推定のためのスタックモデルを生成する。
生成した混合モデルの推定精度と忠実度, 統計モデルとルーフラインモデル, 評価のための洗練されたルーフラインモデルを比較した。
論文 参考訳(メタデータ) (2021-05-07T11:39:05Z) - Lite-FPN for Keypoint-based Monocular 3D Object Detection [18.03406686769539]
keypointベースのモノクロ3dオブジェクト検出は、非常に進歩し、高い速度精度のトレードオフを達成した。
マルチスケール機能融合を実現する軽量機能ピラミッドネットワークLite-FPNを提案します。
提案手法は,高い精度とフレームレートを同時に達成する。
論文 参考訳(メタデータ) (2021-05-01T14:44:31Z) - AQD: Towards Accurate Fully-Quantized Object Detection [94.06347866374927]
本稿では,浮動小数点演算を除去するために,AQDと呼ばれる高精度な量子化オブジェクト検出ソリューションを提案する。
我々のAQDは、非常に低ビットのスキームの下での完全精度と比較して、同等またはそれ以上の性能を実現しています。
論文 参考訳(メタデータ) (2020-07-14T09:07:29Z) - APQ: Joint Search for Network Architecture, Pruning and Quantization
Policy [49.3037538647714]
本稿では,リソース制約のあるハードウェア上での効率的なディープラーニング推論のためのAPQを提案する。
ニューラルアーキテクチャ、プルーニングポリシー、量子化ポリシーを別々に検索する従来の方法とは異なり、我々はそれらを共同で最適化する。
同じ精度で、APQはMobileNetV2+HAQよりもレイテンシ/エネルギーを2倍/1.3倍削減する。
論文 参考訳(メタデータ) (2020-06-15T16:09:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。