論文の概要: Detecting soccer balls with reduced neural networks: a comparison of
multiple architectures under constrained hardware scenarios
- arxiv url: http://arxiv.org/abs/2009.13684v2
- Date: Sun, 21 Feb 2021 12:15:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-13 22:16:25.013872
- Title: Detecting soccer balls with reduced neural networks: a comparison of
multiple architectures under constrained hardware scenarios
- Title(参考訳): ニューラルネットワークを用いたサッカーボール検出:制約付きハードウェアシナリオにおける複数アーキテクチャの比較
- Authors: Douglas De Rizzo Meneghetti, Thiago Pedro Donadon Homem, Jonas
Henrique Renolfi de Oliveira, Isaac Jesus da Silva, Danilo Hernani Perico,
Reinaldo Augusto da Costa Bianchi
- Abstract要約: この研究は、制約のあるハードウェア環境をターゲットにした最近のニューラルネットワークの提案の比較研究を提供する。
我々は、MobileNetV2とMobileNetV3モデルの複数のオープン実装を、基礎となる異なるアーキテクチャで訓練する。
以上の結果から,MobileNetV3モデルは制約シナリオのみにおいて,mAPと推論時間とのトレードオフが良好であること,また,高幅乗算器を持つMobileNetV2はサーバ側推論に適していることが示唆された。
- 参考スコア(独自算出の注目度): 0.8808021343665321
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object detection techniques that achieve state-of-the-art detection accuracy
employ convolutional neural networks, implemented to have optimal performance
in graphics processing units. Some hardware systems, such as mobile robots,
operate under constrained hardware situations, but still benefit from object
detection capabilities. Multiple network models have been proposed, achieving
comparable accuracy with reduced architectures and leaner operations. Motivated
by the need to create an object detection system for a soccer team of mobile
robots, this work provides a comparative study of recent proposals of neural
networks targeted towards constrained hardware environments, in the specific
task of soccer ball detection. We train multiple open implementations of
MobileNetV2 and MobileNetV3 models with different underlying architectures, as
well as YOLOv3, TinyYOLOv3, YOLOv4 and TinyYOLOv4 in an annotated image data
set captured using a mobile robot. We then report their mean average precision
on a test data set and their inference times in videos of different
resolutions, under constrained and unconstrained hardware configurations.
Results show that MobileNetV3 models have a good trade-off between mAP and
inference time in constrained scenarios only, while MobileNetV2 with high width
multipliers are appropriate for server-side inference. YOLO models in their
official implementations are not suitable for inference in CPUs.
- Abstract(参考訳): 最先端検出精度を実現するオブジェクト検出技術は、グラフィック処理ユニットで最適な性能を発揮するように実装された畳み込みニューラルネットワークを用いている。
移動ロボットのような一部のハードウェアシステムは、制約のあるハードウェア環境で動作しているが、それでもオブジェクト検出能力の恩恵を受けている。
複数のネットワークモデルが提案されており、少ないアーキテクチャとよりリーンな操作で同等の精度を達成している。
移動ロボットのサッカーチームのための物体検出システムを構築する必要性から、この研究は、ボール検出の特定のタスクにおいて、制約のあるハードウェア環境をターゲットにした最近のニューラルネットワークの提案の比較研究を提供する。
我々は、モバイルロボットでキャプチャした注釈付き画像データセットにおいて、異なるアーキテクチャのMobileNetV2およびMobileNetV3モデルの複数のオープン実装と、YOLOv3、TinyYOLOv3、YOLOv4、TinyYOLOv4をトレーニングする。
次に、テストデータセットの平均精度と異なる解像度の動画における推論時間について、制約のあるハードウェア設定の下で報告する。
その結果,MobileNetV3モデルは制約シナリオのみにおいて,mAPと推論時間との間に良好なトレードオフがあることが判明した。
公式実装のYOLOモデルはCPUの推論には適していない。
関連論文リスト
- Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - Multi-objective Differentiable Neural Architecture Search [58.67218773054753]
本研究では,パフォーマンスとハードウェアメトリクスのトレードオフのために,ユーザの好みを符号化するNASアルゴリズムを提案する。
提案手法は,既存のMOO NAS手法を,定性的に異なる検索空間やデータセットの広い範囲で性能良くする。
論文 参考訳(メタデータ) (2024-02-28T10:09:04Z) - YOLOBench: Benchmarking Efficient Object Detectors on Embedded Systems [0.0873811641236639]
4つの異なるデータセットと4つの異なる組込みハードウェアプラットフォーム上で、550以上のYOLOベースのオブジェクト検出モデルからなるベンチマークであるYOLOBenchを提案する。
我々は,これらの検出器と固定訓練環境との公正かつ制御された比較を行うことにより,様々なモデルスケールのYOLOベースの1段検出器の精度と遅延数を収集する。
我々は、YOLOBenchのニューラルネットワーク探索で使用されるトレーニング不要な精度推定器を評価し、最先端のゼロコスト精度推定器はMACカウントのような単純なベースラインよりも優れており、その一部は効果的に使用できることを示した。
論文 参考訳(メタデータ) (2023-07-26T01:51:10Z) - MobileDenseNet: A new approach to object detection on mobile devices [9.05607520128194]
本稿の主な目的は、高速かつリアルタイムな効率を維持しつつ、最先端のアルゴリズムの精度を高めることである。
組込みシステムに適したMobileDenseNetという新しいネットワークを構築した。
また,小型物体の検出を支援するモバイル機器用軽量ネックFCPNLiteを開発した。
論文 参考訳(メタデータ) (2022-07-22T12:13:59Z) - A lightweight and accurate YOLO-like network for small target detection
in Aerial Imagery [94.78943497436492]
小型ターゲット検出のためのシンプルで高速で効率的なネットワークであるYOLO-Sを提案する。
YOLO-SはDarknet20をベースとした小さな特徴抽出器と、バイパスと連結の両方を通じて接続をスキップする。
YOLO-Sはパラメータサイズが87%減少し、約半分のFLOPがYOLOv3となり、低消費電力の産業用アプリケーションに実用化された。
論文 参考訳(メタデータ) (2022-04-05T16:29:49Z) - SA-Det3D: Self-Attention Based Context-Aware 3D Object Detection [9.924083358178239]
本稿では,3次元物体検出におけるコンテキストモデリングのための2種類の自己注意法を提案する。
まず,現状のbev,voxel,ポイントベース検出器にペアワイズ自着機構を組み込む。
次に,ランダムにサンプリングされた位置の変形を学習することにより,最も代表的な特徴のサブセットをサンプリングするセルフアテンション変種を提案する。
論文 参考訳(メタデータ) (2021-01-07T18:30:32Z) - Achieving Real-Time LiDAR 3D Object Detection on a Mobile Device [53.323878851563414]
本稿では,強化学習技術を用いたネットワーク拡張とpruning検索を組み込んだコンパイラ対応統一フレームワークを提案する。
具体的には,リカレントニューラルネットワーク(RNN)を用いて,ネットワークの強化とプルーニングの両面での統一的なスキームを自動で提供する。
提案手法は,モバイルデバイス上でのリアルタイム3次元物体検出を実現する。
論文 参考訳(メタデータ) (2020-12-26T19:41:15Z) - RT3D: Achieving Real-Time Execution of 3D Convolutional Neural Networks
on Mobile Devices [57.877112704841366]
本稿では3次元CNNのためのモデル圧縮およびモバイルアクセラレーションフレームワークRT3Dを提案する。
3D CNNのリアルタイム実行は、市販のモバイル上で初めて実現された。
論文 参考訳(メタデータ) (2020-07-20T02:05:32Z) - MobileDets: Searching for Object Detection Architectures for Mobile
Accelerators [61.30355783955777]
逆ボトルネック層は、モバイルデバイス上の最先端のオブジェクト検出モデルにおいて、主要なビルディングブロックとなっている。
通常の畳み込みは、アクセラレーターにおけるオブジェクト検出の遅延精度トレードオフを高める強力なコンポーネントである。
我々は、モバイルアクセラレーター全体で最先端の成果を得られるオブジェクト検出モデル、MobileDetsのファミリーを得る。
論文 参考訳(メタデータ) (2020-04-30T00:21:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。