論文の概要: Estimating the Power Consumption of Heterogeneous Devices when
performing AI Inference
- arxiv url: http://arxiv.org/abs/2207.06150v2
- Date: Sun, 10 Sep 2023 00:35:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-12 23:21:43.330269
- Title: Estimating the Power Consumption of Heterogeneous Devices when
performing AI Inference
- Title(参考訳): AI推論を行う際の異種機器の消費電力推定
- Authors: Pedro Machado, Ivica Matic, Francisco de Lemos, Isibor Kennedy
Ihianle, David Ada Adama
- Abstract要約: 物体分類を行いながらNVIDIA Jetson NanoWhボードの消費電力分布と解析を行った。
その結果、YOLOv5nはスループット(12.34 fps)と低消費電力(0.154 m/frame)で他のYOLOV5よりも優れていた。
- 参考スコア(独自算出の注目度): 1.1499574149885026
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern-day life is driven by electronic devices connected to the internet.
The emerging research field of the Internet-of-Things (IoT) has become popular,
just as there has been a steady increase in the number of connected devices.
Since many of these devices are utilised to perform CV tasks, it is essential
to understand their power consumption against performance. We report the power
consumption profile and analysis of the NVIDIA Jetson Nano board while
performing object classification. The authors present an extensive analysis
regarding power consumption per frame and the output in frames per second using
YOLOv5 models. The results show that the YOLOv5n outperforms other YOLOV5
variants in terms of throughput (i.e. 12.34 fps) and low power consumption
(i.e. 0.154 mWh/frame).
- Abstract(参考訳): 現代の生活はインターネットに接続された電子機器によって駆動される。
IoT(Internet-of-Things)の新たな研究分野は、コネクテッドデバイスの増加が着実に進んでいるのと同じように、人気が高まっている。
これらのデバイスの多くはcvタスクの実行に利用されるため、性能に対する消費電力を理解することが不可欠である。
物体分類を行いながらNVIDIA Jetson Nanoボードの消費電力分布と解析を行った。
筆者らは, YOLOv5モデルを用いて, フレーム毎の消費電力とフレーム毎の出力を広範囲に分析した。
その結果、YOLOv5nはスループット(12.34 fps)と低消費電力(0.154 mWh/frame)で他のYOLOV5よりも優れていた。
関連論文リスト
- Benchmarking Deep Learning Models for Object Detection on Edge Computing Devices [0.0]
YOLOv8 (Nano, Small, Medium), EfficientDet Lite (Lite0, Lite1, Lite2), SSD (SSD MobileNet V1, SSDLite MobileDet) など,最先端のオブジェクト検出モデルの評価を行った。
これらのモデルをRaspberry Pi 3、4、5、TPUアクセラレーター、Jetson Orin Nanoといった一般的なエッジデバイスにデプロイし、エネルギー消費、推論時間、平均精度(mAP)といった重要なパフォーマンス指標を収集しました。
この結果から,SSD MobileNet V1などの低mAPモデルの方がエネルギー効率が高く,高速であることが示唆された。
論文 参考訳(メタデータ) (2024-09-25T10:56:49Z) - YOLOv10: Real-Time End-to-End Object Detection [68.28699631793967]
リアルタイムオブジェクト検出の分野では,YOLOが主流のパラダイムとして浮上している。
非最大抑圧(NMS)による処理後ハマーによるYOLOのエンドツーエンドデプロイメントへの依存。
YOLOの総合的効率-精度駆動型モデル設計戦略を紹介する。
論文 参考訳(メタデータ) (2024-05-23T11:44:29Z) - YOLO-World: Real-Time Open-Vocabulary Object Detection [87.08732047660058]
オープン語彙検出機能でYOLOを強化する革新的なアプローチであるYOLO-Worldを紹介する。
提案手法は,ゼロショット方式で広範囲の物体を高効率で検出する。
YOLO-WorldはV100上で52.0 FPSの35.4 APを達成した。
論文 参考訳(メタデータ) (2024-01-30T18:59:38Z) - SATAY: A Streaming Architecture Toolflow for Accelerating YOLO Models on
FPGA Devices [48.47320494918925]
この作業は、超低レイテンシアプリケーションのために、最先端のオブジェクト検出モデルをFPGAデバイスにデプロイする際の課題に対処する。
YOLOアクセラレータにはストリーミングアーキテクチャ設計を採用しており、チップ上で完全なモデルを深くパイプライン化して実装しています。
データフロー方式でYOLOモデルの動作をサポートする新しいハードウェアコンポーネントを導入し、オンチップメモリリソースの制限に対処するために、オフチップメモリバッファリングを導入する。
論文 参考訳(メタデータ) (2023-09-04T13:15:01Z) - YOLO-MS: Rethinking Multi-Scale Representation Learning for Real-time
Object Detection [80.11152626362109]
YOLO-MSと呼ばれる効率的かつ高性能な物体検出器を提供する。
私たちは、他の大規模なデータセットに頼ることなく、MS COCOデータセット上でYOLO-MSをスクラッチからトレーニングします。
私たちの仕事は、他のYOLOモデルのプラグイン・アンド・プレイ・モジュールとしても使えます。
論文 参考訳(メタデータ) (2023-08-10T10:12:27Z) - Model Compression Methods for YOLOv5: A Review [1.2387676601792899]
比較モジュラリティのため、我々はプルーニングと量子化に重点を置いています。
これは、YOLOv5の実装の観点から、プルーニングと量子化の手法を調査する最初の具体的なレビュー論文である。
我々の研究は、リソース制限されたデバイスに実装することで、新しいバージョンのYOLOにも拡張可能であり、今日でも同様の課題が続いている。
論文 参考訳(メタデータ) (2023-07-21T21:07:56Z) - EPAM: A Predictive Energy Model for Mobile AI [6.451060076703027]
本稿では,異なるディープニューラルネットワーク(DNN)モデルと処理源を考慮したモバイルAIアプリケーションに関する総合的研究を紹介する。
4つの処理源を用いて,全モデルのレイテンシ,エネルギー消費,メモリ使用量を測定した。
私たちの研究は、CPU、GPU、NNAPIを使用して、異なるアプリケーション(ビジョンとノンビジョン)でモバイルAIがどのように振る舞うか、といった重要な洞察を強調しています。
論文 参考訳(メタデータ) (2023-03-02T09:11:23Z) - Power Efficient Video Super-Resolution on Mobile NPUs with Deep
Learning, Mobile AI & AIM 2022 challenge: Report [97.01510729548531]
低消費電力に最適化されたモバイルNPUのためのリアルタイムビデオ超解法を提案する。
モデルは、専用のAI処理ユニットを備えた強力なMediaTek Dimensity 9000プラットフォームで評価された。
提案したすべてのソリューションは上記のNPUと完全に互換性があり、最大500FPSレートと0.2[Watt / 30FPS]電力消費を示す。
論文 参考訳(メタデータ) (2022-11-07T22:33:19Z) - E^2VTS: Energy-Efficient Video Text Spotting from Unmanned Aerial
Vehicles [78.50123964690094]
無人航空機(UAV)ベースのビデオテキストスポッティングは、民間や軍事領域で広く使われている。
提案手法は,エネルギ効率と性能の競合的なトレードオフを達成し,従来の方法よりも優れていた。
論文 参考訳(メタデータ) (2022-06-05T22:43:17Z) - YOLO-Z: Improving small object detection in YOLOv5 for autonomous
vehicles [5.765622319599904]
本研究は, YOLOv5物体検出器を改良して, 小型物体の検出性能を向上させる方法について検討した。
我々は, YOLO-Z'と命名し, 50%IOUで小さな物体を検出する場合に, 最大6.9%のmAP向上を示すモデルを提案する。
本研究の目的は、YOLOv5などの一般的な検出器を調整して特定のタスクに対処する可能性について、今後の研究を知らせることである。
論文 参考訳(メタデータ) (2021-12-22T11:03:43Z) - DeepEdgeBench: Benchmarking Deep Neural Networks on Edge Devices [0.6021787236982659]
Inference time and power consumption of the four Systems on a Chip (SoCs): Asus Tinker Edge R, Raspberry Pi 4, Google Coral Dev Board, Nvidia Jetson Nano, and one microcontroller, Arduino Nano 33 BLE。
推論時間の少なさ、すなわちMobileNetV2の29.3%以下では、Jetson Nanoは他のデバイスよりも高速に動作している。
論文 参考訳(メタデータ) (2021-08-21T08:13:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。