論文の概要: A Framework for Benchmarking Real-Time Embedded Object Detection
- arxiv url: http://arxiv.org/abs/2304.11580v1
- Date: Sun, 23 Apr 2023 08:34:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-25 17:31:18.966140
- Title: A Framework for Benchmarking Real-Time Embedded Object Detection
- Title(参考訳): リアルタイム組込み物体検出ベンチマークのためのフレームワーク
- Authors: Michael Schlosser and Daniel K\"onig and Michael Teutsch
- Abstract要約: ディープニューラルネットワーク(DNN)は、オブジェクト検出に適したアプローチである。
DNNは、推論時に高い効率を保証するために、ハードウェア固有の最適化とともに高度に適応したハードウェアを必要とする。
これは、エッジデバイスのような限られたハードウェア上のビデオストリーミングアプリケーションにおいて、効率的なオブジェクト検出を目指している場合に特に当てはまる。
本稿では,MQTTプロトコルに基づく軽量インタフェースとともに,ホストアプリケーションとホストコンピュータを使用するフレームワークを提案する。
- 参考スコア(独自算出の注目度): 3.811501164193159
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object detection is one of the key tasks in many applications of computer
vision. Deep Neural Networks (DNNs) are undoubtedly a well-suited approach for
object detection. However, such DNNs need highly adapted hardware together with
hardware-specific optimization to guarantee high efficiency during inference.
This is especially the case when aiming for efficient object detection in video
streaming applications on limited hardware such as edge devices. Comparing
vendor-specific hardware and related optimization software pipelines in a fair
experimental setup is a challenge. In this paper, we propose a framework that
uses a host computer with a host software application together with a
light-weight interface based on the Message Queuing Telemetry Transport (MQTT)
protocol. Various different target devices with target apps can be connected
via MQTT with this host computer. With well-defined and standardized MQTT
messages, object detection results can be reported to the host computer, where
the results are evaluated without harming or influencing the processing on the
device. With this quite generic framework, we can measure the object detection
performance, the runtime, and the energy efficiency at the same time. The
effectiveness of this framework is demonstrated in multiple experiments that
offer deep insights into the optimization of DNNs.
- Abstract(参考訳): 物体検出はコンピュータビジョンの多くのアプリケーションにおいて重要なタスクの1つである。
ディープニューラルネットワーク(DNN)は、間違いなくオブジェクト検出に適しているアプローチである。
しかし、これらのDNNは、推論時に高い効率を保証するために、ハードウェア固有の最適化と共に高度に適応したハードウェアを必要とする。
これは特に、エッジデバイスのような限られたハードウェア上のビデオストリーミングアプリケーションにおける効率的なオブジェクト検出を目指しています。
ベンダー固有のハードウェアと関連する最適化ソフトウェアパイプラインを公平な実験的なセットアップで比較することは難しい。
本稿では,ホストコンピュータとホストソフトウェアアプリケーションと,メッセージキューイングテレメトリトランスポート(MQTT)プロトコルに基づく軽量インターフェースを併用したフレームワークを提案する。
ターゲットアプリを持つさまざまなターゲットデバイスは、このホストコンピュータとMQTTを介して接続することができる。
明確に定義された標準化されたMQTTメッセージでは、オブジェクト検出結果がホストコンピュータに報告され、結果がデバイス上の処理を傷つけたり影響したりすることなく評価される。
この非常に一般的なフレームワークでは、オブジェクト検出性能、ランタイム、そしてエネルギー効率を同時に測定できます。
このフレームワークの有効性は、DNNの最適化に関する深い洞察を提供する複数の実験で実証されている。
関連論文リスト
- Multi-objective Differentiable Neural Architecture Search [58.67218773054753]
本研究では,パフォーマンスとハードウェアメトリクスのトレードオフのために,ユーザの好みを符号化するNASアルゴリズムを提案する。
提案手法は,既存のMOO NAS手法を,定性的に異なる検索空間やデータセットの広い範囲で性能良くする。
論文 参考訳(メタデータ) (2024-02-28T10:09:04Z) - RIDE: Real-time Intrusion Detection via Explainable Machine Learning
Implemented in a Memristor Hardware Architecture [24.824596231020585]
本稿では、パケットの任意の長さのシーケンスをよりコンパクトな結合機能埋め込みに統合するために、リカレントオートエンコーダを利用するパケットレベルのネットワーク侵入検出ソリューションを提案する。
提案手法は,パケットレベルで高い検出精度で,極めて効率的かつリアルタイムな解が得られることを示す。
論文 参考訳(メタデータ) (2023-11-27T17:30:19Z) - Fast and Resource-Efficient Object Tracking on Edge Devices: A
Measurement Study [9.976630547252427]
マルチオブジェクトトラッキング(MOT)は動く物体を検出し、実際のシーンがビデオに写っているときにフレームによって位置をトラッキングする。
本稿では,オブジェクト追跡における性能問題とエッジ固有の最適化機会について検討する。
EMOと呼ばれるエッジ固有のパフォーマンス最適化戦略をいくつか提示し、リアルタイムオブジェクト追跡を高速化する。
論文 参考訳(メタデータ) (2023-09-06T02:25:36Z) - Energy-efficient Task Adaptation for NLP Edge Inference Leveraging
Heterogeneous Memory Architectures [68.91874045918112]
Adapter-ALBERTは、様々なタスクにわたる最大データ再利用のための効率的なモデル最適化である。
検証されたNLPエッジアクセラレータ上でシミュレーションを行うことにより、モデルを不均一なオンチップメモリアーキテクチャにマッピングする利点を実証する。
論文 参考訳(メタデータ) (2023-03-25T14:40:59Z) - DOTIE -- Detecting Objects through Temporal Isolation of Events using a
Spiking Architecture [5.340730281227837]
視覚に基づく自律ナビゲーションシステムは障害物を避けるために高速で正確な物体検出アルゴリズムに依存している。
本研究では,イベントに固有の時間的情報を用いて移動物体を効率的に検出する手法を提案する。
我々のアーキテクチャを利用することで、自律ナビゲーションシステムは、オブジェクト検出を行うための最小のレイテンシとエネルギーオーバーヘッドを持つことが示される。
論文 参考訳(メタデータ) (2022-10-03T14:43:11Z) - MAPLE-X: Latency Prediction with Explicit Microprocessor Prior Knowledge [87.41163540910854]
ディープニューラルネットワーク(DNN)レイテンシのキャラクタリゼーションは、時間を要するプロセスである。
ハードウェアデバイスの事前知識とDNNアーキテクチャのレイテンシを具体化し,MAPLEを拡張したMAPLE-Xを提案する。
論文 参考訳(メタデータ) (2022-05-25T11:08:20Z) - MAPLE-Edge: A Runtime Latency Predictor for Edge Devices [80.01591186546793]
汎用ハードウェアの最先端遅延予測器であるMAPLEのエッジデバイス指向拡張であるMAPLE-Edgeを提案する。
MAPLEと比較して、MAPLE-Edgeはより小さなCPUパフォーマンスカウンタを使用して、ランタイムとターゲットデバイスプラットフォームを記述することができる。
また、共通ランタイムを共有するデバイスプール上でトレーニングを行うMAPLEとは異なり、MAPLE-Edgeは実行時に効果的に一般化できることを示す。
論文 参考訳(メタデータ) (2022-04-27T14:00:48Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - Multi-Task Network Pruning and Embedded Optimization for Real-time
Deployment in ADAS [0.0]
カメラベースのディープラーニングアルゴリズムは、自動運転システムにおける認識にますます必要である。
自動車業界からの制約は、限られた計算リソースで組み込みシステムを課すことでCNNの展開に挑戦します。
商用プロトタイププラットフォーム上で,このような条件下でマルチタスクCNNネットワークを埋め込む手法を提案する。
論文 参考訳(メタデータ) (2021-01-19T19:29:38Z) - Depthwise Non-local Module for Fast Salient Object Detection Using a
Single Thread [136.2224792151324]
本稿では,高速な物体検出のための新しいディープラーニングアルゴリズムを提案する。
提案アルゴリズムは,1つのCPUスレッドと同時に,競合精度と高い推論効率を実現する。
論文 参考訳(メタデータ) (2020-01-22T15:23:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。