論文の概要: SmartDet: Context-Aware Dynamic Control of Edge Task Offloading for
Mobile Object Detection
- arxiv url: http://arxiv.org/abs/2201.04235v1
- Date: Tue, 11 Jan 2022 23:01:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-13 14:19:09.597462
- Title: SmartDet: Context-Aware Dynamic Control of Edge Task Offloading for
Mobile Object Detection
- Title(参考訳): smartdet:モバイルオブジェクト検出のためのエッジタスクオフロードのコンテキストアウェア動的制御
- Authors: Davide Callegaro and Francesco Restuccia and Marco Levorato
- Abstract要約: モバイルデバイスはますます、重要なタスクを実行するためにディープニューラルネットワーク(DNN)を介してオブジェクト検出(OD)に依存している。
低複雑さオブジェクトトラッキング(OT)はODで使用することができ、後者はトラッキングのための"フレッシュ"参照を生成するために定期的に適用される。
我々は,大規模なODレイテンシに耐性のある並列OT(モバイルデバイス)とOD(エッジサーバ)プロセスを提案する。
- 参考スコア(独自算出の注目度): 19.106380479438172
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mobile devices increasingly rely on object detection (OD) through deep neural
networks (DNNs) to perform critical tasks. Due to their high complexity, the
execution of these DNNs requires excessive time and energy. Low-complexity
object tracking (OT) can be used with OD, where the latter is periodically
applied to generate "fresh" references for tracking. However, the frames
processed with OD incur large delays, which may make the reference outdated and
degrade tracking quality. Herein, we propose to use edge computing in this
context, and establish parallel OT (at the mobile device) and OD (at the edge
server) processes that are resilient to large OD latency. We propose Katch-Up,
a novel tracking mechanism that improves the system resilience to excessive OD
delay. However, while Katch-Up significantly improves performance, it also
increases the computing load of the mobile device. Hence, we design SmartDet, a
low-complexity controller based on deep reinforcement learning (DRL) that
learns controlling the trade-off between resource utilization and OD
performance. SmartDet takes as input context-related information related to the
current video content and the current network conditions to optimize frequency
and type of OD offloading, as well as Katch-Up utilization. We extensively
evaluate SmartDet on a real-world testbed composed of a JetSon Nano as mobile
device and a GTX 980 Ti as edge server, connected through a Wi-Fi link.
Experimental results show that SmartDet achieves an optimal balance between
tracking performance - mean Average Recall (mAR) and resource usage. With
respect to a baseline with full Katch-Upusage and maximum channel usage, we
still increase mAR by 4% while using 50% less of the channel and 30% power
resources associated with Katch-Up. With respect to a fixed strategy using
minimal resources, we increase mAR by 20% while using Katch-Up on 1/3 of the
frames.
- Abstract(参考訳): モバイルデバイスはますます、重要なタスクを実行するためにディープニューラルネットワーク(DNN)を介してオブジェクト検出(OD)に依存している。
複雑さが高いため、これらのDNNの実行には過剰な時間とエネルギーが必要である。
低複雑さオブジェクトトラッキング(OT)はODで使用することができ、後者はトラッキングのための"フレッシュ"参照を生成するために定期的に適用される。
しかし、odで処理されたフレームには大きな遅延が発生し、基準が時代遅れとなり追跡品質が低下する可能性がある。
本稿では、エッジコンピューティングをこの文脈で使用し、大規模なODレイテンシに耐性のある(モバイルデバイスで)並列OTとOD(エッジサーバで)プロセスを確立することを提案する。
過度のod遅延に対するシステムのレジリエンスを向上させる新しいトラッキング機構であるkatch-upを提案する。
しかし、Katch-Upは性能が大幅に向上する一方、モバイルデバイスの計算負荷も増大する。
そこで我々は,資源利用とOD性能のトレードオフの制御を学習する深層強化学習(DRL)に基づく,低複雑さのコントローラであるSmartDetを設計する。
smartdetは、現在のビデオコンテンツと現在のネットワーク条件に関連する入力コンテキスト関連情報を取り、odオフロードの頻度とタイプを最適化し、katch-up利用を最適化する。
我々は,JetSon Nanoをモバイルデバイスとして,GTX 980 Tiをエッジサーバとして,Wi-Fiリンクを介して接続した実世界のテストベッド上でSmartDetを広範囲に評価した。
実験結果によると、SmartDetは、平均的リコール(mAR)とリソース使用量という、トラッキングパフォーマンスの最適なバランスを実現している。
完全なKatch-Upusageと最大チャネル使用率を持つベースラインに関しては、チャネルの50%削減とKatch-Upに関連する30%の電力リソースを使用しながら、mARを4%増加させています。
最小限の資源を用いた固定戦略では、フレームの1/3でKatch-Upを用いてmARを20%増加させる。
関連論文リスト
- Accelerating Linear Recurrent Neural Networks for the Edge with Unstructured Sparsity [39.483346492111515]
線形リカレントニューラルネットワークは、推論中に一定のメモリ使用量と時間毎の時間を含む強力な長距離シーケンスモデリングを可能にする。
非構造化空間は、互換性のあるハードウェアプラットフォームによって加速されるときに、計算とメモリの要求を大幅に削減できる魅力的なソリューションを提供する。
非常に疎い線形RNNは、高密度ベースラインよりも高い効率と性能のトレードオフを一貫して達成している。
論文 参考訳(メタデータ) (2025-02-03T13:09:21Z) - USEFUSE: Utile Stride for Enhanced Performance in Fused Layer Architecture of Deep Neural Networks [0.6435156676256051]
本研究では,低レイテンシ左から右へのビットシリアル演算を用いた畳み込みのためのSum-of-Products (SOP)ユニットを提案する。
有効メカニズムは、ReLU層の後、非効率な畳み込みを検出し、スキップし、消費電力を最小化する。
ひとつはミッションクリティカルなアプリケーションの応答時間を最小限にすること、もうひとつはリソースに制約のあるデバイスに同じレイテンシでフォーカスすることである。
論文 参考訳(メタデータ) (2024-12-18T11:04:58Z) - Adaptive Quantization Resolution and Power Control for Federated Learning over Cell-free Networks [41.23236059700041]
Federated Learning(FL)は、ローカルモデルの更新を生のデータセットではなくサーバと交換することで、グローバルモデルをトレーニングする分散学習フレームワークである。
セルフリーの大規模マルチインプット多重出力(CFmMIMO)は、同じ時間/周波数のリソースを同じレートで多くのユーザに提供する、有望なソリューションである。
本稿では, フラッグラー効果を緩和するために, FLアプリケーションと物理層を同時最適化する。
論文 参考訳(メタデータ) (2024-12-14T16:08:05Z) - Efficient Multi-Object Tracking on Edge Devices via Reconstruction-Based Channel Pruning [0.2302001830524133]
現代のMOTシステムで使用されるような複雑なネットワークの圧縮に適したニューラルネットワークプルーニング手法を提案する。
我々は、高い精度を維持しつつ、最大70%のモデルサイズ削減を実現し、さらにJetson Orin Nanoの性能を向上させる。
論文 参考訳(メタデータ) (2024-10-11T12:37:42Z) - Exploring Dynamic Transformer for Efficient Object Tracking [58.120191254379854]
効率的なトラッキングのための動的トランスフォーマーフレームワークであるDyTrackを提案する。
DyTrackは、様々な入力に対して適切な推論ルートを設定することを学習し、利用可能な計算予算をより活用する。
複数のベンチマークの実験では、DyTrackは単一のモデルで有望な速度精度のトレードオフを実現している。
論文 参考訳(メタデータ) (2024-03-26T12:31:58Z) - PNAS-MOT: Multi-Modal Object Tracking with Pareto Neural Architecture Search [64.28335667655129]
複数の物体追跡は、自律運転において重要な課題である。
トラッキングの精度が向上するにつれて、ニューラルネットワークはますます複雑になり、レイテンシが高いため、実際の運転シナリオにおける実践的な応用に課題が生じる。
本稿では,ニューラル・アーキテクチャ・サーチ(NAS)手法を用いて追跡のための効率的なアーキテクチャを探索し,比較的高い精度を維持しつつ,低リアルタイム遅延を実現することを目的とした。
論文 参考訳(メタデータ) (2024-03-23T04:18:49Z) - Context-aware Multi-Model Object Detection for Diversely Heterogeneous
Compute Systems [0.32634122554914]
ディープニューラルネットワーク(DNN)を用いた物体検出への1サイズ全アプローチは、計算資源の非効率な利用につながる。
本稿では,動的に変化する文脈情報や計算制約に応じて,様々なDNNベースのODモデルから連続的に選択するShiftを提案する。
提案手法は、最先端のGPUベースの単一モデルODアプローチと比較して、エネルギー使用率7.5倍、レイテンシ2.8倍の改善をもたらす。
論文 参考訳(メタデータ) (2024-02-12T05:38:11Z) - MAPLE-Edge: A Runtime Latency Predictor for Edge Devices [80.01591186546793]
汎用ハードウェアの最先端遅延予測器であるMAPLEのエッジデバイス指向拡張であるMAPLE-Edgeを提案する。
MAPLEと比較して、MAPLE-Edgeはより小さなCPUパフォーマンスカウンタを使用して、ランタイムとターゲットデバイスプラットフォームを記述することができる。
また、共通ランタイムを共有するデバイスプール上でトレーニングを行うMAPLEとは異なり、MAPLE-Edgeは実行時に効果的に一般化できることを示す。
論文 参考訳(メタデータ) (2022-04-27T14:00:48Z) - Energy-Efficient Model Compression and Splitting for Collaborative
Inference Over Time-Varying Channels [52.60092598312894]
本稿では,エッジノードとリモートノード間のモデル圧縮と時間変化モデル分割を利用して,エッジデバイスにおける総エネルギーコストを削減する手法を提案する。
提案手法は, 検討されたベースラインと比較して, エネルギー消費が最小限であり, 排出コストが$CO$となる。
論文 参考訳(メタデータ) (2021-06-02T07:36:27Z) - WNARS: WFST based Non-autoregressive Streaming End-to-End Speech
Recognition [59.975078145303605]
本稿では,ハイブリッドCTC-attention AEDモデルと重み付き有限状態トランスデューサを用いた新しいフレームワークWNARSを提案する。
AISHELL-1タスクでは、640msの遅延で5.22%の文字エラー率を達成し、オンラインASRの最先端のパフォーマンスである私たちの知識を最大限に活用します。
論文 参考訳(メタデータ) (2021-04-08T07:56:03Z) - FastFlowNet: A Lightweight Network for Fast Optical Flow Estimation [81.76975488010213]
ディセンス光学フロー推定は、多くのロボットビジョンタスクで重要な役割を果たしています。
現在のネットワークはしばしば多くのパラメータを占有し、計算コストがかかる。
提案したFastFlowNetは、周知の粗大なやり方で、以下のイノベーションで機能する。
論文 参考訳(メタデータ) (2021-03-08T03:09:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。