論文の概要: HeteroEdge: Addressing Asymmetry in Heterogeneous Collaborative
Autonomous Systems
- arxiv url: http://arxiv.org/abs/2305.03252v1
- Date: Fri, 5 May 2023 02:43:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-08 15:39:05.218364
- Title: HeteroEdge: Addressing Asymmetry in Heterogeneous Collaborative
Autonomous Systems
- Title(参考訳): heteroedge:異種協調自律システムにおける非対称性の解消
- Authors: Mohammad Saeid Anwar, Emon Dey, Maloy Kumar Devnath, Indrajeet Ghosh,
Naima Khan, Jade Freeman, Timothy Gregory, Niranjan Suri, Kasthuri Jayaraja,
Sreenivasan Ramasamy Ramamurthy, Nirmalya Roy
- Abstract要約: 2台の無人地上車両(UGV)と2台のNVIDIA Jetsonデバイスからなるテストベッドの自己適応最適化フレームワークを提案する。
このフレームワークは、異種ノード上の複数のタスク(ストレージ、処理、計算、送信、推論)を同時に効率的に管理する。
入力された画像フレームの圧縮とマスキング、類似したフレームの識別、および最適化のための境界条件を得るためにプロファイリング装置を含む。
- 参考スコア(独自算出の注目度): 1.274065448486689
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Gathering knowledge about surroundings and generating situational awareness
for IoT devices is of utmost importance for systems developed for smart urban
and uncontested environments. For example, a large-area surveillance system is
typically equipped with multi-modal sensors such as cameras and LIDARs and is
required to execute deep learning algorithms for action, face, behavior, and
object recognition. However, these systems face power and memory constraints
due to their ubiquitous nature, making it crucial to optimize data processing,
deep learning algorithm input, and model inference communication. In this
paper, we propose a self-adaptive optimization framework for a testbed
comprising two Unmanned Ground Vehicles (UGVs) and two NVIDIA Jetson devices.
This framework efficiently manages multiple tasks (storage, processing,
computation, transmission, inference) on heterogeneous nodes concurrently. It
involves compressing and masking input image frames, identifying similar
frames, and profiling devices to obtain boundary conditions for optimization..
Finally, we propose and optimize a novel parameter split-ratio, which indicates
the proportion of the data required to be offloaded to another device while
considering the networking bandwidth, busy factor, memory (CPU, GPU, RAM), and
power constraints of the devices in the testbed. Our evaluations captured while
executing multiple tasks (e.g., PoseNet, SegNet, ImageNet, DetectNet, DepthNet)
simultaneously, reveal that executing 70% (split-ratio=70%) of the data on the
auxiliary node minimizes the offloading latency by approx. 33% (18.7 ms/image
to 12.5 ms/image) and the total operation time by approx. 47% (69.32s to
36.43s) compared to the baseline configuration (executing on the primary node).
- Abstract(参考訳): 環境に関する知識を集め、IoTデバイスに対する状況認識を生み出すことは、スマート都市および未テスト環境向けに開発されたシステムにとって最も重要である。
例えば、大規模な監視システムは、通常、カメラやLIDARのようなマルチモーダルセンサーを備えており、アクション、顔、行動、オブジェクト認識のためのディープラーニングアルゴリズムを実行する必要がある。
しかし、これらのシステムはユビキタスな性質のために電力とメモリの制約に直面しており、データ処理、ディープラーニングアルゴリズム入力、モデル推論通信を最適化することが重要である。
本論文では、2台の無人地上車両(UGV)と2台のNVIDIA Jetsonデバイスからなるテストベッドの自己適応最適化フレームワークを提案する。
このフレームワークは、異種ノード上の複数のタスク(ストレージ、処理、計算、送信、推論)を同時に効率的に管理する。
入力された画像フレームの圧縮とマスキング、類似したフレームの識別、および最適化のための境界条件を得るためにプロファイリング装置を含む。
.
最後に、ネットワーク帯域幅、忙しい要因、メモリ(CPU、GPU、RAM)、テストベッド内のデバイスの電力制約を考慮して、別のデバイスにオフロードするために必要なデータの比率を示す新しいパラメータ分割比を提案し、最適化する。
複数のタスク(PoseNet, SegNet, ImageNet, DetectNet, DepthNetなど)を同時に実行中に得られた評価から,補助ノード上のデータの70%(split-ratio=70%)の実行は,アロックスによるオフロードレイテンシを最小化します。
33%(18.7ms/画像から12.5ms/画像)、総動作時間は約2。
47%(69.32sから36.43s)であり、ベースライン構成(プライマリノードで実行)と比較した。
関連論文リスト
- Detection-segmentation convolutional neural network for autonomous
vehicle perception [0.0]
物体検出とセグメンテーションは、自動運転車の認識システムの2つの中核モジュールである。
現在最もよく使われているアルゴリズムはディープニューラルネットワークに基づいており、高い効率性を保証するが、高性能なコンピューティングプラットフォームを必要とする。
ネットワークの複雑さの低減は、適切なアーキテクチャ、表現、コンピューティングプラットフォームを使用することで達成できる。
論文 参考訳(メタデータ) (2023-06-30T08:54:52Z) - UNETR++: Delving into Efficient and Accurate 3D Medical Image Segmentation [93.88170217725805]
本稿では,高画質なセグメンテーションマスクと,パラメータ,計算コスト,推論速度の両面での効率性を提供するUNETR++という3次元医用画像セグメンテーション手法を提案する。
我々の設計の核となるのは、空間的およびチャネル的な識別的特徴を効率的に学習する、新しい効率的な対注意ブロック(EPA)の導入である。
Synapse, BTCV, ACDC, BRaTs, Decathlon-Lungの5つのベンチマークで評価した結果, 効率と精度の両面で, コントリビューションの有効性が示された。
論文 参考訳(メタデータ) (2022-12-08T18:59:57Z) - HALSIE: Hybrid Approach to Learning Segmentation by Simultaneously
Exploiting Image and Event Modalities [6.543272301133159]
イベントカメラは、非同期イベントストリームを生成するためにピクセルごとの強度の変化を検出する。
リアルタイム自律システムにおいて、正確なセマンティックマップ検索のための大きな可能性を秘めている。
イベントセグメンテーションの既存の実装は、サブベースのパフォーマンスに悩まされている。
本研究では,ハイブリット・エンド・エンド・エンドの学習フレームワークHALSIEを提案する。
論文 参考訳(メタデータ) (2022-11-19T17:09:50Z) - Task-Oriented Sensing, Computation, and Communication Integration for
Multi-Device Edge AI [108.08079323459822]
本稿では,AIモデルの分割推論と統合センシング通信(ISAC)を併用した,新しいマルチインテリジェントエッジ人工レイテンシ(AI)システムについて検討する。
推定精度は近似的だが抽出可能な計量、すなわち判別利得を用いて測定する。
論文 参考訳(メタデータ) (2022-07-03T06:57:07Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - Multi-Exit Semantic Segmentation Networks [78.44441236864057]
本稿では,最先端セグメンテーションモデルをMESSネットワークに変換するフレームワークを提案する。
パラメトリド早期出口を用いた特別訓練されたCNNは、より簡単なサンプルの推測時に、その深さに沿って保存する。
接続されたセグメンテーションヘッドの数、配置、アーキテクチャとエグジットポリシーを併用して、デバイス機能とアプリケーション固有の要件に適応する。
論文 参考訳(メタデータ) (2021-06-07T11:37:03Z) - Efficient Two-Stream Network for Violence Detection Using Separable
Convolutional LSTM [0.0]
Separable Convolutional LSTM(SepConvLSTM)と予め訓練されたMobileNetを活用した効率的な2ストリームディープラーニングアーキテクチャを提案する。
SepConvLSTMは、ConvLSTMの各ゲートの畳み込み操作を深さ方向に分離可能な畳み込みに置き換えて構築されます。
我々のモデルは、大きくて挑戦的なrwf-2000データセットの精度を2%以上上回っている。
論文 参考訳(メタデータ) (2021-02-21T12:01:48Z) - Multi-Task Network Pruning and Embedded Optimization for Real-time
Deployment in ADAS [0.0]
カメラベースのディープラーニングアルゴリズムは、自動運転システムにおける認識にますます必要である。
自動車業界からの制約は、限られた計算リソースで組み込みシステムを課すことでCNNの展開に挑戦します。
商用プロトタイププラットフォーム上で,このような条件下でマルチタスクCNNネットワークを埋め込む手法を提案する。
論文 参考訳(メタデータ) (2021-01-19T19:29:38Z) - Multi-scale Interaction for Real-time LiDAR Data Segmentation on an
Embedded Platform [62.91011959772665]
LiDARデータのリアルタイムセマンティックセグメンテーションは、自動運転車にとって不可欠である。
ポイントクラウド上で直接動作する現在のアプローチでは、複雑な空間集約操作を使用する。
本稿では,マルチスケールインタラクションネットワーク(MINet)と呼ばれるプロジェクションベースの手法を提案する。
論文 参考訳(メタデータ) (2020-08-20T19:06:11Z) - Identity-Aware Attribute Recognition via Real-Time Distributed Inference
in Mobile Edge Clouds [53.07042574352251]
我々は、MEC対応カメラ監視システムにおいて、re-IDを用いた歩行者属性認識のための新しいモデルの設計を行う。
本稿では,属性認識と人物再IDを協調的に考慮し,分散モジュールの集合を持つ新しい推論フレームワークを提案する。
そこで我々は,提案した分散推論フレームワークのモジュール分布の学習に基づくアルゴリズムを考案した。
論文 参考訳(メタデータ) (2020-08-12T12:03:27Z) - TASO: Time and Space Optimization for Memory-Constrained DNN Inference [5.023660118588569]
畳み込みニューラルネットワーク(CNN)は、産業用ロボティクスや自動化システムからモバイルデバイスでの生体認証まで、多くの組み込みアプリケーションで使用されている。
本稿では、畳み込み層を実装するプリミティブ演算を選択するための整数線形計画法(ILP)に基づくCNNモデルの事前ドメイン固有最適化手法を提案する。
論文 参考訳(メタデータ) (2020-05-21T15:08:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。