論文の概要: Orchestrating Multimodal DNN Workloads in Wireless Neural Processing
- arxiv url: http://arxiv.org/abs/2603.02109v1
- Date: Mon, 02 Mar 2026 17:25:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-03 19:50:57.006649
- Title: Orchestrating Multimodal DNN Workloads in Wireless Neural Processing
- Title(参考訳): 無線ニューラル処理におけるマルチモーダルDNNワークロードのオーケストレーション
- Authors: Sai Xu, Kai-Kit Wong, Yanan Du, Hyundong Shin,
- Abstract要約: エッジ推論では、無線リソース割り当てとアクセラレータディープ・ニューラル・コンピューティング(DNN)のスケジューリングはまだエンドツーエンドで共最適化されていない。
本稿では,無線伝送とマルチコア実行を一貫したエンドツーエンドパイプラインに統合するパラダイムについて検討する。
- 参考スコア(独自算出の注目度): 57.510786937781866
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In edge inference, wireless resource allocation and accelerator-level deep neural network (DNN) scheduling have yet to be co-optimized in an end-to-end manner. The lack of coordination between wireless transmission and accelerator-level DNN execution prevents efficient overlap, leading to higher end-to-end inference latency. To address this issue, this paper investigates multimodal DNN workload orchestration in wireless neural processing (WNP), a paradigm that integrates wireless transmission and multi-core accelerator execution into a unified end-to-end pipeline. First, we develop a unified communication-computation model for multimodal DNN execution and formulate the corresponding optimization problem. Second, we propose O-WiN, a framework that orchestrates DNN workloads in WNP through two tightly coupled stages: simulation-based optimization and runtime execution. Third, we develop two algorithms, RTFS and PACS. RTFS schedules communication and computation sequentially, whereas PACS interleaves them to enable pipeline parallelism by overlapping wireless data transfer with accelerator-level DNN execution. Simulation results demonstrate that PACS significantly outperforms RTFS under high modality heterogeneity by better masking wireless latency through communication-computation overlap, thereby highlighting the effectiveness of communication-computation pipelining in accelerating multimodal DNN execution in WNP.
- Abstract(参考訳): エッジ推論では、無線リソース割り当てとアクセラレータレベルのディープニューラルネットワーク(DNN)スケジューリングは、エンドツーエンドではまだ共最適化されていない。
無線伝送とアクセラレータレベルのDNN実行のコーディネーションの欠如により、効率のオーバーラップが防止され、エンドツーエンドの推論レイテンシが向上する。
本稿では,無線通信とマルチコアアクセラレータ実行を統合するパラダイムである無線ニューラル処理(WNP)におけるマルチモーダルDNNワークロードオーケストレーションについて検討する。
まず、マルチモーダルDNN実行のための統一的な通信計算モデルを開発し、対応する最適化問題を定式化する。
第2に、シミュレーションベースの最適化と実行実行という2つの密結合ステージを通じて、WNPのDNNワークロードを編成するフレームワークであるO-WiNを提案する。
第3に、RTFSとPACSの2つのアルゴリズムを開発する。
RTFSは通信と計算を逐次スケジュールするが、PACSはそれらをインターリーブし、無線データ転送とアクセルレベルのDNNの実行を重畳してパイプライン並列化を可能にする。
シミュレーションの結果、PACSは通信-計算オーバーラップによる無線遅延のマスキングを向上し、WNPにおけるマルチモーダルDNN実行の高速化における通信-計算パイプライン化の有効性を明らかにすることにより、高いモダリティの不均一性下でRTFSを著しく上回ることを示した。
関連論文リスト
- Joint Optimization of Model Partitioning and Resource Allocation for Anti-Jamming Collaborative Inference Systems [52.842088497389746]
この手紙は、悪意のあるジャマーの存在下での、アンチジャミングの協調推論システムに焦点を当てている。
まず、ジャミングとDNNパーティショニングがデータ回帰による推測精度に与える影響を解析する。
問題を3つのサブプロブレムに分解する,効率的な交互最適化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2026-03-03T03:52:52Z) - Resource Allocation in Hybrid Radio-Optical IoT Networks using GNN with Multi-task Learning [11.833896722352568]
本稿では,光ニューラルOWCと電波周波数(RF)を統合したハイブリッドモノのインターネット(IoT)ネットワークにおけるデュアルテクノロジースケジューリングの問題に対処する。
本稿では,2段階グラフ埋め込みとトランスフォーマー(DGET)フレームワークを組み合わせた教師付きマルチタスク学習アーキテクチャを提案する。
提案フレームワークは、90%以上の分類精度で最適に近いスケジューリングを実現し、計算複雑性を低減し、部分的なチャネルオブザーバビリティの下で高いロバスト性を示す。
論文 参考訳(メタデータ) (2025-10-29T15:02:28Z) - Intra-DP: A High Performance Collaborative Inference System for Mobile Edge Computing [67.98609858326951]
Intra-DPはモバイルデバイス上でのディープニューラルネットワーク(DNN)に最適化された高性能な協調推論システムである。
推論毎のレイテンシを最大50%削減し、最先端のベースラインと比較してエネルギー消費量を最大75%削減する。
評価の結果,DP内の遅延は,最先端のベースラインと比較して最大50%,エネルギー消費は最大75%減少することがわかった。
論文 参考訳(メタデータ) (2025-07-08T09:50:57Z) - Communication-Efficient Federated Learning by Quantized Variance Reduction for Heterogeneous Wireless Edge Networks [55.467288506826755]
フェデレーテッド・ラーニング(FL)は、無線エッジネットワークにおけるローカル・プライバシ・アウェア・コラボレーティブ・モデルトレーニングの有効なソリューションとして認識されている。
既存の通信効率の高いFLアルゴリズムは、デバイス間の大きなばらつきを低減できない。
本稿では,高度分散還元方式に依存する新しい通信効率FLアルゴリズムであるFedQVRを提案する。
論文 参考訳(メタデータ) (2025-01-20T04:26:21Z) - Neuromorphic Wireless Split Computing with Multi-Level Spikes [69.73249913506042]
ニューロモルフィックコンピューティングは、スパイキングニューラルネットワーク(SNN)を使用して推論タスクを実行する。
スパイクニューロン間で交換される各スパイクに小さなペイロードを埋め込むことで、エネルギー消費を増大させることなく推論精度を高めることができる。
分割コンピューティング — SNNを2つのデバイスに分割する — は、有望なソリューションだ。
本稿では,マルチレベルSNNを用いたニューロモルフィック無線分割コンピューティングアーキテクチャの総合的研究について述べる。
論文 参考訳(メタデータ) (2024-11-07T14:08:35Z) - Trustworthy DNN Partition for Blockchain-enabled Digital Twin in Wireless IIoT Networks [32.42557641803365]
産業用モノのインターネット(IIoT)ネットワークにおける製造効率を高めるための有望なソリューションとして、Digital twin (DT)が登場した。
本稿では,ディープニューラルネットワーク(DNN)分割技術と評価に基づくコンセンサス機構を用いたブロックチェーン対応DT(B-DT)フレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-28T07:34:12Z) - Accurate and Efficient Event-based Semantic Segmentation Using Adaptive Spiking Encoder-Decoder Network [20.05283214295881]
イベントベースのセンサから動的に非同期な信号を処理するための有望なソリューションとして、スパイキングニューラルネットワーク(SNN)が登場している。
大規模イベントベースセマンティックセマンティックセグメンテーションタスクのための効率的なスパイキングエンコーダデコーダネットワーク(SpikingEDN)を開発した。
適応しきい値を利用して、ストリーミング推論におけるネットワーク精度、空間性、ロバスト性を改善する。
論文 参考訳(メタデータ) (2023-04-24T07:12:50Z) - Multi-Flow Transmission in Wireless Interference Networks: A Convergent
Graph Learning Approach [9.852567834643292]
ネットワークデータ信号の2段階干渉対応マルチフロー最適化(DIAMOND)という新しいアルゴリズムを提案する。
集中型ステージは、グラフニューラルネットワーク(GNN)強化学習(RL)ルーティングエージェントの新しい設計を用いて、マルチフロー伝送戦略を計算する。
そして、分散学習更新の新しい設計に基づいて、分散ステージにより性能が向上する。
論文 参考訳(メタデータ) (2023-03-27T18:49:47Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。