論文の概要: Channel-Adaptive Edge AI: Maximizing Inference Throughput by Adapting Computational Complexity to Channel States
- arxiv url: http://arxiv.org/abs/2603.03146v1
- Date: Tue, 03 Mar 2026 16:33:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-04 21:38:10.880102
- Title: Channel-Adaptive Edge AI: Maximizing Inference Throughput by Adapting Computational Complexity to Channel States
- Title(参考訳): Channel-Adaptive Edge AI: 計算複雑性をチャネル状態に適応させることによる推論出力の最大化
- Authors: Jierui Zhang, Jianhao Huang, Kaibin Huang,
- Abstract要約: emph通信と計算(IC$2$)は、6Gネットワークにおける効率的なエッジ推論を実現するための新しいパラダイムとして登場した。
この計量は、チャネル歪みと人工知能(AI)モデルアーキテクチャと計算複雑性の両方を考慮する必要があるため、非常に複雑である。
我々は、E2E推論精度の抽出可能な解析モデルを開発し、それを利用して、推論スループットを最大化するEmph Channel-Adaptive AIアルゴリズムを設計する。
- 参考スコア(独自算出の注目度): 31.472509140661796
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: \emph{Integrated communication and computation} (IC$^2$) has emerged as a new paradigm for enabling efficient edge inference in sixth-generation (6G) networks. However, the design of IC$^2$ technologies is hindered by the lack of a tractable theoretical framework for characterizing \emph{end-to-end} (E2E) inference performance. The metric is highly complicated as it needs to account for both channel distortion and artificial intelligence (AI) model architecture and computational complexity. In this work, we address this challenge by developing a tractable analytical model for E2E inference accuracy and leveraging it to design a \emph{channel-adaptive AI} algorithm that maximizes inference throughput, referred to as the edge processing rate (EPR), under latency and accuracy constraints. Specifically, we consider an edge inference system in which a server deploys a backbone model with early exit, which enables flexible computational complexity, to perform inference on data features transmitted by a mobile device. The proposed accuracy model characterizes high-dimensional feature distributions in the angular domain using a Mixture of von Mises (MvM) distribution. This leads to a desired closed-form expression for inference accuracy as a function of quantization bit-width and model traversal depth, which represents channel distortion and computational complexity, respectively. Building upon this accuracy model, we formulate and solve the EPR maximization problem under joint latency and accuracy constraints, leading to a channel-adaptive AI algorithm that achieves full IC$^2$ integration. The proposed algorithm jointly adapts transmit-side feature compression and receive-side model complexity according to channel conditions to maximize overall efficiency and inference throughput. Experimental results demonstrate its superior performance as compared with fixed-complexity counterparts.
- Abstract(参考訳): 第6世代(6G)ネットワークにおいて、効率的なエッジ推論を実現するための新しいパラダイムとして、 \emph{Integrated communication and computation} (IC$^2$)が登場した。
しかし、IC$^2$ 技術の設計は、emph{end-to-end} (E2E) 推論性能を特徴付けるための難解な理論フレームワークが欠如していることから妨げられている。
この計量は、チャネル歪みと人工知能(AI)モデルアーキテクチャと計算複雑性の両方を考慮する必要があるため、非常に複雑である。
本研究では,エッジ処理率(EPR)と呼ばれる推論スループットを,レイテンシと精度の制約の下で最大化する,E2E推論精度の抽出可能な解析モデルを開発し,それを活用して,推論スループットを最大化する「emph{ channel-adaptive AI}」アルゴリズムを設計する。
具体的には、サーバが早期終了時にバックボーンモデルをデプロイし、柔軟な計算複雑性を実現するエッジ推論システムを検討し、モバイルデバイスから送信されるデータの特徴を推論する。
提案した精度モデルは,MvM分布を用いた角領域の高次元特徴分布を特徴付ける。
このことは、それぞれチャネル歪みと計算複雑性を表す量子化ビット幅とモデルトラバース深さの関数として、推論精度のための所望のクローズドフォーム表現をもたらす。
この精度モデルに基づいて、結合レイテンシと精度制約の下でEPRの最大化問題を定式化し、解決し、完全なIC$^2$積分を実現するチャネル適応型AIアルゴリズムを実現する。
提案アルゴリズムは,送信側特徴圧縮と受信側モデル複雑性をチャネル条件に応じて併用することにより,全体の効率と推論スループットを最大化する。
実験結果から, 固定複雑度に比べて優れた性能を示した。
関連論文リスト
- Joint Optimization of Model Partitioning and Resource Allocation for Anti-Jamming Collaborative Inference Systems [52.842088497389746]
この手紙は、悪意のあるジャマーの存在下での、アンチジャミングの協調推論システムに焦点を当てている。
まず、ジャミングとDNNパーティショニングがデータ回帰による推測精度に与える影響を解析する。
問題を3つのサブプロブレムに分解する,効率的な交互最適化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2026-03-03T03:52:52Z) - Adaptive Probability Flow Residual Minimization for High-Dimensional Fokker-Planck Equations [14.22534820071447]
高次元のフォッカー・プランク方程式を解くことは、計算物理学と力学の課題である。
物理情報ニューラルネットワークのような既存のディープラーニングアプローチは、次元が増加するにつれて計算上の課題に直面している。
本稿では,適応確率フロー残差最小化法(A-PFRM)を提案する。
論文 参考訳(メタデータ) (2025-12-22T09:31:31Z) - Adaptive Mesh-Quantization for Neural PDE Solvers [51.26961483962011]
グラフニューラルネットワークは複雑なジオメトリや境界条件に必要な不規則なメッシュを処理できるが、それでもすべてのノードで一様計算処理を適用できる。
適応メッシュ量子化(Adaptive Mesh Quantization): メッシュノード,エッジ,クラスタ特徴間の空間適応量子化であり,量子化モデルで使用されるビット幅を動的に調整する。
我々は,MP-PDEとGraphViTという2つの最先端モデルと統合して,複数のタスクのパフォーマンスを評価することで,フレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2025-11-23T14:47:24Z) - Task-Oriented Sensing, Computation, and Communication Integration for
Multi-Device Edge AI [108.08079323459822]
本稿では,AIモデルの分割推論と統合センシング通信(ISAC)を併用した,新しいマルチインテリジェントエッジ人工レイテンシ(AI)システムについて検討する。
推定精度は近似的だが抽出可能な計量、すなわち判別利得を用いて測定する。
論文 参考訳(メタデータ) (2022-07-03T06:57:07Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - Adaptive Anomaly Detection for Internet of Things in Hierarchical Edge
Computing: A Contextual-Bandit Approach [81.5261621619557]
階層エッジコンピューティング(HEC)を用いた適応型異常検出手法を提案する。
まず,複雑性を増した複数のDNNモデルを構築し,それぞれを対応するHEC層に関連付ける。
そこで我々は、文脈帯域問題として定式化され、強化学習ポリシーネットワークを用いて解決される適応モデル選択スキームを設計する。
論文 参考訳(メタデータ) (2021-08-09T08:45:47Z) - Adaptive Subcarrier, Parameter, and Power Allocation for Partitioned
Edge Learning Over Broadband Channels [69.18343801164741]
パーティショニングエッジ学習(PARTEL)は、無線ネットワークにおいてよく知られた分散学習手法であるパラメータサーバトレーニングを実装している。
本稿では、いくつかの補助変数を導入してParticleELを用いてトレーニングできるディープニューラルネットワーク(DNN)モデルについて考察する。
論文 参考訳(メタデータ) (2020-10-08T15:27:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。