論文の概要: Offloading and Quality Control for AI Generated Content Services in Edge
Computing Networks
- arxiv url: http://arxiv.org/abs/2312.06203v1
- Date: Mon, 11 Dec 2023 08:36:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-12 16:31:18.332726
- Title: Offloading and Quality Control for AI Generated Content Services in Edge
Computing Networks
- Title(参考訳): エッジコンピューティングネットワークにおけるAI生成コンテンツサービスのオフロードと品質管理
- Authors: Yitong Wang, Chang Liu, Jun Zhao
- Abstract要約: 本稿では, 逆拡散段階における拡散モデルのオフロード決定, 計算時間, 拡散ステップに対する共同最適化アルゴリズムを提案する。
実験結果から,提案アルゴリズムはベースラインよりも優れた継手最適化性能が得られることが示された。
- 参考スコア(独自算出の注目度): 21.04384930605762
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: AI-Generated Content (AIGC), as a novel manner of providing Metaverse
services in the forthcoming Internet paradigm, can resolve the obstacles of
immersion requirements. Concurrently, edge computing, as an evolutionary
paradigm of computing in communication systems, effectively augments real-time
interactive services. In pursuit of enhancing the accessibility of AIGC
services, the deployment of AIGC models (e.g., diffusion models) to edge
servers and local devices has become a prevailing trend. Nevertheless, this
approach faces constraints imposed by battery life and computational resources
when tasks are offloaded to local devices, limiting the capacity to deliver
high-quality content to users while adhering to stringent latency requirements.
So there will be a tradeoff between the utility of AIGC models and offloading
decisions in the edge computing paradigm. This paper proposes a joint
optimization algorithm for offloading decisions, computation time, and
diffusion steps of the diffusion models in the reverse diffusion stage.
Moreover, we take the average error into consideration as the metric for
evaluating the quality of the generated results. Experimental results
conclusively demonstrate that the proposed algorithm achieves superior joint
optimization performance compared to the baselines.
- Abstract(参考訳): AI-Generated Content(AIGC)は、今後のインターネットパラダイムにおけるMetaverseサービスの提供方法として、没入要求の障害を解決することができる。
同時に、エッジコンピューティングは、通信システムにおけるコンピューティングの進化パラダイムとして、リアルタイムのインタラクティブなサービスを効果的に強化する。
AIGCサービスのアクセシビリティを高めるために、エッジサーバやローカルデバイスへのAIGCモデル(拡散モデルなど)のデプロイが主流となっている。
それでもこのアプローチでは,タスクをローカルデバイスにオフロードする場合に,バッテリ寿命や計算リソースによって課される制約に直面する。
したがって、AIGCモデルの有用性とエッジコンピューティングパラダイムにおける決定のオフロードとの間にはトレードオフがある。
本稿では,逆拡散段階における拡散モデルのオフロード決定,計算時間,拡散ステップに関する共同最適化アルゴリズムを提案する。
さらに,得られた結果の質を評価する指標として,平均誤差を考慮に入れた。
実験結果から,提案アルゴリズムはベースラインよりも優れた継手最適化性能が得られることが示された。
関連論文リスト
- Two-Timescale Model Caching and Resource Allocation for Edge-Enabled AI-Generated Content Services [55.0337199834612]
Generative AI(GenAI)は、カスタマイズされたパーソナライズされたAI生成コンテンツ(AIGC)サービスを可能にするトランスフォーメーション技術として登場した。
これらのサービスは数十億のパラメータを持つGenAIモデルの実行を必要とし、リソース制限の無線エッジに重大な障害を生じさせる。
我々は、AIGC品質とレイテンシメトリクスのトレードオフをバランスさせるために、AIGCサービスのジョイントモデルキャッシングとリソースアロケーションの定式化を導入する。
論文 参考訳(メタデータ) (2024-11-03T07:01:13Z) - Resource-Efficient Generative AI Model Deployment in Mobile Edge Networks [15.958822667638405]
エッジ上の利用可能なリソースの不足は、生成AIモデルをデプロイする上で大きな課題を生じさせる。
我々は、エッジ上に生成するAIモデルのデプロイメントを適切に管理することを目的とした、協調的なエッジクラウドフレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-09T03:17:28Z) - Multi-Agent RL-Based Industrial AIGC Service Offloading over Wireless Edge Networks [19.518346220904732]
本稿では,モデル駆動型産業用AIGC協調エッジラーニングフレームワークを提案する。
このフレームワークは、現実的なサンプル合成とエッジベースの最適化機能を活用することにより、効率的な数ショット学習を容易にすることを目的としている。
論文 参考訳(メタデータ) (2024-05-05T15:31:47Z) - A Multi-Head Ensemble Multi-Task Learning Approach for Dynamical
Computation Offloading [62.34538208323411]
共有バックボーンと複数の予測ヘッド(PH)を組み合わせたマルチヘッドマルチタスク学習(MEMTL)手法を提案する。
MEMTLは、追加のトレーニングデータを必要とせず、推測精度と平均平方誤差の両方でベンチマーク手法より優れている。
論文 参考訳(メタデータ) (2023-09-02T11:01:16Z) - Enabling AI-Generated Content (AIGC) Services in Wireless Edge Networks [68.00382171900975]
無線エッジネットワークでは、不正に生成されたコンテンツの送信はネットワークリソースを不要に消費する可能性がある。
我々は、AIGC-as-a-serviceの概念を示し、エッジネットワークにAをデプロイする際の課題について議論する。
最適なASP選択のための深層強化学習可能なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-01-09T09:30:23Z) - Enabling AI Quality Control via Feature Hierarchical Edge Inference [6.490724361345847]
本研究では,エッジサーバとそれに対応する移動体に配置された特徴ネットワークと推論ネットワークからなる特徴階層型EI(FHEI)を提案する。
より大規模な機能では、より優れたAI品質を提供する一方で、より多くの計算と通信負荷が必要になる。
提案したFHEIアーキテクチャの連成通信・計算制御が, 常にいくつかのベンチマークより優れていることが, 広範囲なシミュレーションにより検証された。
論文 参考訳(メタデータ) (2022-11-15T02:54:23Z) - Task-Oriented Sensing, Computation, and Communication Integration for
Multi-Device Edge AI [108.08079323459822]
本稿では,AIモデルの分割推論と統合センシング通信(ISAC)を併用した,新しいマルチインテリジェントエッジ人工レイテンシ(AI)システムについて検討する。
推定精度は近似的だが抽出可能な計量、すなわち判別利得を用いて測定する。
論文 参考訳(メタデータ) (2022-07-03T06:57:07Z) - Towards AIOps in Edge Computing Environments [60.27785717687999]
本稿では,異種分散環境に適用可能なaiopsプラットフォームのシステム設計について述べる。
高頻度でメトリクスを収集し、エッジデバイス上で特定の異常検出アルゴリズムを直接実行することが可能である。
論文 参考訳(メタデータ) (2021-02-12T09:33:00Z) - Reconfigurable Intelligent Surface Assisted Mobile Edge Computing with
Heterogeneous Learning Tasks [53.1636151439562]
モバイルエッジコンピューティング(MEC)は、AIアプリケーションに自然なプラットフォームを提供します。
再構成可能なインテリジェントサーフェス(RIS)の助けを借りて、MECで機械学習タスクを実行するインフラストラクチャを提示します。
具体的には,モバイルユーザの送信パワー,基地局のビームフォーミングベクトル,risの位相シフト行列を共同で最適化することにより,参加ユーザの学習誤差を最小化する。
論文 参考訳(メタデータ) (2020-12-25T07:08:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。