論文の概要: Joint Model Assignment and Resource Allocation for Cost-Effective Mobile Generative Services
- arxiv url: http://arxiv.org/abs/2409.09072v1
- Date: Mon, 9 Sep 2024 03:20:53 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-22 21:32:16.765030
- Title: Joint Model Assignment and Resource Allocation for Cost-Effective Mobile Generative Services
- Title(参考訳): コスト効果のあるモバイル生成サービスのための共同モデルアサインメントとリソースアロケーション
- Authors: Shuangwei Gao, Peng Yang, Yuxin Kong, Feng Lyu, Ning Zhang,
- Abstract要約: 本稿では,エッジサーバに生成モデルの計算タスクを適切に割り当てるエッジ対応AIGCサービスプロビジョニングシステムの設計について述べる。
このシステムは、ベンチマークと比較してレスポンス遅延を最大39.1%削減しながら、生成コンテンツの品質を最大4.7%向上させることができる。
- 参考スコア(独自算出の注目度): 18.38016962216238
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Artificial Intelligence Generated Content (AIGC) services can efficiently satisfy user-specified content creation demands, but the high computational requirements pose various challenges to supporting mobile users at scale. In this paper, we present our design of an edge-enabled AIGC service provisioning system to properly assign computing tasks of generative models to edge servers, thereby improving overall user experience and reducing content generation latency. Specifically, once the edge server receives user requested task prompts, it dynamically assigns appropriate models and allocates computing resources based on features of each category of prompts. The generated contents are then delivered to users. The key to this system is a proposed probabilistic model assignment approach, which estimates the quality score of generated contents for each prompt based on category labels. Next, we introduce a heuristic algorithm that enables adaptive configuration of both generation steps and resource allocation, according to the various task requests received by each generative model on the edge.Simulation results demonstrate that the designed system can effectively enhance the quality of generated content by up to 4.7% while reducing response delay by up to 39.1% compared to benchmarks.
- Abstract(参考訳): AIGC(Artificial Intelligence Generated Content)サービスは、ユーザの指定したコンテンツ生成要求を効率的に満たすことができるが、高い計算要求は、モバイルユーザを大規模にサポートする上でさまざまな課題をもたらす。
本稿では,エッジサーバに生成モデルの計算タスクを適切に割り当てるエッジ対応AIGCサービス提供システムの設計について述べる。
具体的には、エッジサーバがユーザ要求のタスクプロンプトを受信すると、適切なモデルを動的に割り当て、各カテゴリのプロンプトの特徴に基づいてコンピューティングリソースを割り当てる。
生成されたコンテンツはユーザーに配信される。
このシステムの鍵となるのは、カテゴリラベルに基づいて各プロンプトに対して生成されたコンテンツの品質スコアを推定する確率的モデル割当手法である。
次に、エッジ上の各生成モデルから受信される様々なタスク要求に応じて、生成ステップとリソース割り当ての両方を適応的に設定できるヒューリスティックアルゴリズムを導入し、シミュレーション結果から、設計システムは、ベンチマークと比較して、応答遅延を最大39.1%削減しつつ、生成コンテンツの品質を最大4.7%向上させることができることを示した。
関連論文リスト
- Two-Timescale Model Caching and Resource Allocation for Edge-Enabled AI-Generated Content Services [55.0337199834612]
Generative AI(GenAI)は、カスタマイズされたパーソナライズされたAI生成コンテンツ(AIGC)サービスを可能にするトランスフォーメーション技術として登場した。
これらのサービスは数十億のパラメータを持つGenAIモデルの実行を必要とし、リソース制限の無線エッジに重大な障害を生じさせる。
我々は、AIGC品質とレイテンシメトリクスのトレードオフをバランスさせるために、AIGCサービスのジョイントモデルキャッシングとリソースアロケーションの定式化を導入する。
論文 参考訳(メタデータ) (2024-11-03T07:01:13Z) - Resource-Efficient Generative AI Model Deployment in Mobile Edge Networks [15.958822667638405]
エッジ上の利用可能なリソースの不足は、生成AIモデルをデプロイする上で大きな課題を生じさせる。
我々は、エッジ上に生成するAIモデルのデプロイメントを適切に管理することを目的とした、協調的なエッジクラウドフレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-09T03:17:28Z) - Retrieval Augmented Generation-Based Incident Resolution Recommendation System for IT Support [10.541671615325038]
サポートケースソリューションレコメンデーションのために,ITサポートドメインのクライアント向けに開発されたシステムを提案する。
アーキテクチャの詳細、データ収集とアノテーション、開発ジャーニーと事前検証、最終的なデプロイメントプロセスと評価計画、最終的に学んだ教訓について取り上げます。
論文 参考訳(メタデータ) (2024-09-06T13:06:29Z) - Multi-Agent RL-Based Industrial AIGC Service Offloading over Wireless Edge Networks [19.518346220904732]
本稿では,モデル駆動型産業用AIGC協調エッジラーニングフレームワークを提案する。
このフレームワークは、現実的なサンプル合成とエッジベースの最適化機能を活用することにより、効率的な数ショット学習を容易にすることを目的としている。
論文 参考訳(メタデータ) (2024-05-05T15:31:47Z) - Offloading and Quality Control for AI Generated Content Services in 6G Mobile Edge Computing Networks [18.723955271182007]
本稿では, 逆拡散段階における拡散モデルのオフロード決定, 計算時間, 拡散ステップに対する共同最適化アルゴリズムを提案する。
実験結果から,提案アルゴリズムはベースラインよりも優れた継手最適化性能が得られることが示された。
論文 参考訳(メタデータ) (2023-12-11T08:36:27Z) - Guiding AI-Generated Digital Content with Wireless Perception [69.51950037942518]
本稿では,AIGC(AIGC)と無線認識を統合し,デジタルコンテンツ制作の質を向上させる。
このフレームワークは、単語の正確な記述が難しいユーザの姿勢を読み取るために、新しいマルチスケール認識技術を採用し、それをスケルトン画像としてAIGCモデルに送信する。
生産プロセスはAIGCモデルの制約としてユーザの姿勢を強制するため、生成されたコンテンツはユーザの要求に適合する。
論文 参考訳(メタデータ) (2023-03-26T04:39:03Z) - Enabling AI-Generated Content (AIGC) Services in Wireless Edge Networks [68.00382171900975]
無線エッジネットワークでは、不正に生成されたコンテンツの送信はネットワークリソースを不要に消費する可能性がある。
我々は、AIGC-as-a-serviceの概念を示し、エッジネットワークにAをデプロイする際の課題について議論する。
最適なASP選択のための深層強化学習可能なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-01-09T09:30:23Z) - Tailored Learning-Based Scheduling for Kubernetes-Oriented Edge-Cloud
System [54.588242387136376]
エッジクラウドシステムのための学習ベースのスケジューリングフレームワークkaisを紹介する。
まず,分散した要求ディスパッチに対応するために,協調型マルチエージェントアクタ-クリティックアルゴリズムを設計する。
次に,多種多様なシステムスケールと構造について,グラフニューラルネットワークを用いてシステム状態情報を埋め込む。
第3に、リクエストディスパッチとサービスオーケストレーションを調和させる2段階のスケジューリングメカニズムを採用します。
論文 参考訳(メタデータ) (2021-01-17T03:45:25Z) - A Machine Learning Approach for Task and Resource Allocation in Mobile
Edge Computing Based Networks [108.57859531628264]
無線ネットワークにおいて,共同作業,スペクトル,送信電力配分問題について検討する。
提案アルゴリズムは、標準Q-ラーニングアルゴリズムと比較して、収束に必要なイテレーション数と全ユーザの最大遅延を最大18%、11.1%削減することができる。
論文 参考訳(メタデータ) (2020-07-20T13:46:42Z) - Federated Learning for Task and Resource Allocation in Wireless High
Altitude Balloon Networks [160.96150373385768]
移動エッジコンピューティング(MEC)対応バルーンネットワークにおいて,タスク計算と伝送におけるエネルギーと時間消費の最小化の問題について検討した。
サポートベクトルマシン(SVM)に基づくフェデレーション学習(FL)アルゴリズムを提案する。
提案したSVMベースのFL法では,各HABが協調してSVMモデルを構築し,すべてのユーザアソシエーションを決定できる。
論文 参考訳(メタデータ) (2020-03-19T14:18:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。