論文の概要: Dynamic Pricing for On-Demand DNN Inference in the Edge-AI Market
- arxiv url: http://arxiv.org/abs/2503.04521v1
- Date: Thu, 06 Mar 2025 15:08:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-07 16:01:39.493779
- Title: Dynamic Pricing for On-Demand DNN Inference in the Edge-AI Market
- Title(参考訳): エッジAI市場におけるオンデマンドDNN推論の動的価格設定
- Authors: Songyuan Li, Jia Hu, Geyong Min, Haojun Huang, Jiwei Huang,
- Abstract要約: 収益最適化のためのオークションベースのエッジ推論価格メカニズム(AERIA)。
オンデマンドDNN推論高速化のためのマルチエグジットデバイスエッジのシナジスティック推論方式について検討する。
当社のAERIAメカニズムは、Edge-AI市場におけるオンデマンド推論におけるAERIAの有効性を実証し、収益における最先端のアプローチを著しく上回っている。
- 参考スコア(独自算出の注目度): 25.367459316428242
- License:
- Abstract: The convergence of edge computing and AI gives rise to Edge-AI, which enables the deployment of real-time AI applications and services at the network edge. One of the fundamental research issues in Edge-AI is edge inference acceleration, which aims to realize low-latency high-accuracy DNN inference services by leveraging the fine-grained offloading of partitioned inference tasks from end devices to edge servers. However, existing research has yet to adopt a practical Edge-AI market perspective, which would systematically explore the personalized inference needs of AI users (e.g., inference accuracy, latency, and task complexity), the revenue incentives for AI service providers that offer edge inference services, and multi-stakeholder governance within a market-oriented context. To bridge this gap, we propose an Auction-based Edge Inference Pricing Mechanism (AERIA) for revenue maximization to tackle the multi-dimensional optimization problem of DNN model partition, edge inference pricing, and resource allocation. We investigate the multi-exit device-edge synergistic inference scheme for on-demand DNN inference acceleration, and analyse the auction dynamics amongst the AI service providers, AI users and edge infrastructure provider. Owing to the strategic mechanism design via randomized consensus estimate and cost sharing techniques, the Edge-AI market attains several desirable properties, including competitiveness in revenue maximization, incentive compatibility, and envy-freeness, which are crucial to maintain the effectiveness, truthfulness, and fairness of our auction outcomes. The extensive simulation experiments based on four representative DNN inference workloads demonstrate that our AERIA mechanism significantly outperforms several state-of-the-art approaches in revenue maximization, demonstrating the efficacy of AERIA for on-demand DNN inference in the Edge-AI market.
- Abstract(参考訳): エッジコンピューティングとAIの収束により、エッジAIが生まれ、ネットワークエッジにおけるリアルタイムAIアプリケーションとサービスのデプロイが可能になる。
Edge-AIの基本的な研究課題の1つはエッジ推論アクセラレーションである。エッジデバイスからエッジサーバへのパーティショニング推論タスクのきめ細かいオフロードを活用することで、低レイテンシのDNN推論サービスの実現を目指している。
しかし、既存の研究では、実際のEdge-AI市場の観点からは、AIユーザのパーソナライズされた推論ニーズ(例えば、推論精度、レイテンシ、タスク複雑性)、エッジ推論サービスを提供するAIサービスプロバイダの収益インセンティブ、市場指向のコンテキストにおけるマルチステークホルダガバナンスを体系的に検討することができない。
このギャップを埋めるために,DNNモデル分割の多次元最適化問題,エッジ推論価格,リソース割り当てに対処するために,収益最大化のためのオークションベースのエッジ推論価格メカニズム(AERIA)を提案する。
我々は、オンデマンドDNN推論アクセラレーションのためのマルチエグジットデバイスエッジのシナジスティック推論スキームを調査し、AIサービスプロバイダ、AIユーザ、エッジインフラストラクチャプロバイダ間のオークションダイナミクスを分析する。
ランダムなコンセンサス推定とコスト共有技術による戦略的メカニズム設計により、Edge-AI市場は、収益最大化の競争性、インセンティブの適合性、そして、我々のオークション結果の有効性、真実性、公正性を維持するのに不可欠なエンビーフリーネスを含む、いくつかの望ましい特性を達成している。
4つの代表的DNN推論ワークロードに基づく大規模なシミュレーション実験により、当社のAERIAメカニズムは、Edge-AI市場におけるオンデマンドDNN推論に対するAERIAの有効性を実証し、収益の最大化における最先端のアプローチを著しく上回ることを示した。
関連論文リスト
- Joint Resource Optimization, Computation Offloading and Resource Slicing for Multi-Edge Traffic-Cognitive Networks [0.0]
本稿では,プラットフォームとESの両方が自己関心を持つエンティティであるマルチエージェントシステムについて検討する。
そこで我々は,利害関係者間の相互作用をモデル化し,最適化問題を解くための新しいゲームベースフレームワークStackelbergを提案する。
さらに、ニューラルネットワーク最適化とプライバシ保護情報交換プロトコルを活用した分散ソリューションを設計する。
論文 参考訳(メタデータ) (2024-11-26T11:51:10Z) - Multi-Agent RL-Based Industrial AIGC Service Offloading over Wireless Edge Networks [19.518346220904732]
本稿では,モデル駆動型産業用AIGC協調エッジラーニングフレームワークを提案する。
このフレームワークは、現実的なサンプル合成とエッジベースの最適化機能を活用することにより、効率的な数ショット学習を容易にすることを目的としている。
論文 参考訳(メタデータ) (2024-05-05T15:31:47Z) - A Learning-based Incentive Mechanism for Mobile AIGC Service in Decentralized Internet of Vehicles [49.86094523878003]
モバイルAIGCサービスアロケーションのための分散インセンティブ機構を提案する。
我々は、AIGCサービスのRSUへの供給と、IoVコンテキスト内のサービスに対するユーザ要求のバランスを見つけるために、マルチエージェントの深層強化学習を採用している。
論文 参考訳(メタデータ) (2024-03-29T12:46:07Z) - Edge AI Inference in Heterogeneous Constrained Computing: Feasibility
and Opportunities [9.156192191794567]
AI推論アクセラレータの急増はイノベーションを示すだけでなく、課題も浮き彫りにしている。
本稿では,ハードウェアの多様性に対応するフレームワークの要件とコンポーネントについて概説する。
次に、デバイスの不均一性がAI推論性能に与える影響を評価し、サービス品質を損なうことなく結果の最適化戦略を特定する。
論文 参考訳(メタデータ) (2023-10-27T16:46:59Z) - LAMBO: Large AI Model Empowered Edge Intelligence [71.56135386994119]
次世代エッジインテリジェンスは、オフロード技術を通じて様々なアプリケーションに恩恵をもたらすことが期待されている。
従来のオフロードアーキテクチャは、不均一な制約、部分的な認識、不確実な一般化、トラクタビリティの欠如など、いくつかの問題に直面している。
我々は、これらの問題を解決するための10億以上のパラメータを持つLarge AI Model-Based Offloading (LAMBO)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-29T07:25:42Z) - Semantic Information Marketing in The Metaverse: A Learning-Based
Contract Theory Framework [68.8725783112254]
仮想サービスプロバイダ(VSP)によるインセンティブのメカニズム設計の問題に対処し,センサデータ販売にIoTデバイスを採用。
帯域幅が限られているため,センサIoTデバイスによる配信データを削減するためにセマンティック抽出アルゴリズムを提案する。
本稿では,新しい反復型契約設計を提案し,マルチエージェント強化学習(MARL)の新たな変種を用いて,モデル付き多次元契約問題の解法を提案する。
論文 参考訳(メタデータ) (2023-02-22T15:52:37Z) - Enabling AI-Generated Content (AIGC) Services in Wireless Edge Networks [68.00382171900975]
無線エッジネットワークでは、不正に生成されたコンテンツの送信はネットワークリソースを不要に消費する可能性がある。
我々は、AIGC-as-a-serviceの概念を示し、エッジネットワークにAをデプロイする際の課題について議論する。
最適なASP選択のための深層強化学習可能なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-01-09T09:30:23Z) - Edge Computing for Semantic Communication Enabled Metaverse: An
Incentive Mechanism Design [72.27143788103245]
SemComとエッジコンピューティングは、Metaverseにおける巨大なデータ通信、帯域幅効率、低レイテンシデータ処理の新たな要件に対処するための破壊的なソリューションである。
深層学習(DL)に基づくオークションは、近年、重要な経済特性を保持しながら収益を最大化するインセンティブメカニズムとして提案されている。
本稿では,SemCom対応Metaverseにおけるエッジリソース割り当てのためのDLベースのオークションの設計について述べる。
論文 参考訳(メタデータ) (2022-12-13T10:29:41Z) - GNN at the Edge: Cost-Efficient Graph Neural Network Processing over
Distributed Edge Servers [24.109721494781592]
グラフニューラルネットワーク(GNN)はまだ探索中であり、その広範な採用に対する大きな違いを示している。
本稿では,多層ヘテロジニアスエッジネットワーク上での分散GNN処理のコスト最適化について検討する。
提案手法は, 高速収束速度で95.8%以上のコスト削減を行い, デファクトベースラインよりも優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2022-10-31T13:03:16Z) - Communication-Computation Trade-Off in Resource-Constrained Edge
Inference [5.635540684037595]
本稿では,資源制約のあるデバイスにおけるエッジ推論の効果的な手法を提案する。
エッジコンピューティングサーバが支援するデバイスとエッジのコ推論に重点を置いている。
効果的な推論のために3段階のフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-03T11:00:32Z) - Incentive Mechanism Design for Resource Sharing in Collaborative Edge
Learning [106.51930957941433]
5GとBeyondネットワークでは、人工知能のアプリケーションがますます普及すると予想されている。
これは、現在のクラウド中心のモデルトレーニングアプローチから、エッジラーニングとして知られるエッジコンピューティングベースの協調学習スキームへのパラダイムシフトを必要とする。
論文 参考訳(メタデータ) (2020-05-31T12:45:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。