論文の概要: On the Regret of Online Edge Service Hosting
- arxiv url: http://arxiv.org/abs/2303.06851v1
- Date: Mon, 13 Mar 2023 04:46:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-14 16:32:56.228175
- Title: On the Regret of Online Edge Service Hosting
- Title(参考訳): オンラインエッジサービスホスティングの後悔について
- Authors: R Sri Prakash, Nikhil Karamchandani, Sharayu Moharir
- Abstract要約: サービスプロバイダが短期契約でエッジリソースを動的にレンタルできるサービスホスティングの問題点を考察する。
我々は、複数のホスティングポリシーを、ポリシーと最適なポリシーによって引き起こされるコストの差として定義される、後悔を指標として比較する。
- 参考スコア(独自算出の注目度): 11.320960005527398
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We consider the problem of service hosting where a service provider can
dynamically rent edge resources via short term contracts to ensure better
quality of service to its customers. The service can also be partially hosted
at the edge, in which case, customers' requests can be partially served at the
edge. The total cost incurred by the system is modeled as a combination of the
rent cost, the service cost incurred due to latency in serving customers, and
the fetch cost incurred as a result of the bandwidth used to fetch the
code/databases of the service from the cloud servers to host the service at the
edge. In this paper, we compare multiple hosting policies with regret as a
metric, defined as the difference in the cost incurred by the policy and the
optimal policy over some time horizon $T$. In particular we consider the Retro
Renting (RR) and Follow The Perturbed Leader (FTPL) policies proposed in the
literature and provide performance guarantees on the regret of these policies.
We show that under i.i.d stochastic arrivals, RR policy has linear regret while
FTPL policy has constant regret. Next, we propose a variant of FTPL, namely
Wait then FTPL (W-FTPL), which also has constant regret while demonstrating
much better dependence on the fetch cost. We also show that under adversarial
arrivals, RR policy has linear regret while both FTPL and W-FTPL have regret
$\mathrm{O}(\sqrt{T})$ which is order-optimal.
- Abstract(参考訳): サービス提供者が短期契約を通じてエッジリソースを動的にレンタルし、顧客にとってより良いサービス品質を確保するサービスホスティングの問題を考える。
サービスがエッジで部分的にホストされる場合もあり、その場合、顧客の要求はエッジで部分的に提供される。
システムによって発生する総コストは、レンタルコスト、サービス提供の遅延によるサービスコスト、およびエッジでサービスをホストするためにクラウドサーバからサービスのコード/データベースを取得するのに使われる帯域幅の結果として発生するフェッチコストの組み合わせとしてモデル化される。
本稿では、複数のホスティングポリシーと、そのポリシーがもたらすコストと、ある時間帯における最適ポリシーとの差として定義した基準として後悔とを比較した。
特に,レトロレンタル(rr)を考慮し,文献に提案されている乱れたリーダ(ftpl)ポリシーに従い,これらのポリシーの後悔に対するパフォーマンス保証を提供する。
RRポリシは線形後悔であり,FTPLポリシは常に後悔していることを示す。
次に,FTPLの変種である Wait then FTPL (W-FTPL)を提案する。
また, RR ポリシは線形後悔であり, FTPL と W-FTPL はともに順序最適である $\mathrm{O}(\sqrt{T})$ を後悔していることを示す。
関連論文リスト
- SpotServe: Serving Generative Large Language Models on Preemptible
Instances [64.18638174004151]
SpotServeは、プリエンプティブルインスタンスにシステムを提供する最初の分散大規模言語モデルである。
SpotServeは、既存のLLMサービスシステムと比較して、P99テールのレイテンシを2.4~9.1倍削減できることを示す。
また、SpotServeはプリエンプティブインスタンスの価格優位性を利用して、オンデマンドインスタンスのみを使用する場合と比較して54%の金銭的コストを節約できることも示しています。
論文 参考訳(メタデータ) (2023-11-27T06:31:17Z) - Client Orchestration and Cost-Efficient Joint Optimization for
NOMA-Enabled Hierarchical Federated Learning [55.49099125128281]
半同期クラウドモデルアグリゲーションの下で非直交多重アクセス(NOMA)を実現するHFLシステムを提案する。
提案手法は,HFLの性能改善と総コスト削減に関するベンチマークよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-11-03T13:34:44Z) - Playing in the Dark: No-regret Learning with Adversarial Constraints [20.077237398506536]
本稿では,従来のオンライン凸最適化(OCO)フレームワークの長期的制約を考慮した一般化について検討する。
我々は,任意のOCOポリシを用いて代理問題を解くことで,最適な性能境界を実現することができることを示す。
新たなリャプノフに基づく証明手法が提示され、後悔と特定の逐次不等式の間の関係を明らかにする。
論文 参考訳(メタデータ) (2023-10-29T09:55:41Z) - Online Optimization for Randomized Network Resource Allocation with
Long-Term Constraints [1.773326252314863]
簡単な通信網における最適オンラインリソース予約問題について検討する。
そこで我々は,オンラインサドルポイントアルゴリズムを提案し,関連するK-ベンチマークの後悔に対する上限を提示する。
論文 参考訳(メタデータ) (2023-05-24T20:47:17Z) - Improved Algorithms for Multi-period Multi-class Packing Problems with
Bandit Feedback [18.208834479445894]
線形文脈多重時間パッキング問題(LMMP)について考察する。
我々は、より高速な収束率を保証する新しい推定器を確立し、その結果、そのような問題に対する後悔の度合いを低くする。
本稿の数値実験は,本手法が文献の他のベンチマークよりも優れていることを明らかに示している。
論文 参考訳(メタデータ) (2023-01-31T17:35:43Z) - FIRE: A Failure-Adaptive Reinforcement Learning Framework for Edge
Computing Migrations [55.131858975133085]
FIREは、エッジコンピューティングのディジタルツイン環境でRLポリシーをトレーニングすることで、まれなイベントに適応するフレームワークである。
ImREは重要なサンプリングに基づくQ-ラーニングアルゴリズムであり、希少事象をその値関数への影響に比例してサンプリングする。
FIREは故障時にバニラRLやグリーディベースラインと比較してコストを削減できることを示す。
論文 参考訳(メタデータ) (2022-09-28T19:49:39Z) - Online Nonsubmodular Minimization with Delayed Costs: From Full
Information to Bandit Feedback [98.7678704343537]
我々は,オンラインおよび近似的オンライン帯域勾配勾配アルゴリズムのいくつかの変種に対する後悔の保証を,特別な構造を持つ非部分モジュラ関数のクラスに焦点をあてる。
我々は,決定の選択と帰属費用の受け取りの遅れが無拘束である場合でも,エージェントの完全な情報と盗賊のフィードバック設定に対する後悔の限界を導出する。
論文 参考訳(メタデータ) (2022-05-15T08:27:12Z) - COptiDICE: Offline Constrained Reinforcement Learning via Stationary
Distribution Correction Estimation [73.17078343706909]
オフラインの制約付き強化学習(RL)問題。エージェントは、所定のコスト制約を満たしながら期待されるリターンを最大化するポリシーを計算し、事前に収集されたデータセットからのみ学習する。
定常分布空間におけるポリシーを最適化するオフライン制約付きRLアルゴリズムを提案する。
我々のアルゴリズムであるCOptiDICEは、コスト上限を制約しながら、利益に対する最適政策の定常分布補正を直接見積もる。
論文 参考訳(メタデータ) (2022-04-19T15:55:47Z) - Online Optimization with Feedback Delay and Nonlinear Switching Cost [16.975704972827305]
我々は,学習者が$k$-round $textitdelayed feedback$$を入力したオンライン最適化のバリエーションについて検討する。
新たな反復正規化オンラインバランスド Descent (iROBD) アルゴリズムは,O(L2k)$の一定次元自由競争比を持つことを示す。
論文 参考訳(メタデータ) (2021-10-29T21:55:01Z) - Joint Online Learning and Decision-making via Dual Mirror Descent [20.560099149143245]
我々は、コストの上下の境界の対象となる有限時間領域上のオンライン収益問題を検討します。
本稿では,オンラインデュアルミラー降下方式と汎用パラメータ学習プロセスを組み合わせた,新しいオフラインベンチマークを提案する。
パラメータが知られておらず、学習しなければならない場合、後悔と制約違反は、学習プロセスの収束に直接依存する以前の$O(sqrtT)$用語と用語の合計であることを示しています。
論文 参考訳(メタデータ) (2021-04-20T04:02:07Z) - Stochastic Shortest Path with Adversarially Changing Costs [57.90236104782219]
最短経路 (SSP) は計画と制御においてよく知られた問題である。
また, 時間とともにコストの逆変化を考慮に入れた逆SSPモデルを提案する。
我々は、この自然な逆SSPの設定を最初に検討し、それに対するサブ線形後悔を得る。
論文 参考訳(メタデータ) (2020-06-20T12:10:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。