Fugu-MT 論文翻訳(概要): On the Regret of Online Edge Service Hosting

論文の概要: On the Regret of Online Edge Service Hosting

arxiv url: http://arxiv.org/abs/2303.06851v1
Date: Mon, 13 Mar 2023 04:46:08 GMT
ステータス: 翻訳完了
システム内更新日: 2023-03-14 16:32:56.228175
Title: On the Regret of Online Edge Service Hosting
Title（参考訳）: オンラインエッジサービスホスティングの後悔について
Authors: R Sri Prakash, Nikhil Karamchandani, Sharayu Moharir
Abstract要約: サービスプロバイダが短期契約でエッジリソースを動的にレンタルできるサービスホスティングの問題点を考察する。我々は、複数のホスティングポリシーを、ポリシーと最適なポリシーによって引き起こされるコストの差として定義される、後悔を指標として比較する。
参考スコア（独自算出の注目度）: 11.320960005527398
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We consider the problem of service hosting where a service provider can dynamically rent edge resources via short term contracts to ensure better quality of service to its customers. The service can also be partially hosted at the edge, in which case, customers' requests can be partially served at the edge. The total cost incurred by the system is modeled as a combination of the rent cost, the service cost incurred due to latency in serving customers, and the fetch cost incurred as a result of the bandwidth used to fetch the code/databases of the service from the cloud servers to host the service at the edge. In this paper, we compare multiple hosting policies with regret as a metric, defined as the difference in the cost incurred by the policy and the optimal policy over some time horizon $T$. In particular we consider the Retro Renting (RR) and Follow The Perturbed Leader (FTPL) policies proposed in the literature and provide performance guarantees on the regret of these policies. We show that under i.i.d stochastic arrivals, RR policy has linear regret while FTPL policy has constant regret. Next, we propose a variant of FTPL, namely Wait then FTPL (W-FTPL), which also has constant regret while demonstrating much better dependence on the fetch cost. We also show that under adversarial arrivals, RR policy has linear regret while both FTPL and W-FTPL have regret $\mathrm{O}(\sqrt{T})$ which is order-optimal.
Abstract（参考訳）: サービス提供者が短期契約を通じてエッジリソースを動的にレンタルし、顧客にとってより良いサービス品質を確保するサービスホスティングの問題を考える。サービスがエッジで部分的にホストされる場合もあり、その場合、顧客の要求はエッジで部分的に提供される。システムによって発生する総コストは、レンタルコスト、サービス提供の遅延によるサービスコスト、およびエッジでサービスをホストするためにクラウドサーバからサービスのコード/データベースを取得するのに使われる帯域幅の結果として発生するフェッチコストの組み合わせとしてモデル化される。本稿では、複数のホスティングポリシーと、そのポリシーがもたらすコストと、ある時間帯における最適ポリシーとの差として定義した基準として後悔とを比較した。特に,レトロレンタル(rr)を考慮し,文献に提案されている乱れたリーダ(ftpl)ポリシーに従い,これらのポリシーの後悔に対するパフォーマンス保証を提供する。 RRポリシは線形後悔であり,FTPLポリシは常に後悔していることを示す。次に,FTPLの変種である Wait then FTPL (W-FTPL)を提案する。また, RR ポリシは線形後悔であり, FTPL と W-FTPL はともに順序最適である $\mathrm{O}(\sqrt{T})$ を後悔していることを示す。

関連論文リスト

Routing, Cascades, and User Choice for LLMs [9.28138618885869]
ユーザ行動に対するLLMルーティングの効果について検討する。 2つのモデルを持つLLMプロバイダと,タスクの再実行や放棄が可能なユーザとの間でのゲームを提案する。ユーザの目的は、モデルの使用の遅延を抑えるためにユーティリティを最大化することであり、一方、プロバイダは、ユーザをサービスするコストを最小限にすることである。
論文参考訳（メタデータ） (2026-02-10T15:39:31Z)
PLA-Serve: A Prefill-Length-Aware LLM Serving System [33.313531352453346]
PLA-Serveは、TTFTレイテンシを低減するために、異なるプロンプト長でリクエストを特定し、分解する。提案手法は,適応型スケジューリング戦略のモチベーションとして,応答長の変動がボトルネックを生じさせることを観察する。 PLA-Serveは、プリフィル*-Lang*デコードデアグリゲーションの下でのバニラSGと比較して、プリフィル遅延を30%以上削減する。
論文参考訳（メタデータ） (2026-01-04T18:14:24Z)
Dynamic Speculative Agent Planning [57.630218933994534]
大規模な言語モデルベースのエージェントは、遅延の禁止と推論コストのために、重要なデプロイメント課題に直面している。本稿では,オンライン強化学習フレームワークである動的投機計画(Dynamic Speculative Planning, DSP)を紹介する。 2つの標準エージェントベンチマークの実験では、DSPは高速加速法に匹敵する効率を達成し、総コストを30%削減し、不要コストを60%まで削減している。
論文参考訳（メタデータ） (2025-09-02T03:34:36Z)
Cost-Aware Contrastive Routing for LLMs [57.30288453580456]
我々は、プロンプトとモデルの両方を共有埋め込み空間にマッピングする軽量フレームワークであるコストスペクトルコントラストルーティング(CSCR)を紹介します。 CSCRはベースラインを一貫して上回り、精度とコストのトレードオフを最大25%改善した。
論文参考訳（メタデータ） (2025-08-17T20:16:44Z)
No-Regret Learning Under Adversarial Resource Constraints: A Spending Plan Is All You Need! [56.80767500991973]
アクション選択の前に報酬とコストが観測される$(i)$オンラインリソース割当と、アクション選択後、完全なフィードバックや盗賊フィードバックの下で、リソース制限付きオンライン学習である$(ii)$オンラインリソース割当に焦点を当てた。報酬とコスト分布が時間とともに任意に変化する場合、これらの設定でサブ線形後悔を達成することは不可能であることが知られている。我々は、支出計画に従う基準線に対する半線形後悔を実現する一般的な(基本的)二重的手法を設計し、また、支出計画が予算のバランスの取れた配分を保証すると、アルゴリズムの性能が向上する。
論文参考訳（メタデータ） (2025-06-16T08:42:31Z)
DiSCo: Device-Server Collaborative LLM-Based Text Streaming Services [3.348953136575379]
テキストストリーミングサービスにおける大規模言語モデルの急速な普及は、大きなコストとQuality of Experienceの課題をもたらしている。リクエストを適応的にルーティングすることでユーザのQoEを最適化するデバイスサーバ協調型スケジューラの紹介を行う。モデルデバイス構成の異なるTTFT(11-52%)とTTFT(6-78%)を減らし,QoEを向上できることを示す。
論文参考訳（メタデータ） (2025-02-17T04:15:45Z)
MixLLM: Dynamic Routing in Mixed Large Language Models [57.309520357563215]
大規模言語モデル(LLM)は、最近、人工知能の可能性を秘めている。問合せ-LLM代入のための動的コンテキスト帯域ベースのルーティングシステムであるMixLLMを開発した。
論文参考訳（メタデータ） (2025-02-09T02:26:15Z)
ConServe: Fine-Grained GPU Harvesting for LLM Online and Offline Co-Serving [61.35068981176018]
ConServeは、高いスループットと強力なオンラインレイテンシ保証を実現する大規模言語モデル(LLM)サービスシステムである。我々は,ConServeが平均2.2$times$高スループットを実現し,オンラインサービステールのレイテンシを最先端システムと比較して平均2.9$times$削減することを示した。
論文参考訳（メタデータ） (2024-10-02T04:12:13Z)
Leveraging Interpretability in the Transformer to Automate the Proactive Scaling of Cloud Resources [1.1470070927586018]
我々は、エンドツーエンドのレイテンシ、フロントエンドレベルの要求、リソース利用の関係をキャプチャするモデルを開発する。次に、開発したモデルを使用して、エンドツーエンドのレイテンシを予測します。マイクロサービスベースのアプリケーションのメリットを示し、デプロイメントのロードマップを提供します。
論文参考訳（メタデータ） (2024-09-04T22:03:07Z)
A Primal-Dual Online Learning Approach for Dynamic Pricing of Sequentially Displayed Complementary Items under Sale Constraints [54.46126953873298]
顧客に対して順次表示される補完アイテムの動的価格設定の問題に対処する。各項目の価格を個別に最適化するのは効果がないため、補完項目のコヒーレントな価格ポリシーが不可欠である。実世界のデータからランダムに生成した合成設定を用いて,我々のアプローチを実証的に評価し,制約違反や後悔の観点からその性能を比較した。
論文参考訳（メタデータ） (2024-07-08T09:55:31Z)
Online Resource Allocation with Average Budget Constraints [17.47923923731483]
平均予算制約によるオンライン資源配分の問題点を考察する。簡単なポリシーがOmega(sqrtT)$ regretを達成していることを示す。予算安全バッファを組み込んだ新しいポリシーを提案する。
論文参考訳（メタデータ） (2024-02-18T02:11:54Z)
SpotServe: Serving Generative Large Language Models on Preemptible Instances [64.18638174004151]
SpotServeは、プリエンプティブルインスタンスにシステムを提供する最初の分散大規模言語モデルである。 SpotServeは、既存のLLMサービスシステムと比較して、P99テールのレイテンシを2.4～9.1倍削減できることを示す。また、SpotServeはプリエンプティブインスタンスの価格優位性を利用して、オンデマンドインスタンスのみを使用する場合と比較して54%の金銭的コストを節約できることも示しています。
論文参考訳（メタデータ） (2023-11-27T06:31:17Z)
Client Orchestration and Cost-Efficient Joint Optimization for NOMA-Enabled Hierarchical Federated Learning [55.49099125128281]
半同期クラウドモデルアグリゲーションの下で非直交多重アクセス(NOMA)を実現するHFLシステムを提案する。提案手法は,HFLの性能改善と総コスト削減に関するベンチマークよりも優れていることを示す。
論文参考訳（メタデータ） (2023-11-03T13:34:44Z)
Online Optimization for Randomized Network Resource Allocation with Long-Term Constraints [0.610240618821149]
簡単な通信網における最適オンラインリソース予約問題について検討する。そこで我々は,オンラインサドルポイントアルゴリズムを提案し,関連するK-ベンチマークの後悔に対する上限を提示する。
論文参考訳（メタデータ） (2023-05-24T20:47:17Z)
Improved Algorithms for Multi-period Multi-class Packing Problems with Bandit Feedback [18.208834479445894]
線形文脈多重時間パッキング問題(LMMP)について考察する。我々は、より高速な収束率を保証する新しい推定器を確立し、その結果、そのような問題に対する後悔の度合いを低くする。本稿の数値実験は,本手法が文献の他のベンチマークよりも優れていることを明らかに示している。
論文参考訳（メタデータ） (2023-01-31T17:35:43Z)
FIRE: A Failure-Adaptive Reinforcement Learning Framework for Edge Computing Migrations [52.85536740465277]
FIREは、エッジコンピューティングのディジタルツイン環境でRLポリシーをトレーニングすることで、まれなイベントに適応するフレームワークである。 ImREは重要なサンプリングに基づくQ-ラーニングアルゴリズムであり、希少事象をその値関数への影響に比例してサンプリングする。 FIREは故障時にバニラRLやグリーディベースラインと比較してコストを削減できることを示す。
論文参考訳（メタデータ） (2022-09-28T19:49:39Z)
COptiDICE: Offline Constrained Reinforcement Learning via Stationary Distribution Correction Estimation [73.17078343706909]
オフラインの制約付き強化学習(RL)問題。エージェントは、所定のコスト制約を満たしながら期待されるリターンを最大化するポリシーを計算し、事前に収集されたデータセットからのみ学習する。定常分布空間におけるポリシーを最適化するオフライン制約付きRLアルゴリズムを提案する。我々のアルゴリズムであるCOptiDICEは、コスト上限を制約しながら、利益に対する最適政策の定常分布補正を直接見積もる。
論文参考訳（メタデータ） (2022-04-19T15:55:47Z)
Online Optimization with Feedback Delay and Nonlinear Switching Cost [16.975704972827305]
我々は,学習者が$k$-round $textitdelayed feedback$$を入力したオンライン最適化のバリエーションについて検討する。新たな反復正規化オンラインバランスド Descent (iROBD) アルゴリズムは,O(L2k)$の一定次元自由競争比を持つことを示す。
論文参考訳（メタデータ） (2021-10-29T21:55:01Z)
Joint Online Learning and Decision-making via Dual Mirror Descent [20.560099149143245]
我々は、コストの上下の境界の対象となる有限時間領域上のオンライン収益問題を検討します。本稿では,オンラインデュアルミラー降下方式と汎用パラメータ学習プロセスを組み合わせた,新しいオフラインベンチマークを提案する。パラメータが知られておらず、学習しなければならない場合、後悔と制約違反は、学習プロセスの収束に直接依存する以前の$O(sqrtT)$用語と用語の合計であることを示しています。
論文参考訳（メタデータ） (2021-04-20T04:02:07Z)
Stochastic Shortest Path with Adversarially Changing Costs [57.90236104782219]
最短経路 (SSP) は計画と制御においてよく知られた問題である。また, 時間とともにコストの逆変化を考慮に入れた逆SSPモデルを提案する。我々は、この自然な逆SSPの設定を最初に検討し、それに対するサブ線形後悔を得る。
論文参考訳（メタデータ） (2020-06-20T12:10:35Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。