論文の概要: The Best of Many Worlds: Dual Mirror Descent for Online Allocation
Problems
- arxiv url: http://arxiv.org/abs/2011.10124v3
- Date: Fri, 5 Nov 2021 00:29:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-24 05:28:34.794547
- Title: The Best of Many Worlds: Dual Mirror Descent for Online Allocation
Problems
- Title(参考訳): 多くの世界のベスト:オンライン割り当て問題のためのデュアルミラー降下
- Authors: Santiago Balseiro, Haihao Lu, Vahab Mirrokni
- Abstract要約: 本稿では,意思決定者に対して未知の入力モデルを用いて,各要求に対する報酬とリソース消費を生成するデータ駆動型設定について考察する。
様々な入力モデルにおいて,どの入力に直面するかを知ることなく,優れた性能が得られるアルゴリズムの一般クラスを設計する。
我々のアルゴリズムはラグランジアン双対空間で動作し、オンラインミラー降下を用いて更新される各リソースに対して双対乗算器を保持する。
- 参考スコア(独自算出の注目度): 7.433931244705934
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Online allocation problems with resource constraints are central problems in
revenue management and online advertising. In these problems, requests arrive
sequentially during a finite horizon and, for each request, a decision maker
needs to choose an action that consumes a certain amount of resources and
generates reward. The objective is to maximize cumulative rewards subject to a
constraint on the total consumption of resources. In this paper, we consider a
data-driven setting in which the reward and resource consumption of each
request are generated using an input model that is unknown to the decision
maker. We design a general class of algorithms that attain good performance in
various input models without knowing which type of input they are facing. In
particular, our algorithms are asymptotically optimal under independent and
identically distributed inputs as well as various non-stationary stochastic
input models, and they attain an asymptotically optimal fixed competitive ratio
when the input is adversarial. Our algorithms operate in the Lagrangian dual
space: they maintain a dual multiplier for each resource that is updated using
online mirror descent. By choosing the reference function accordingly, we
recover the dual sub-gradient descent and dual multiplicative weights update
algorithm. The resulting algorithms are simple, fast, and do not require
convexity in the revenue function, consumption function and action space, in
contrast to existing methods for online allocation problems. We discuss
applications to network revenue management, online bidding in repeated auctions
with budget constraints, online proportional matching with high entropy, and
personalized assortment optimization with limited inventory.
- Abstract(参考訳): 資源制約を伴うオンライン割当問題は、収益管理とオンライン広告の中心的な問題である。
これらの問題では、要求は有限の地平線中に順次届き、各要求に対して、あるリソースを消費し報酬を生成するアクションを選択する必要がある。
その目的は、資源の消費総量に制約を課す累積報酬を最大化することである。
本稿では、各要求に対する報酬とリソース消費を、意思決定者にとって未知の入力モデルを用いて生成するデータ駆動型設定について考察する。
対象とする入力の種類を知らずに,様々な入力モデルで優れた性能を得るアルゴリズムの汎用クラスを設計する。
特に,本アルゴリズムは,非定常確率的入力モデルと同様に,独立かつ同一分布の入力に対して漸近的に最適であり,非定常確率的入力モデルでは漸近的に最適である。
我々のアルゴリズムはラグランジアン双対空間で動作し、オンラインミラー降下を用いて更新される各リソースの双対乗数を維持する。
従って、参照関数を選択することで、双対部分勾配降下と双対乗重み更新アルゴリズムを復元する。
得られたアルゴリズムは単純で高速であり、オンラインアロケーション問題に対する既存の手法とは対照的に、収益関数、消費関数、行動空間の凸性を必要としない。
本稿では,ネットワーク収益管理,予算制約の繰り返しオークションにおけるオンライン入札,高エントロピーのオンライン比例マッチング,限定在庫の個別化等について論じる。
関連論文リスト
- Two-Timescale Model Caching and Resource Allocation for Edge-Enabled AI-Generated Content Services [55.0337199834612]
Generative AI(GenAI)は、カスタマイズされたパーソナライズされたAI生成コンテンツ(AIGC)サービスを可能にするトランスフォーメーション技術として登場した。
これらのサービスは数十億のパラメータを持つGenAIモデルの実行を必要とし、リソース制限の無線エッジに重大な障害を生じさせる。
我々は、AIGC品質とレイテンシメトリクスのトレードオフをバランスさせるために、AIGCサービスのジョイントモデルキャッシングとリソースアロケーションの定式化を導入する。
論文 参考訳(メタデータ) (2024-11-03T07:01:13Z) - Online Fair Allocation of Perishable Resources [1.4952056744888913]
我々は、標準オンラインフェアアロケーション問題の事実上の動機付け型を考察する。
意思決定者は、一定回数のラウンドを割り当てるために、パーシシブルなリソースの予算を持っている。
目標は、うらやましいほど効率的で効率的なアロケーションのシーケンスを構築することです。
論文 参考訳(メタデータ) (2024-06-04T15:14:10Z) - Online Learning under Budget and ROI Constraints via Weak Adaptivity [57.097119428915796]
制約付きオンライン学習問題に対する既存の原始双対アルゴリズムは、2つの基本的な仮定に依存している。
このような仮定は、標準の原始双対テンプレートを弱適応的後悔最小化器で与えることによって、どのように回避できるのかを示す。
上記の2つの前提が満たされていない場合に保証される、世界の最高の保証を証明します。
論文 参考訳(メタデータ) (2023-02-02T16:30:33Z) - Learning To Dive In Branch And Bound [95.13209326119153]
グラフニューラルネットワークを用いて特定の潜水構造を学習するためのL2Diveを提案する。
我々は、変数の割り当てを予測するために生成モデルを訓練し、線形プログラムの双対性を利用して潜水決定を行う。
論文 参考訳(メタデータ) (2023-01-24T12:01:45Z) - Multi-Resource Allocation for On-Device Distributed Federated Learning
Systems [79.02994855744848]
本研究は,デバイス上の分散フェデレーション学習(FL)システムにおいて,レイテンシとエネルギー消費の重み付け和を最小化する分散マルチリソース割り当て方式を提案する。
システム内の各モバイルデバイスは、指定された領域内でモデルトレーニングプロセスを実行し、それぞれパラメータの導出とアップロードを行うための計算と通信資源を割り当てる。
論文 参考訳(メタデータ) (2022-11-01T14:16:05Z) - Online Allocation with Two-sided Resource Constraints [44.5635910908944]
我々は,要求が順次到着する,リソース制約の低いオンラインアロケーション問題を考える。
提案手法では, リクエスト全体を知るオフライン問題に対して, 1-O (fracepsilonalpha-epsilon)$-competitive ratioを求めるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-12-28T02:21:06Z) - Online Stochastic Optimization with Wasserstein Based Non-stationarity [12.91020811577007]
有限期間の地平線上の複数の予算制約を持つ一般的なオンライン最適化問題を検討する。
意思決定者の目標は、予算制約の対象となる累積報酬を最大化することである。
この定式化は、オンラインリニアプログラミングやネットワーク収益管理を含む幅広いアプリケーションを取り込む。
論文 参考訳(メタデータ) (2020-12-13T04:47:37Z) - Coordinated Online Learning for Multi-Agent Systems with Coupled
Constraints and Perturbed Utility Observations [91.02019381927236]
本研究では, 資源制約を満たすため, エージェントを安定な集団状態へ誘導する新しい手法を提案する。
提案手法は,ゲームラグランジアンの拡張によるリソース負荷に基づく分散リソース価格設定手法である。
論文 参考訳(メタデータ) (2020-10-21T10:11:17Z) - Resource Allocation via Model-Free Deep Learning in Free Space Optical
Communications [119.81868223344173]
本稿では,自由空間光学(FSO)通信におけるチャネルフェージング効果の緩和のための資源配分の一般的な問題について検討する。
本フレームワークでは,FSO資源割り当て問題を解決する2つのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-27T17:38:51Z) - Regularized Online Allocation Problems: Fairness and Beyond [7.433931244705934]
本稿では, 総資源消費に作用する非線形正規化器を含む変種である, 語彙化オンライン割当問題を紹介する。
この問題では、要求は時間とともに繰り返し届き、各要求に対して、意思決定者は報酬を生成しリソースを消費するアクションを取る必要があります。
目的は、資源制約を受ける加算可分な報酬と非分離可正則化器の値とを同時に最大化することである。
論文 参考訳(メタデータ) (2020-07-01T14:24:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。