論文の概要: Online Allocation with Two-sided Resource Constraints
- arxiv url: http://arxiv.org/abs/2112.13964v1
- Date: Tue, 28 Dec 2021 02:21:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-30 16:37:12.507454
- Title: Online Allocation with Two-sided Resource Constraints
- Title(参考訳): 双方向リソース制約によるオンラインアロケーション
- Authors: Qixin Zhang, Wenbing Ye, Zaiyi Chen, Haoyuan Hu, Enhong Chen, Yang Yu
- Abstract要約: 我々は,要求が順次到着する,リソース制約の低いオンラインアロケーション問題を考える。
提案手法では, リクエスト全体を知るオフライン問題に対して, 1-O (fracepsilonalpha-epsilon)$-competitive ratioを求めるアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 44.5635910908944
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Motivated by many interesting real-world applications in logistics and online
advertising, we consider an online allocation problem subject to lower and
upper resource constraints, where the requests arrive sequentially, sampled
i.i.d. from an unknown distribution, and we need to promptly make a decision
given limited resources and lower bounds requirements. First, with knowledge of
the measure of feasibility, i.e., $\alpha$, we propose a new algorithm that
obtains $1-O(\frac{\epsilon}{\alpha-\epsilon})$ -competitive ratio for the
offline problems that know the entire requests ahead of time. Inspired by the
previous studies, this algorithm adopts an innovative technique to dynamically
update a threshold price vector for making decisions. Moreover, an optimization
method to estimate the optimal measure of feasibility is proposed with
theoretical guarantee at the end of this paper. Based on this method, if we
tolerate slight violation of the lower bounds constraints with parameter
$\eta$, the proposed algorithm is naturally extended to the settings without
strong feasible assumption, which cover the significantly unexplored infeasible
scenarios.
- Abstract(参考訳): 物流やオンライン広告における多くの興味深い現実世界の応用によって動機づけられたオンラインアロケーション問題では、要求が順番に届き、未知の分布からサンプル化された、すなわちサンプル化され、限られたリソースと低いバウンダリ要件が与えられた決定を迅速に行う必要がある。
まず、実現可能性の尺度、すなわち$\alpha$の知識から、要求全体を事前に知っているオフライン問題に対して、1-o(\frac{\epsilon}{\alpha-\epsilon})$ -競合比を得る新しいアルゴリズムを提案する。
従来の研究にインスパイアされたこのアルゴリズムは、決定を行うためのしきい値ベクトルを動的に更新する革新的な手法を採用している。
また,本論文の最後に理論的な保証により,実現可能性の最適尺度を推定する最適化手法を提案する。
この方法に基づいて、パラメータ$\eta$で下限制約をわずかに違反することを許容すると、提案アルゴリズムは、非常に未解決のシナリオをカバーする強力な仮定なしに、自然に設定に拡張される。
関連論文リスト
- A Bandit Approach to Online Pricing for Heterogeneous Edge Resource
Allocation [8.089950414444115]
ヘテロジニアスなエッジリソース割り当てのための2つの新しいオンライン価格設定機構が提案されている。
このメカニズムはリアルタイムで動作し、需要分布に関する事前の知識を必要としない。
提案した価格体系では, 利用者が好みのリソースを選択し, 支払うことができ, 観測された履歴データに基づいて動的に資源価格を調整できる。
論文 参考訳(メタデータ) (2023-02-14T10:21:14Z) - Online Learning under Budget and ROI Constraints via Weak Adaptivity [57.097119428915796]
制約付きオンライン学習問題に対する既存の原始双対アルゴリズムは、2つの基本的な仮定に依存している。
このような仮定は、標準の原始双対テンプレートを弱適応的後悔最小化器で与えることによって、どのように回避できるのかを示す。
上記の2つの前提が満たされていない場合に保証される、世界の最高の保証を証明します。
論文 参考訳(メタデータ) (2023-02-02T16:30:33Z) - Stochastic Direct Search Method for Blind Resource Allocation [6.574808513848414]
線形制約付きおよび微分自由最適化のための直接探索法(パターン探索とも呼ばれる)について検討する。
直接探索法は決定論的かつ制約のない場合において有限の後悔を達成できることを示す。
そこで本研究では,T2/3$のオーダを後悔させるようなダイレクトサーチの簡単な拡張を提案する。
論文 参考訳(メタデータ) (2022-10-11T07:40:45Z) - Online Contextual Decision-Making with a Smart Predict-then-Optimize
Method [4.061135251278187]
資源制約を考慮したオンライン文脈決定問題について検討する。
本稿では,「スマート予測-then-(SPO)」法に基づく予測ステップと,ミラー降下に基づく2つの更新ステップを混合するアルゴリズムを提案する。
提案手法の全体的な収束速度はオンラインミラー降下の$mathcalO(T-1/2)$収束に依存することを示す。
論文 参考訳(メタデータ) (2022-06-15T06:16:13Z) - Online Nonsubmodular Minimization with Delayed Costs: From Full
Information to Bandit Feedback [98.7678704343537]
我々は,オンラインおよび近似的オンライン帯域勾配勾配アルゴリズムのいくつかの変種に対する後悔の保証を,特別な構造を持つ非部分モジュラ関数のクラスに焦点をあてる。
我々は,決定の選択と帰属費用の受け取りの遅れが無拘束である場合でも,エージェントの完全な情報と盗賊のフィードバック設定に対する後悔の限界を導出する。
論文 参考訳(メタデータ) (2022-05-15T08:27:12Z) - Safe Online Bid Optimization with Return-On-Investment and Budget
Constraints subject to Uncertainty [87.81197574939355]
最適化問題と学習問題の両方について検討する。
我々は、潜在的に線形な数の制約違反を犠牲にして、サブ線形後悔を保証するアルゴリズム、すなわちGCBを提供する。
より興味深いことに、我々はGCB_safe(psi,phi)というアルゴリズムを提供し、サブ線形擬似回帰と安全性w.h.p.の両方を、耐性 psi と phi を受け入れるコストで保証する。
論文 参考訳(メタデータ) (2022-01-18T17:24:20Z) - An Asymptotically Optimal Primal-Dual Incremental Algorithm for
Contextual Linear Bandits [129.1029690825929]
複数の次元に沿った最先端技術を改善する新しいアルゴリズムを提案する。
非文脈線形帯域の特別な場合において、学習地平線に対して最小限の最適性を確立する。
論文 参考訳(メタデータ) (2020-10-23T09:12:47Z) - Coordinated Online Learning for Multi-Agent Systems with Coupled
Constraints and Perturbed Utility Observations [91.02019381927236]
本研究では, 資源制約を満たすため, エージェントを安定な集団状態へ誘導する新しい手法を提案する。
提案手法は,ゲームラグランジアンの拡張によるリソース負荷に基づく分散リソース価格設定手法である。
論文 参考訳(メタデータ) (2020-10-21T10:11:17Z) - Regularized Online Allocation Problems: Fairness and Beyond [7.433931244705934]
本稿では, 総資源消費に作用する非線形正規化器を含む変種である, 語彙化オンライン割当問題を紹介する。
この問題では、要求は時間とともに繰り返し届き、各要求に対して、意思決定者は報酬を生成しリソースを消費するアクションを取る必要があります。
目的は、資源制約を受ける加算可分な報酬と非分離可正則化器の値とを同時に最大化することである。
論文 参考訳(メタデータ) (2020-07-01T14:24:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。