論文の概要: Regularized Online Allocation Problems: Fairness and Beyond
- arxiv url: http://arxiv.org/abs/2007.00514v4
- Date: Fri, 5 Nov 2021 00:40:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-14 23:45:50.726981
- Title: Regularized Online Allocation Problems: Fairness and Beyond
- Title(参考訳): 定期的なオンラインアロケーション問題 - 公平性とそれ以上
- Authors: Santiago Balseiro, Haihao Lu, Vahab Mirrokni
- Abstract要約: 本稿では, 総資源消費に作用する非線形正規化器を含む変種である, 語彙化オンライン割当問題を紹介する。
この問題では、要求は時間とともに繰り返し届き、各要求に対して、意思決定者は報酬を生成しリソースを消費するアクションを取る必要があります。
目的は、資源制約を受ける加算可分な報酬と非分離可正則化器の値とを同時に最大化することである。
- 参考スコア(独自算出の注目度): 7.433931244705934
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Online allocation problems with resource constraints have a rich history in
operations research. In this paper, we introduce the \emph{regularized online
allocation problem}, a variant that includes a non-linear regularizer acting on
the total resource consumption. In this problem, requests repeatedly arrive
over time and, for each request, a decision maker needs to take an action that
generates a reward and consumes resources. The objective is to simultaneously
maximize additively separable rewards and the value of a non-separable
regularizer subject to the resource constraints. Our primary motivation is
allowing decision makers to trade off separable objectives such as the economic
efficiency of an allocation with ancillary, non-separable objectives such as
the fairness or equity of an allocation. We design an algorithm that is simple,
fast, and attains good performance with both stochastic i.i.d.~and adversarial
inputs. In particular, our algorithm is asymptotically optimal under stochastic
i.i.d. input models and attains a fixed competitive ratio that depends on the
regularizer when the input is adversarial. Furthermore, the algorithm and
analysis do not require convexity or concavity of the reward function and the
consumption function, which allows more model flexibility. Numerical
experiments confirm the effectiveness of the proposed algorithm and of
regularization in an internet advertising application.
- Abstract(参考訳): 資源制約を伴うオンライン割り当て問題は、オペレーション研究において豊富な歴史を持っている。
本稿では,全資源消費に作用する非線形正則化器を含む変種である \emph{regularized online allocation problem} を提案する。
この問題では、要求は時間とともに繰り返し届き、各要求に対して、意思決定者は報酬を生成しリソースを消費するアクションを取る必要があります。
目的は、資源制約を受ける加算可分な報酬と非分離可正則化器の値とを同時に最大化することである。
我々の主な動機は、意思決定者がアロケーションの経済的効率などの分離可能な目的、例えばアロケーションの公平性や株式といった非分離的な目的をトレードオフできるようにすることである。
我々は、単純で高速なアルゴリズムを設計し、確率的 i.i.d.~ と逆入力の両方で優れた性能を得る。
特に、我々のアルゴリズムは確率的、すなわち入力モデルの下で漸近的に最適であり、入力が逆となるときの正則化に依存する一定の競合比を得る。
さらに、アルゴリズムと解析は報酬関数と消費関数の凸性や凹性を必要としないため、よりモデル柔軟性が期待できる。
インターネット広告アプリケーションにおける提案アルゴリズムの有効性と正規化の検証実験を行った。
関連論文リスト
- Online Fair Allocation of Perishable Resources [1.4952056744888913]
我々は、標準オンラインフェアアロケーション問題の事実上の動機付け型を考察する。
意思決定者は、一定回数のラウンドを割り当てるために、パーシシブルなリソースの予算を持っている。
目標は、うらやましいほど効率的で効率的なアロケーションのシーケンスを構築することです。
論文 参考訳(メタデータ) (2024-06-04T15:14:10Z) - Switchable Decision: Dynamic Neural Generation Networks [98.61113699324429]
本稿では,各データインスタンスのリソースを動的に割り当てることで,推論を高速化するスイッチブルな決定を提案する。
提案手法は, 同一の精度を維持しながら, 推論時のコスト低減に有効である。
論文 参考訳(メタデータ) (2024-05-07T17:44:54Z) - Learning to Optimize with Stochastic Dominance Constraints [103.26714928625582]
本稿では,不確実量を比較する問題に対して,単純かつ効率的なアプローチを開発する。
我々はラグランジアンの内部最適化をサロゲート近似の学習問題として再考した。
提案したライト-SDは、ファイナンスからサプライチェーン管理に至るまで、いくつかの代表的な問題において優れた性能を示す。
論文 参考訳(メタデータ) (2022-11-14T21:54:31Z) - Online Allocation with Two-sided Resource Constraints [44.5635910908944]
我々は,要求が順次到着する,リソース制約の低いオンラインアロケーション問題を考える。
提案手法では, リクエスト全体を知るオフライン問題に対して, 1-O (fracepsilonalpha-epsilon)$-competitive ratioを求めるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-12-28T02:21:06Z) - Fairer LP-based Online Allocation [13.478067250930101]
本稿では,リニアプログラム(LP)に基づくオンラインリソース割り当て問題について考察する。
内部点LPソルバを用いて不公平な資源支出を動的に検出するフェアアルゴリズムを提案する。
提案手法は最適化インスタンスの制約としてフェアネス要件を定式化せず,アルゴリズム設計の観点からこの問題に対処する。
論文 参考訳(メタデータ) (2021-10-27T17:45:20Z) - False Correlation Reduction for Offline Reinforcement Learning [115.11954432080749]
本稿では,実効的かつ理論的に証明可能なアルゴリズムであるオフラインRLに対するfalSe Correlation Reduction (SCORE)を提案する。
SCOREは、標準ベンチマーク(D4RL)において、様々なタスクにおいて3.1倍の高速化でSoTA性能を達成することを実証的に示す。
論文 参考訳(メタデータ) (2021-10-24T15:34:03Z) - Contingency-Aware Influence Maximization: A Reinforcement Learning
Approach [52.109536198330126]
インフルエンス(IM)問題は、インフルエンスの普及を最大化する、ソーシャルネットワーク内のシードノードのサブセットを見つけることを目的としている。
本研究では、招待されたノードがシードであるかどうかが不確実なIM問題(contingency-aware IM)に焦点をあてる。
最初の成功にもかかわらず、より多くのコミュニティへのソリューションの推進における大きな実践上の障害は、欲張りのアルゴリズムの巨大な実行時である。
論文 参考訳(メタデータ) (2021-06-13T16:42:22Z) - Online Stochastic Optimization with Wasserstein Based Non-stationarity [12.91020811577007]
有限期間の地平線上の複数の予算制約を持つ一般的なオンライン最適化問題を検討する。
意思決定者の目標は、予算制約の対象となる累積報酬を最大化することである。
この定式化は、オンラインリニアプログラミングやネットワーク収益管理を含む幅広いアプリケーションを取り込む。
論文 参考訳(メタデータ) (2020-12-13T04:47:37Z) - The Best of Many Worlds: Dual Mirror Descent for Online Allocation
Problems [7.433931244705934]
本稿では,意思決定者に対して未知の入力モデルを用いて,各要求に対する報酬とリソース消費を生成するデータ駆動型設定について考察する。
様々な入力モデルにおいて,どの入力に直面するかを知ることなく,優れた性能が得られるアルゴリズムの一般クラスを設計する。
我々のアルゴリズムはラグランジアン双対空間で動作し、オンラインミラー降下を用いて更新される各リソースに対して双対乗算器を保持する。
論文 参考訳(メタデータ) (2020-11-18T18:39:17Z) - Coordinated Online Learning for Multi-Agent Systems with Coupled
Constraints and Perturbed Utility Observations [91.02019381927236]
本研究では, 資源制約を満たすため, エージェントを安定な集団状態へ誘導する新しい手法を提案する。
提案手法は,ゲームラグランジアンの拡張によるリソース負荷に基づく分散リソース価格設定手法である。
論文 参考訳(メタデータ) (2020-10-21T10:11:17Z) - Resource Allocation via Model-Free Deep Learning in Free Space Optical
Communications [119.81868223344173]
本稿では,自由空間光学(FSO)通信におけるチャネルフェージング効果の緩和のための資源配分の一般的な問題について検討する。
本フレームワークでは,FSO資源割り当て問題を解決する2つのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-27T17:38:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。