論文の概要: Fairness-aware Network Revenue Management with Demand Learning
- arxiv url: http://arxiv.org/abs/2207.11159v1
- Date: Fri, 22 Jul 2022 15:55:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-25 12:51:55.528888
- Title: Fairness-aware Network Revenue Management with Demand Learning
- Title(参考訳): 需要学習による公正なネットワーク収益管理
- Authors: Xi Chen, Jiameng Lyu, Yining Wang, Yuan Zhou
- Abstract要約: 本稿では,需要学習と公正度を両立させた価格ベースのネットワーク収益管理問題について検討する。
我々は、収益目標に公正を組み込む目的として、正規化収益、すなわち、公正化正規化を伴う総収益を導入する。
我々のアルゴリズムは、$tilde O(N5/2sqrtT)$の最悪の後悔を実現する。
- 参考スコア(独自算出の注目度): 19.526563642585803
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In addition to maximizing the total revenue, decision-makers in lots of
industries would like to guarantee fair consumption across different resources
and avoid saturating certain resources. Motivated by these practical needs,
this paper studies the price-based network revenue management problem with both
demand learning and fairness concern about the consumption across different
resources. We introduce the regularized revenue, i.e., the total revenue with a
fairness regularization, as our objective to incorporate fairness into the
revenue maximization goal. We propose a primal-dual-type online policy with the
Upper-Confidence-Bound (UCB) demand learning method to maximize the regularized
revenue. We adopt several innovative techniques to make our algorithm a unified
and computationally efficient framework for the continuous price set and a wide
class of fairness regularizers. Our algorithm achieves a worst-case regret of
$\tilde O(N^{5/2}\sqrt{T})$, where $N$ denotes the number of products and $T$
denotes the number of time periods. Numerical experiments in a few NRM examples
demonstrate the effectiveness of our algorithm for balancing revenue and
fairness.
- Abstract(参考訳): 総収入の最大化に加えて、多くの業界の意思決定者は、異なる資源の公平な消費を保証し、特定の資源の飽和を避けることを望む。
本論文は,これらの実践的ニーズを背景として,需要学習と資源間の消費に対する公平性の両面から,価格に基づくネットワーク収益管理の問題を研究する。
我々は、公平さを収益の最大化目標に組み込むことを目的として、正規化収益、すなわちフェアネス正規化による総収益を導入する。
正規化収益を最大化するために,UCB (Upper-Confidence-Bound) 要求学習手法を用いた原始二重型オンラインポリシーを提案する。
我々は、アルゴリズムを連続価格設定のための統一的かつ計算効率の良いフレームワークにするために、いくつかの革新的手法を採用する。
我々のアルゴリズムは、$\tilde O(N^{5/2}\sqrt{T})$, $N$は製品数を表し、$T$は期間数を表す。
いくつかのnrm例における数値実験は、収益と公平さのバランスをとるためのアルゴリズムの有効性を示している。
関連論文リスト
- Reinforcement Learning-Based Adaptive Load Balancing for Dynamic Cloud Environments [0.0]
これらの課題に対処するために,Reinforcement Learning (RL) を用いた適応型ロードバランシングフレームワークを提案する。
我々のフレームワークは、タスクを動的に再配置し、レイテンシを最小化し、サーバ間のリソース利用のバランスを確保するように設計されています。
実験の結果,提案したRLベースのロードバランサは,応答時間,資源利用量,ワークロードの変化に対する適応性などの観点から,従来のアルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2024-09-07T19:40:48Z) - Overcoming Recency Bias of Normalization Statistics in Continual
Learning: Balance and Adaptation [67.77048565738728]
継続的な学習には、一連のタスクを学習し、彼らの知識を適切にバランスさせることが含まれる。
本稿では,タスク・ワイド・コントリビューションに適応するためのベイズ的戦略を適切に取り入れた BN の適応バランス (AdaB$2$N) を提案する。
提案手法は,幅広いベンチマークにおいて,大幅な性能向上を実現している。
論文 参考訳(メタデータ) (2023-10-13T04:50:40Z) - Online Learning for Incentive-Based Demand Response [0.0]
我々は、需要応答(DR)リソースを管理するためにオンライン学習の問題を考察する。
報酬価格の摂動を考慮した最小二乗を用いたオンライン学習手法を提案する。
論文 参考訳(メタデータ) (2023-03-27T22:08:05Z) - A State-Augmented Approach for Learning Optimal Resource Management
Decisions in Wireless Networks [58.720142291102135]
マルチユーザ無線ネットワークにおける無線リソース管理(RRM)問題について考察する。
目標は、ユーザのエルゴード平均パフォーマンスに制約を受けるネットワーク全体のユーティリティ機能を最適化することである。
本稿では, RRM の制約に対応する2変数の集合を入力として, 瞬時ネットワーク状態と並行して, RRM のパラメータ化を提案する。
論文 参考訳(メタデータ) (2022-10-28T21:24:13Z) - Approaching sales forecasting using recurrent neural networks and
transformers [57.43518732385863]
深層学習技術を用いて,日・店・店レベルでの顧客販売予測問題に対処する3つの方法を開発した。
実験結果から,データ前処理を最小限に抑えた単純なシーケンスアーキテクチャを用いて,優れた性能を実現することができることを示す。
提案した解は約0.54の RMSLE を達成し、Kaggle コンペティションで提案された問題に対する他のより具体的な解と競合する。
論文 参考訳(メタデータ) (2022-04-16T12:03:52Z) - Towards Revenue Maximization with Popular and Profitable Products [69.21810902381009]
企業マーケティングの共通のゴールは、様々な効果的なマーケティング戦略を活用することで、収益/利益を最大化することである。
商品の収益性に関する信頼性のある情報を見つけることは、ほとんどの製品が一定の時期にピークを迎える傾向があるため困難である。
本稿では、経済行動に基づく収益問題に対処し、ターゲットマーケティングのための0n-shelf Popular and most Profitable Products(OPPPs)を実行するための一般的な利益志向の枠組みを提案する。
論文 参考訳(メタデータ) (2022-02-26T02:07:25Z) - PROMPT: Learning Dynamic Resource Allocation Policies for Network
Applications [16.812611987082082]
本稿では、プロアクティブな予測を用いて強化学習コントローラを誘導する新しいリソース割り当てフレームワークPROMPTを提案する。
本稿では,PROMPTが4.2倍少ない違反を発生させ,政策違反の深刻度を12.7倍に低減し,最善を尽くした作業負荷性能を向上し,先行作業よりも全体的な電力効率を向上することを示す。
論文 参考訳(メタデータ) (2022-01-19T23:34:34Z) - Computation Resource Allocation Solution in Recommender Systems [19.456109814747048]
限られた計算資源と応答時間でビジネス目標を最大化する計算資源割当ソリューション(CRAS)を提案します。
本手法の有効性はtaobao.comの実データに基づく広範囲な実験により検証された。
論文 参考訳(メタデータ) (2021-03-03T08:41:43Z) - Coordinated Online Learning for Multi-Agent Systems with Coupled
Constraints and Perturbed Utility Observations [91.02019381927236]
本研究では, 資源制約を満たすため, エージェントを安定な集団状態へ誘導する新しい手法を提案する。
提案手法は,ゲームラグランジアンの拡張によるリソース負荷に基づく分散リソース価格設定手法である。
論文 参考訳(メタデータ) (2020-10-21T10:11:17Z) - Resource Allocation via Model-Free Deep Learning in Free Space Optical
Communications [119.81868223344173]
本稿では,自由空間光学(FSO)通信におけるチャネルフェージング効果の緩和のための資源配分の一般的な問題について検討する。
本フレームワークでは,FSO資源割り当て問題を解決する2つのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-27T17:38:51Z) - Regularized Online Allocation Problems: Fairness and Beyond [7.433931244705934]
本稿では, 総資源消費に作用する非線形正規化器を含む変種である, 語彙化オンライン割当問題を紹介する。
この問題では、要求は時間とともに繰り返し届き、各要求に対して、意思決定者は報酬を生成しリソースを消費するアクションを取る必要があります。
目的は、資源制約を受ける加算可分な報酬と非分離可正則化器の値とを同時に最大化することである。
論文 参考訳(メタデータ) (2020-07-01T14:24:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。