Fugu-MT 論文翻訳(概要): Fairness-aware Network Revenue Management with Demand Learning

論文の概要: Fairness-aware Network Revenue Management with Demand Learning

arxiv url: http://arxiv.org/abs/2207.11159v1
Date: Fri, 22 Jul 2022 15:55:49 GMT
ステータス: 翻訳完了
システム内更新日: 2022-07-25 12:51:55.528888
Title: Fairness-aware Network Revenue Management with Demand Learning
Title（参考訳）: 需要学習による公正なネットワーク収益管理
Authors: Xi Chen, Jiameng Lyu, Yining Wang, Yuan Zhou
Abstract要約: 本稿では,需要学習と公正度を両立させた価格ベースのネットワーク収益管理問題について検討する。我々は、収益目標に公正を組み込む目的として、正規化収益、すなわち、公正化正規化を伴う総収益を導入する。我々のアルゴリズムは、$tilde O(N5/2sqrtT)$の最悪の後悔を実現する。
参考スコア（独自算出の注目度）: 19.526563642585803
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In addition to maximizing the total revenue, decision-makers in lots of industries would like to guarantee fair consumption across different resources and avoid saturating certain resources. Motivated by these practical needs, this paper studies the price-based network revenue management problem with both demand learning and fairness concern about the consumption across different resources. We introduce the regularized revenue, i.e., the total revenue with a fairness regularization, as our objective to incorporate fairness into the revenue maximization goal. We propose a primal-dual-type online policy with the Upper-Confidence-Bound (UCB) demand learning method to maximize the regularized revenue. We adopt several innovative techniques to make our algorithm a unified and computationally efficient framework for the continuous price set and a wide class of fairness regularizers. Our algorithm achieves a worst-case regret of $\tilde O(N^{5/2}\sqrt{T})$, where $N$ denotes the number of products and $T$ denotes the number of time periods. Numerical experiments in a few NRM examples demonstrate the effectiveness of our algorithm for balancing revenue and fairness.
Abstract（参考訳）: 総収入の最大化に加えて、多くの業界の意思決定者は、異なる資源の公平な消費を保証し、特定の資源の飽和を避けることを望む。本論文は,これらの実践的ニーズを背景として,需要学習と資源間の消費に対する公平性の両面から,価格に基づくネットワーク収益管理の問題を研究する。我々は、公平さを収益の最大化目標に組み込むことを目的として、正規化収益、すなわちフェアネス正規化による総収益を導入する。正規化収益を最大化するために,UCB (Upper-Confidence-Bound) 要求学習手法を用いた原始二重型オンラインポリシーを提案する。我々は、アルゴリズムを連続価格設定のための統一的かつ計算効率の良いフレームワークにするために、いくつかの革新的手法を採用する。我々のアルゴリズムは、$\tilde O(N^{5/2}\sqrt{T})$, $N$は製品数を表し、$T$は期間数を表す。いくつかのnrm例における数値実験は、収益と公平さのバランスをとるためのアルゴリズムの有効性を示している。

関連論文リスト

$φ$-DPO: Fairness Direct Preference Optimization Approach to Continual Learning in Large Multimodal Models [58.217707070069885]
本稿では,LMMにおける連続学習のためのFairness Direct Preference Optimization (FaiDPO, $-DPO) フレームワークを提案する。まず,直接選好最適化(DPO)に基づく新たな連続学習パラダイムを提案する。大規模な実験とアブレーション研究は、提案された$-DPOが複数のベンチマークでステート・オブ・ザ・アートのパフォーマンスを達成することを示している。
論文参考訳（メタデータ） (2026-02-26T04:14:33Z)
MaRCA: Multi-Agent Reinforcement Learning for Dynamic Computation Allocation in Large-Scale Recommender Systems [11.011695215804629]
提案手法は,レコメンデータシステムにおけるエンドツーエンドの計算資源割り当てのための強化学習フレームワークであるMARCAを提案する。 MaRCAは毎日数十億の広告リクエストを処理しており、既存の計算リソースを使用して16.67%の収益を上げている。
論文参考訳（メタデータ） (2025-12-30T16:27:41Z)
A Fair OR-ML Framework for Resource Substitution in Large-Scale Networks [14.634171922038675]
本稿では,オペレーティングリサーチ(OR)と機械学習(ML)を組み合わせて,大規模ネットワークにおける資源の公平な置換を可能にする汎用フレームワークを提案する。このフレームワークは、世界最大のパッケージデリバリー企業のネットワークに適用されている。
論文参考訳（メタデータ） (2025-11-23T03:38:41Z)
Your Reward Function for RL is Your Best PRM for Search: Unifying RL and Search-Based TTS [62.22644307952087]
本稿では、RLベースと検索ベースTTSの最初の自然統合であるAIRL-Sを紹介する。逆逆強化学習(AIRL)とグループ相対政策最適化(GRPO)を組み合わせることで、正しい推論トレースから高密度な動的PRMを直接学習する。提案手法は,GPT-4oと一致して,ベースモデル上での平均9%の性能向上を図っている。
論文参考訳（メタデータ） (2025-08-19T23:41:15Z)
No-Regret Learning Under Adversarial Resource Constraints: A Spending Plan Is All You Need! [56.80767500991973]
アクション選択の前に報酬とコストが観測される$(i)$オンラインリソース割当と、アクション選択後、完全なフィードバックや盗賊フィードバックの下で、リソース制限付きオンライン学習である$(ii)$オンラインリソース割当に焦点を当てた。報酬とコスト分布が時間とともに任意に変化する場合、これらの設定でサブ線形後悔を達成することは不可能であることが知られている。我々は、支出計画に従う基準線に対する半線形後悔を実現する一般的な(基本的)二重的手法を設計し、また、支出計画が予算のバランスの取れた配分を保証すると、アルゴリズムの性能が向上する。
論文参考訳（メタデータ） (2025-06-16T08:42:31Z)
Network Resource Optimization for ML-Based UAV Condition Monitoring with Vibration Analysis [54.550658461477106]
条件監視(CM)は機械学習(ML)モデルを使用して異常および異常な条件を識別する。本研究では,MLベースのUAV CMフレームワークにおけるネットワークリソースの最適化について検討する。次元削減技術を活用することで、ネットワークリソース消費の99.9%が削減される。
論文参考訳（メタデータ） (2025-02-21T14:36:12Z)
Joint Pricing and Resource Allocation: An Optimal Online-Learning Approach [20.70943884841438]
ネット全体の利益を最大化するために、価格と在庫を共同で決定するオンライン学習の地平について検討する。我々は,複数のOCO上での信頼境界戦略を利用した効率的なアルゴリズムを開発した。
論文参考訳（メタデータ） (2025-01-29T23:23:54Z)
AI-Driven Resource Allocation Framework for Microservices in Hybrid Cloud Platforms [1.03590082373586]
本稿では,ハイブリッドクラウドプラットフォームにおけるリソース割り当てのためのAI駆動型フレームワークを提案する。このフレームワークは、コスト削減と性能向上のために強化学習(RL)ベースのリソース利用最適化を採用している。
論文参考訳（メタデータ） (2024-12-03T17:41:08Z)
MetaTrading: An Immersion-Aware Model Trading Framework for Vehicular Metaverse Services [94.61039892220037]
我々は、フェデレーション学習(FL)によるプライバシーを確保しつつ、サービスのデータ提供を容易にする没入型モデルトレーディングフレームワークを提案する。我々は,資源制約下での高価値モデルに貢献するために,メタバースユーザ(MU)にインセンティブを与えるインセンティブ機構を設計する。我々は、MUやその他のMSPに関するプライベート情報にアクセスすることなく、深層強化学習に基づく完全に分散された動的報酬アルゴリズムを開発する。
論文参考訳（メタデータ） (2024-10-25T16:20:46Z)
Reinforcement Learning-Based Adaptive Load Balancing for Dynamic Cloud Environments [0.0]
これらの課題に対処するために,Reinforcement Learning (RL) を用いた適応型ロードバランシングフレームワークを提案する。我々のフレームワークは、タスクを動的に再配置し、レイテンシを最小化し、サーバ間のリソース利用のバランスを確保するように設計されています。実験の結果,提案したRLベースのロードバランサは,応答時間,資源利用量,ワークロードの変化に対する適応性などの観点から,従来のアルゴリズムよりも優れていた。
論文参考訳（メタデータ） (2024-09-07T19:40:48Z)
Overcoming Recency Bias of Normalization Statistics in Continual Learning: Balance and Adaptation [67.77048565738728]
継続的な学習には、一連のタスクを学習し、彼らの知識を適切にバランスさせることが含まれる。本稿では,タスク・ワイド・コントリビューションに適応するためのベイズ的戦略を適切に取り入れた BN の適応バランス (AdaB$2$N) を提案する。提案手法は,幅広いベンチマークにおいて,大幅な性能向上を実現している。
論文参考訳（メタデータ） (2023-10-13T04:50:40Z)
Online Learning for Incentive-Based Demand Response [0.0]
我々は、需要応答(DR)リソースを管理するためにオンライン学習の問題を考察する。報酬価格の摂動を考慮した最小二乗を用いたオンライン学習手法を提案する。
論文参考訳（メタデータ） (2023-03-27T22:08:05Z)
A State-Augmented Approach for Learning Optimal Resource Management Decisions in Wireless Networks [58.720142291102135]
マルチユーザ無線ネットワークにおける無線リソース管理(RRM)問題について考察する。目標は、ユーザのエルゴード平均パフォーマンスに制約を受けるネットワーク全体のユーティリティ機能を最適化することである。本稿では, RRM の制約に対応する2変数の集合を入力として, 瞬時ネットワーク状態と並行して, RRM のパラメータ化を提案する。
論文参考訳（メタデータ） (2022-10-28T21:24:13Z)
Approaching sales forecasting using recurrent neural networks and transformers [57.43518732385863]
深層学習技術を用いて,日・店・店レベルでの顧客販売予測問題に対処する3つの方法を開発した。実験結果から,データ前処理を最小限に抑えた単純なシーケンスアーキテクチャを用いて,優れた性能を実現することができることを示す。提案した解は約0.54の RMSLE を達成し、Kaggle コンペティションで提案された問題に対する他のより具体的な解と競合する。
論文参考訳（メタデータ） (2022-04-16T12:03:52Z)
Towards Revenue Maximization with Popular and Profitable Products [69.21810902381009]
企業マーケティングの共通のゴールは、様々な効果的なマーケティング戦略を活用することで、収益/利益を最大化することである。商品の収益性に関する信頼性のある情報を見つけることは、ほとんどの製品が一定の時期にピークを迎える傾向があるため困難である。本稿では、経済行動に基づく収益問題に対処し、ターゲットマーケティングのための0n-shelf Popular and most Profitable Products(OPPPs)を実行するための一般的な利益志向の枠組みを提案する。
論文参考訳（メタデータ） (2022-02-26T02:07:25Z)
PROMPT: Learning Dynamic Resource Allocation Policies for Network Applications [16.812611987082082]
本稿では、プロアクティブな予測を用いて強化学習コントローラを誘導する新しいリソース割り当てフレームワークPROMPTを提案する。本稿では,PROMPTが4.2倍少ない違反を発生させ,政策違反の深刻度を12.7倍に低減し,最善を尽くした作業負荷性能を向上し,先行作業よりも全体的な電力効率を向上することを示す。
論文参考訳（メタデータ） (2022-01-19T23:34:34Z)
Computation Resource Allocation Solution in Recommender Systems [19.456109814747048]
限られた計算資源と応答時間でビジネス目標を最大化する計算資源割当ソリューション(CRAS)を提案します。本手法の有効性はtaobao.comの実データに基づく広範囲な実験により検証された。
論文参考訳（メタデータ） (2021-03-03T08:41:43Z)
Coordinated Online Learning for Multi-Agent Systems with Coupled Constraints and Perturbed Utility Observations [91.02019381927236]
本研究では, 資源制約を満たすため, エージェントを安定な集団状態へ誘導する新しい手法を提案する。提案手法は,ゲームラグランジアンの拡張によるリソース負荷に基づく分散リソース価格設定手法である。
論文参考訳（メタデータ） (2020-10-21T10:11:17Z)
Resource Allocation via Model-Free Deep Learning in Free Space Optical Communications [119.81868223344173]
本稿では,自由空間光学(FSO)通信におけるチャネルフェージング効果の緩和のための資源配分の一般的な問題について検討する。本フレームワークでは,FSO資源割り当て問題を解決する2つのアルゴリズムを提案する。
論文参考訳（メタデータ） (2020-07-27T17:38:51Z)
Regularized Online Allocation Problems: Fairness and Beyond [7.433931244705934]
本稿では, 総資源消費に作用する非線形正規化器を含む変種である, 語彙化オンライン割当問題を紹介する。この問題では、要求は時間とともに繰り返し届き、各要求に対して、意思決定者は報酬を生成しリソースを消費するアクションを取る必要があります。目的は、資源制約を受ける加算可分な報酬と非分離可正則化器の値とを同時に最大化することである。
論文参考訳（メタデータ） (2020-07-01T14:24:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。