Fugu-MT 論文翻訳(概要): Degeneracy is OK: Logarithmic Regret for Network Revenue Management with Indiscrete Distributions

論文の概要: Degeneracy is OK: Logarithmic Regret for Network Revenue Management with Indiscrete Distributions

arxiv url: http://arxiv.org/abs/2210.07996v5
Date: Thu, 02 Jan 2025 16:07:08 GMT
ステータス: 翻訳完了
システム内更新日: 2025-01-03 22:24:07.608708
Title: Degeneracy is OK: Logarithmic Regret for Network Revenue Management with Indiscrete Distributions
Title（参考訳）: デジェネリアシーは問題ない:不一致分布を考慮したネットワーク収益管理のための対数レグレット
Authors: Jiashuo Jiang, Will Ma, Jiawei Zhang,
Abstract要約: 我々は、従来のネットワーク収益管理(NRM)問題について、意思決定を受理/退避し、IIDの到着を$T$で検討する。本モデルでは,O(log2 T)$ regret を実現するオンラインアルゴリズムを開発した。 2階成長の仮定を追加して、$O(log T)$ regretを達成する2番目の結果を得る。
参考スコア（独自算出の注目度）: 13.310272407473809
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We study the classical Network Revenue Management (NRM) problem with accept/reject decisions and $T$ IID arrivals. We consider a distributional form where each arrival must fall under a finite number of possible categories, each with a deterministic resource consumption vector, but a random value distributed continuously over an interval. We develop an online algorithm that achieves $O(\log^2 T)$ regret under this model, with the only (necessary) assumption being that the probability densities are bounded away from 0. We derive a second result that achieves $O(\log T)$ regret under an additional assumption of second-order growth. To our knowledge, these are the first results achieving logarithmic-level regret in an NRM model with continuous values that do not require any kind of "non-degeneracy" assumptions. Our results are achieved via new techniques including a new method of bounding myopic regret, a "semi-fluid" relaxation of the offline allocation, and an improved bound on the "dual convergence".
Abstract（参考訳）: 我々は、従来のネットワーク収益管理(NRM)問題について、意思決定の受け入れ/拒否と、入場料のT$IIDについて検討する。我々は、各到着が、決定論的資源消費ベクトルを持つ有限個のカテゴリに該当しなければならない分布形式を考えるが、ある間隔で連続的に分布するランダム値を考える。我々はこのモデルの下で$O(\log^2 T)$ regret を達成するオンラインアルゴリズムを開発する。 2階成長の仮定を追加して、$O(\log T)$ regretを達成する2番目の結果を得る。我々の知る限り、これらは、いかなる種類の「非退化」仮定も必要としない連続的な値を持つ NRM モデルにおいて、対数レベルの後悔を達成する最初の結果である。本研究の結果は, 新たなミオピック・リフレッシュ法, オフラインアロケーションの「半流動」緩和法, 二重収束法の改良などによって得られた。

関連論文リスト

Gradual Domain Adaptation via Manifold-Constrained Distributionally Robust Optimization [0.4732176352681218]
本稿では、多様体制約データ分布のクラスにおける段階的領域適応の課題に対処する。本稿では,適応的なワッサースタイン半径を持つ分布ロバスト最適化(DRO)を基礎とした手法を提案する。我々のバウンダリは、新たに導入されたそれとの互換性尺度に依存しており、シーケンスに沿ったエラー伝搬のダイナミクスを完全に特徴付けています。
論文参考訳（メタデータ） (2024-10-17T22:07:25Z)
A Pseudo-Semantic Loss for Autoregressive Models with Logical Constraints [87.08677547257733]
ニューロシンボリックAIは、純粋にシンボリックな学習とニューラルな学習のギャップを埋める。本稿では,ニューラルネットワークの出力分布に対するシンボリック制約の可能性を最大化する方法を示す。また,スドクと最短経路予測の手法を自己回帰世代として評価した。
論文参考訳（メタデータ） (2023-12-06T20:58:07Z)
Adaptive, Doubly Optimal No-Regret Learning in Strongly Monotone and Exp-Concave Games with Gradient Feedback [75.29048190099523]
オンライン勾配降下(OGD)は、強い凸性や単調性仮定の下では二重最適であることが知られている。本稿では,これらのパラメータの事前知識を必要としない完全適応型OGDアルゴリズム,textsfAdaOGDを設計する。
論文参考訳（メタデータ） (2023-10-21T18:38:13Z)
$(\epsilon, u)$-Adaptive Regret Minimization in Heavy-Tailed Bandits [29.966828248335972]
我々は,学習者に対して,$epsilon$と$u$が不明な場合に,後悔の最小化問題を調査する。 AdaR-UCBは、適応しない重みを帯びたケースとほぼ一致した後悔の保証を享受する最初のアルゴリズムである。
論文参考訳（メタデータ） (2023-10-04T17:11:15Z)
Classification of Data Generated by Gaussian Mixture Models Using Deep ReLU Networks [28.437011792990347]
本稿では,ガウス混合ネットワーク下で発生した$math RMsのデータ二項分類について検討する。コンバージェンスレートが初めて$d2013xのニューラル解析レートを得る。結果は、実用的な分類問題におけるディープニューラルネットワークの理論的検証を提供する。
論文参考訳（メタデータ） (2023-08-15T20:40:42Z)
Towards Faster Non-Asymptotic Convergence for Diffusion-Based Generative Models [49.81937966106691]
我々は拡散モデルのデータ生成過程を理解するための非漸近理論のスイートを開発する。従来の研究とは対照的に,本理論は基本的だが多目的な非漸近的アプローチに基づいて開発されている。
論文参考訳（メタデータ） (2023-06-15T16:30:08Z)
Variance-Dependent Regret Bounds for Linear Bandits and Reinforcement Learning: Adaptivity and Computational Efficiency [90.40062452292091]
本稿では,不整合雑音を持つ線形帯域に対する計算効率のよい最初のアルゴリズムを提案する。我々のアルゴリズムは未知のノイズの分散に適応し、$tildeO(d sqrtsum_k = 1K sigma_k2 + d)$ regretを達成する。また、強化学習において、線形混合マルコフ決定過程(MDP)に対する分散適応アルゴリズムを提案する。
論文参考訳（メタデータ） (2023-02-21T00:17:24Z)
Constrained Online Two-stage Stochastic Optimization: Near Optimal Algorithms via Adversarial Learning [1.994307489466967]
有限地平線上の長期制約付きオンライン2段階最適化をT$周期で検討する。対戦型学習アルゴリズムからオンライン二段階問題のオンラインアルゴリズムを開発する。
論文参考訳（メタデータ） (2023-02-02T10:33:09Z)
Contextual Decision-Making with Knapsacks Beyond the Worst Case [5.65888994172721]
資源制約を伴う動的意思決定シナリオの枠組みについて検討する。このフレームワークでは、エージェントがランダムな要求を観察すると、各ラウンドでアクションを選択する。我々のアルゴリズムは最悪の場合であっても、ほぼ最適の$widetildeO(sqrtT)$ regretを維持していることを証明している。
論文参考訳（メタデータ） (2022-11-25T08:21:50Z)
Bounding the Width of Neural Networks via Coupled Initialization -- A Worst Case Analysis [121.9821494461427]
2層ReLUネットワークに必要なニューロン数を著しく削減する方法を示す。また、事前の作業を改善するための新しい下位境界を証明し、ある仮定の下では、最善を尽くすことができることを証明します。
論文参考訳（メタデータ） (2022-06-26T06:51:31Z)
Robust Learning of Optimal Auctions [84.13356290199603]
本研究では、入札者の評価値のサンプルを逆向きに破損させたり、逆向きに歪んだ分布から引き出すことができる場合に、サンプルから収益-最適マルチバイダオークションを学習する問題について検討する。我々は,コルモゴロフ-スミルノフ距離における元の分布に対して$alpha$-closeの「全ての真の分布」に対して,収入がほぼ同時に最適であるメカニズムを学習できる新しいアルゴリズムを提案する。
論文参考訳（メタデータ） (2021-07-13T17:37:21Z)
Sparse network asymptotics for logistic regression [0.0]
ロジスティック回帰の漸近正規性は三角配列に対する Martingale Central limit theorem (CLT) を用いて示される。スパースネットワークは、サンプリング変動のさらなる源を含むばらつきを示唆し、(ii) はダイアディック依存の度合いで有効であるので、より良い推論をもたらす可能性がある。
論文参考訳（メタデータ） (2020-10-09T17:46:29Z)
An Infinite-Feature Extension for Bayesian ReLU Nets That Fixes Their Asymptotic Overconfidence [65.24701908364383]
ベイズ処理は、トレーニングデータを取り巻くReLUネットの過信を軽減することができる。しかし、彼らから遠く離れたところでは、ReLUニューラルネットワーク(BNN)はいまだに不確実性を過小評価し過ぎている可能性がある。事前学習した任意のReLU BNNに対して,低コストでemphpost-hocを適用可能であることを示す。
論文参考訳（メタデータ） (2020-10-06T13:32:18Z)
Approximation Schemes for ReLU Regression [80.33702497406632]
我々はReLU回帰の根本的な問題を考察する。目的は、未知の分布から引き出された2乗損失に対して、最も適したReLUを出力することである。
論文参考訳（メタデータ） (2020-05-26T16:26:17Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。