論文の概要: Towards Agnostic Feature-based Dynamic Pricing: Linear Policies vs
Linear Valuation with Unknown Noise
- arxiv url: http://arxiv.org/abs/2201.11341v1
- Date: Thu, 27 Jan 2022 06:40:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-28 14:46:48.553013
- Title: Towards Agnostic Feature-based Dynamic Pricing: Linear Policies vs
Linear Valuation with Unknown Noise
- Title(参考訳): 特徴量に基づく動的価格設定をめざす:未知雑音による線形ポリシーと線形評価
- Authors: Jianyu Xu and Yu-Xiang Wang
- Abstract要約: 我々は,$tildeO(Tfrac34)$の後悔を実現するアルゴリズムを示し,$Omega(Tfrac35)$から$tildeOmega(Tfrac23)$への最もよく知られた下限を改善する。
その結果, 弱い仮定の下では, 特徴量に基づく動的価格設定が可能であることが示唆された。
- 参考スコア(独自算出の注目度): 16.871660060209674
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In feature-based dynamic pricing, a seller sets appropriate prices for a
sequence of products (described by feature vectors) on the fly by learning from
the binary outcomes of previous sales sessions ("Sold" if valuation $\geq$
price, and "Not Sold" otherwise). Existing works either assume noiseless linear
valuation or precisely-known noise distribution, which limits the applicability
of those algorithms in practice when these assumptions are hard to verify. In
this work, we study two more agnostic models: (a) a "linear policy" problem
where we aim at competing with the best linear pricing policy while making no
assumptions on the data, and (b) a "linear noisy valuation" problem where the
random valuation is linear plus an unknown and assumption-free noise. For the
former model, we show a $\tilde{\Theta}(d^{\frac13}T^{\frac23})$ minimax regret
up to logarithmic factors. For the latter model, we present an algorithm that
achieves an $\tilde{O}(T^{\frac34})$ regret, and improve the best-known lower
bound from $\Omega(T^{\frac35})$ to $\tilde{\Omega}(T^{\frac23})$. These
results demonstrate that no-regret learning is possible for feature-based
dynamic pricing under weak assumptions, but also reveal a disappointing fact
that the seemingly richer pricing feedback is not significantly more useful
than the bandit-feedback in regret reduction.
- Abstract(参考訳): 機能ベースの動的価格設定では、売り手は、以前の販売セッションのバイナリ結果から学び、(特徴ベクトルによって説明される)一連の製品に対して適切な価格を設定する(“Sold” if valuation $\geq$ price, “Not Sold” など)。
既存の研究はノイズのない線形評価を仮定するか、正確には既知のノイズ分布を仮定している。
本研究では,2つの非依存モデルについて検討する。
(a)データを前提にすることなく、最良の線形価格政策と競合することを目的とした「線形ポリシー」問題
(b)無作為なバリュエーションが線形であり、未知で仮定のないノイズである「線形ノイズバリュエーション」問題。
前者のモデルでは、対数因子に対して$\tilde{\theta}(d^{\frac13}t^{\frac23})$ minimaxの後悔を示す。
後者のモデルでは、$\tilde{O}(T^{\frac34})を後悔し、最もよく知られた下限を$\Omega(T^{\frac35})$から$\tilde{\Omega}(T^{\frac23})$に改善するアルゴリズムを提案する。
これらの結果から,弱い仮定下では,機能ベースの動的価格設定ではリグレット学習は不可能であるが,後悔の軽減におけるバンディットフィードバックに比べて,一見リッチな価格フィードバックはそれほど有用ではないという残念な事実が明らかになった。
関連論文リスト
- Minimax Optimality in Contextual Dynamic Pricing with General Valuation Models [4.156757591117864]
本稿では,問題に対する仮定を最小化しながら,改善された後悔境界を実現する新しいアルゴリズムを提案する。
本手法は, 一般関数空間を考慮し, 動的価格設定によく用いられる線形評価モデルを超えて拡張する。
論文 参考訳(メタデータ) (2024-06-24T23:43:56Z) - Improved Algorithms for Contextual Dynamic Pricing [24.530341596901476]
コンテキスト動的価格設定では、売り手はコンテキスト情報に基づいて商品を順次価格設定する。
提案アルゴリズムは,$tildemathcalO(T2/3)$の最適再帰限界を達成し,既存の結果を改善する。
このモデルに対して,我々のアルゴリズムは,文脈空間の次元を$d$とする,後悔の$tildemathcalO(Td+2beta/d+3beta)$を得る。
論文 参考訳(メタデータ) (2024-06-17T08:26:51Z) - Contextual Dynamic Pricing: Algorithms, Optimality, and Local Differential Privacy Constraints [10.057344315478709]
企業が商品をT$で販売する状況的動的価格問題について検討する。
まず、最適後悔上限は、対数係数まで、次数$sqrtdT$であることを示す。
理論的結果の重要な洞察は、動的価格と文脈的マルチアームバンディット問題との本質的な関係である。
論文 参考訳(メタデータ) (2024-06-04T15:44:10Z) - High-probability Convergence Bounds for Nonlinear Stochastic Gradient Descent Under Heavy-tailed Noise [59.25598762373543]
重み付き雑音の存在下でのストリーミングデータにおける学習の精度保証について検討した。
解析的に、与えられた問題に対する設定の選択に$ta$を使うことができることを実証する。
論文 参考訳(メタデータ) (2023-10-28T18:53:41Z) - Dynamic Pricing and Learning with Bayesian Persuasion [18.59029578133633]
我々は,商品の価格設定に加えて,販売者が「広告計画」にコミットする,新たな動的価格設定と学習環境を考える。
我々は、バイエルンの一般的な説得フレームワークを使用して、これらのシグナルが購入者の評価と購入反応に与える影響をモデル化する。
我々は、過去の購入応答を利用して最適な価格と広告戦略を適応的に学習できるオンラインアルゴリズムを設計する。
論文 参考訳(メタデータ) (2023-04-27T17:52:06Z) - Borda Regret Minimization for Generalized Linear Dueling Bandits [65.09919504862496]
本稿では,ボルダスコアが最も高い項目を識別することを目的とした,デュエルバンディットに対するボルダ後悔最小化問題について検討する。
本稿では,多くの既存モデルをカバーする一般化線形デュエルバンドモデルのリッチクラスを提案する。
我々のアルゴリズムは$tildeO(d2/3 T2/3)$ regretを達成し、これも最適である。
論文 参考訳(メタデータ) (2023-03-15T17:59:27Z) - A Reinforcement Learning Approach in Multi-Phase Second-Price Auction
Design [158.0041488194202]
多相第2価格オークションにおけるリザーブ価格の最適化について検討する。
売り手の視点からは、潜在的に非現実的な入札者の存在下で、環境を効率的に探索する必要がある。
第三に、売り手のステップごとの収益は未知であり、非線形であり、環境から直接観察することさえできない。
論文 参考訳(メタデータ) (2022-10-19T03:49:05Z) - Optimal Online Generalized Linear Regression with Stochastic Noise and
Its Application to Heteroscedastic Bandits [88.6139446295537]
一般化線形モデルの設定におけるオンライン一般化線形回帰の問題について検討する。
ラベルノイズに対処するため、古典的追従正規化リーダ(FTRL)アルゴリズムを鋭く解析する。
本稿では,FTRLに基づくアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-02-28T08:25:26Z) - Logarithmic Regret in Feature-based Dynamic Pricing [0.0]
機能ベースの動的価格設定は、差別化された製品の価格設定の人気が高まっているモデルです。
我々は、インフラクティゲンと敵対的な特徴設定のための2つのアルゴリズムを提供し、両方の最適$O(dlogT)$後悔境界を証明します。
さらに、より一般的な設定で$(sqrtt)$情報理論下限を証明し、"需要曲線の知識"が機能ベースの動的価格の指数関数的な改善につながることを実証します。
論文 参考訳(メタデータ) (2021-02-20T00:45:33Z) - Stochastic Linear Bandits Robust to Adversarial Attacks [117.665995707568]
我々はロバスト位相除去アルゴリズムの2つの変種を提供し、その1つは$C$を知っており、もう1つはそうでない。
いずれの変種も、倒壊しない場合には、それぞれ$C = 0$ となり、それぞれ追加の加法項が生じる。
文脈的設定では、単純な欲求的アルゴリズムは、明示的な探索を行わず、C$を知らないにもかかわらず、ほぼ最適加法的後悔項で証明可能な堅牢性を示す。
論文 参考訳(メタデータ) (2020-07-07T09:00:57Z) - Contextual Linear Bandits under Noisy Features: Towards Bayesian Oracles [65.9694455739978]
特徴不確実性の下での文脈線形帯域問題について検討する。
本分析により, 最適仮説は, 雑音特性に応じて, 基礎となる実現可能性関数から著しく逸脱しうることが明らかとなった。
これは、古典的アプローチが非自明な後悔境界を保証できないことを意味する。
論文 参考訳(メタデータ) (2017-03-03T21:39:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。