論文の概要: Optimal Nonlinear Online Learning under Sequential Price Competition via s-Concavity
- arxiv url: http://arxiv.org/abs/2503.16737v1
- Date: Thu, 20 Mar 2025 22:51:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-24 14:57:36.855200
- Title: Optimal Nonlinear Online Learning under Sequential Price Competition via s-Concavity
- Title(参考訳): s-concavityによる逐次価格競争下における最適非線形オンライン学習
- Authors: Daniele Bracale, Moulinath Banerjee, Cong Shi, Yuekai Sun,
- Abstract要約: われわれは、複数の売り手の間での価格競争をT$の期間で検討している。
売り手は価格を同時に提供し、それぞれの需要を競合相手に見つからないように監視する。
すべての売り手が当社の政策を採用すると、その価格がナッシュ均衡価格に対して$O(T-1/7)のレートで収束し、もし売り手が十分に情報を得たらリーチできることが示される。
- 参考スコア(独自算出の注目度): 24.586053819490985
- License:
- Abstract: We consider price competition among multiple sellers over a selling horizon of $T$ periods. In each period, sellers simultaneously offer their prices and subsequently observe their respective demand that is unobservable to competitors. The demand function for each seller depends on all sellers' prices through a private, unknown, and nonlinear relationship. To address this challenge, we propose a semi-parametric least-squares estimation of the nonlinear mean function, which does not require sellers to communicate demand information. We show that when all sellers employ our policy, their prices converge at a rate of $O(T^{-1/7})$ to the Nash equilibrium prices that sellers would reach if they were fully informed. Each seller incurs a regret of $O(T^{5/7})$ relative to a dynamic benchmark policy. A theoretical contribution of our work is proving the existence of equilibrium under shape-constrained demand functions via the concept of $s$-concavity and establishing regret bounds of our proposed policy. Technically, we also establish new concentration results for the least squares estimator under shape constraints. Our findings offer significant insights into dynamic competition-aware pricing and contribute to the broader study of non-parametric learning in strategic decision-making.
- Abstract(参考訳): われわれは、複数の売り手の間での価格競争をT$の期間で検討している。
各期間、売り手は価格を同時に提供し、その後、競合相手には見つからないそれぞれの需要を観察する。
各売り手の需要関数は、プライベート、未知、非線形な関係を通じて、すべての売り手の価格に依存する。
この課題に対処するために,販売者が要求情報を伝達する必要のない非線形平均関数の半パラメトリック最小二乗推定を提案する。
すべての売り手が当社の政策を採用すると、その価格がナッシュ均衡価格に対して$O(T^{-1/7})のレートで収束し、もし売り手が十分に情報を得たらリーチできることが示される。
各売り手は、動的なベンチマークポリシーに対して$O(T^{5/7})を後悔する。
我々の研究の理論的貢献は、$s$-concavityという概念を用いて、形に制約された需要関数の下での均衡の存在を証明し、提案された政策の後悔の限界を確立することである。
技術的には,最小二乗推定器の形状制約下での新しい濃度測定結果も確立する。
本研究は,戦略的意思決定における非パラメトリック学習のより広範な研究に寄与する。
関連論文リスト
- Dynamic Pricing with Adversarially-Censored Demands [25.566323930646178]
我々は,各時点における潜在需要が$t=1,2,ldots,T$であり,価格に依存するオンライン動的価格問題について検討する。
一度に$t$が課せられ、在庫水準を超えた場合の潜在的な需要を検閲する。
本アルゴリズムは,逆在庫級数であっても,$tildeO(sqrtT)$Optimative regretを達成できることを示す。
論文 参考訳(メタデータ) (2025-02-10T05:37:39Z) - Fairness-aware Contextual Dynamic Pricing with Strategic Buyers [4.883313216485195]
本稿では,価格の公平性を同時に達成し,戦略的行動を阻害する動的価格政策を提案する。
我々のポリシーは、$O(sqrt+H(T))$ regret over $T$ time horizons という上限を達成する。
我々はまた、我々の問題設定の下で、いかなる価格ポリシーの低い限界を後悔する$Omega(sqrtT)を証明します。
論文 参考訳(メタデータ) (2025-01-25T22:30:37Z) - A Primal-Dual Online Learning Approach for Dynamic Pricing of Sequentially Displayed Complementary Items under Sale Constraints [54.46126953873298]
顧客に対して順次表示される補完アイテムの動的価格設定の問題に対処する。
各項目の価格を個別に最適化するのは効果がないため、補完項目のコヒーレントな価格ポリシーが不可欠である。
実世界のデータからランダムに生成した合成設定を用いて,我々のアプローチを実証的に評価し,制約違反や後悔の観点からその性能を比較した。
論文 参考訳(メタデータ) (2024-07-08T09:55:31Z) - On Tractable $Φ$-Equilibria in Non-Concave Games [53.212133025684224]
非コンケーブゲームにおいて、抽出可能な$Phi$-equilibriaについて検討する。
Phi$が有限であるとき、対応する$Phi$-equilibriaに収束する効率的な非結合学習アルゴリズムが存在することを示す。
論文 参考訳(メタデータ) (2024-03-13T01:51:30Z) - Dynamic Pricing and Learning with Long-term Reference Effects [16.07344044662994]
本研究では,販売者が提示した過去の価格の基準価格が平均値となる,シンプルで斬新な参照価格メカニズムについて検討する。
このメカニズムの下では,モデルパラメータに関係なく,マークダウンポリシがほぼ最適であることを示す。
次に、需要モデルパラメータが不明な、より困難な動的価格と学習の問題について検討する。
論文 参考訳(メタデータ) (2024-02-19T21:36:54Z) - Contextual Dynamic Pricing with Strategic Buyers [93.97401997137564]
戦略的買い手によるコンテキスト動的価格問題について検討する。
売り手は買い手の真の特徴を観察せず、買い手の戦略行動に応じて操作された特徴を観察する。
本稿では,販売者の累積収益を最大化するために,購入者の戦略的行動をオンライン学習に取り入れた戦略的動的価格政策を提案する。
論文 参考訳(メタデータ) (2023-07-08T23:06:42Z) - Structured Dynamic Pricing: Optimal Regret in a Global Shrinkage Model [50.06663781566795]
消費者の嗜好と価格感が時間とともに変化する動的モデルを考える。
我々は,モデルパラメータの順序を事前に把握している透視者と比較して,収益損失が予想される,後悔による動的価格政策の性能を計測する。
提案した政策の最適性を示すだけでなく,政策立案のためには,利用可能な構造情報を組み込むことが不可欠であることを示す。
論文 参考訳(メタデータ) (2023-03-28T00:23:23Z) - Autoregressive Bandits [58.46584210388307]
本稿では,オンライン学習環境であるAutoregressive Banditsを提案する。
報酬プロセスの軽微な仮定の下では、最適ポリシーを便利に計算できることが示される。
次に、新しい楽観的後悔最小化アルゴリズム、すなわちAutoRegressive Upper Confidence Bound (AR-UCB)を考案し、$widetildemathcalO left( frac(k+1)3/2sqrtnT (1-G)のサブ線形後悔を被る。
論文 参考訳(メタデータ) (2022-12-12T21:37:36Z) - A Reinforcement Learning Approach in Multi-Phase Second-Price Auction
Design [158.0041488194202]
多相第2価格オークションにおけるリザーブ価格の最適化について検討する。
売り手の視点からは、潜在的に非現実的な入札者の存在下で、環境を効率的に探索する必要がある。
第三に、売り手のステップごとの収益は未知であり、非線形であり、環境から直接観察することさえできない。
論文 参考訳(メタデータ) (2022-10-19T03:49:05Z) - Fairness-aware Online Price Discrimination with Nonparametric Demand
Models [13.46602731592102]
本稿では,公平性制約下での動的識別価格の問題について検討する。
本稿では,厳格な価格公正性制約を強制する,後悔に関する最適動的価格政策を提案する。
論文 参考訳(メタデータ) (2021-11-16T04:31:02Z) - Dynamic Incentive-aware Learning: Robust Pricing in Contextual Auctions [13.234975857626752]
我々は、文脈的な第2価格オークションにおいて、戦略的買い手に対する準備価格の堅牢な学習の問題を考察する。
このような戦略的行動に頑健な学習方針を提案する。
論文 参考訳(メタデータ) (2020-02-25T19:00:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。