論文の概要: From Confounding to Learning: Dynamic Service Fee Pricing on Third-Party Platforms
- arxiv url: http://arxiv.org/abs/2512.22749v1
- Date: Sun, 28 Dec 2025 02:41:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-30 22:37:30.204179
- Title: From Confounding to Learning: Dynamic Service Fee Pricing on Third-Party Platforms
- Title(参考訳): コンファウンディングから学習へ - サードパーティプラットフォーム上での動的サービス料金
- Authors: Rui Ai, David Simchi-Levi, Feng Zhu,
- Abstract要約: 戦略エージェントに直面するサードパーティプラットフォームの価格変動について検討する。
我々は,$TildecO(sqrtTwedge_S-2)$を最適に後悔するアルゴリズムを開発した。
- 参考スコア(独自算出の注目度): 16.56794300689239
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study the pricing behavior of third-party platforms facing strategic agents. Assuming the platform is a revenue maximizer, it observes market features that generally affect demand. Since only the equilibrium price and quantity are observable, this presents a general demand learning problem under confounding. Mathematically, we develop an algorithm with optimal regret of $\Tilde{\cO}(\sqrt{T}\wedgeσ_S^{-2})$. Our results reveal that supply-side noise fundamentally affects the learnability of demand, leading to a phase transition in regret. Technically, we show that non-i.i.d. actions can serve as instrumental variables for learning demand. We also propose a novel homeomorphic construction that allows us to establish estimation bounds without assuming star-shapedness, providing the first efficiency guarantee for learning demand with deep neural networks. Finally, we demonstrate the practical applicability of our approach through simulations and real-world data from Zomato and Lyft.
- Abstract(参考訳): 戦略エージェントに直面するサードパーティプラットフォームの価格変動について検討する。
プラットフォームが収益を最大化すると仮定すると、一般的に需要に影響を与える市場特性を観察する。
平衡価格と量のみが観測可能であるため、これは不確実な条件下での一般的な需要学習問題である。
数学的には、$\Tilde{\cO}(\sqrt{T}\wedgeσ_S^{-2})$を最適に後悔するアルゴリズムを開発する。
以上の結果から,サプライサイドノイズが需要の学習可能性に根本的に影響していることが判明した。
技術的には、非i.d.アクションが需要を学習するための道具変数として機能することを示します。
また、恒星の形状を仮定せずに推定境界を定め、深層ニューラルネットワークによる学習需要に対する最初の効率保証を提供する新しい同型構造を提案する。
最後に、ZomatoとLyftのシミュレーションと実世界のデータを通じて、我々のアプローチの実用性を実証する。
関連論文リスト
- Intention-Conditioned Flow Occupancy Models [80.42634994902858]
大規模な事前学習は、今日の機械学習研究のやり方を根本的に変えた。
同じフレームワークを強化学習に適用することは、RLの中核的な課題に対処するための魅力的な方法を提供するので、魅力的です。
生成AIの最近の進歩は、高度に複雑な分布をモデリングするための新しいツールを提供している。
論文 参考訳(メタデータ) (2025-06-10T15:27:46Z) - Feature Learning Beyond the Edge of Stability [8.430481660019451]
層幅パターンを隠蔽した均一な多層パーセプトロンパラメタライゼーションを提案し、勾配勾配下でのトレーニングダイナミクスを解析する。
訓練中の最小バッチ損失の最初の3つのTaylor係数について,シャープネスと特徴学習の関連性を示す式を得る。
論文 参考訳(メタデータ) (2025-02-18T18:23:33Z) - Getting More Juice Out of the SFT Data: Reward Learning from Human Demonstration Improves SFT for LLM Alignment [65.15914284008973]
我々は、報酬モデルと政策モデルを同時に構築するために、逆強化学習(IRL)技術を活用することを提案する。
提案アルゴリズムはIRL問題の定常解に収束することを示す。
その結果,アライメントプロセス全体を通じて報酬学習を活用することは有益であることが示唆された。
論文 参考訳(メタデータ) (2024-05-28T07:11:05Z) - An Empirical Study of $μ$P Learning Rate Transfer [0.0]
実際に,$mu$-Transfer法によってほぼ最適な学習率が得られることを示す。
明らかな約束にもかかわらず、$mu$P メソッドはまだ広く採用されていない。
論文 参考訳(メタデータ) (2024-04-08T17:59:44Z) - Dynamic Pricing and Learning with Long-term Reference Effects [16.07344044662994]
本研究では,販売者が提示した過去の価格の基準価格が平均値となる,シンプルで斬新な参照価格メカニズムについて検討する。
このメカニズムの下では,モデルパラメータに関係なく,マークダウンポリシがほぼ最適であることを示す。
次に、需要モデルパラメータが不明な、より困難な動的価格と学習の問題について検討する。
論文 参考訳(メタデータ) (2024-02-19T21:36:54Z) - Scaling Laws Beyond Backpropagation [64.0476282000118]
因果デコーダのみの変換器を効率的に訓練するための直接フィードバックアライメントの有効性について検討した。
DFAはバックプロパゲーションよりも効率的なスケーリングを提供していないことが分かりました。
論文 参考訳(メタデータ) (2022-10-26T10:09:14Z) - Dynamic Pricing and Learning under the Bass Model [16.823029377470366]
マーケットサイズが$m$である場合、オーダー$tilde O(m2/3)$の確率後悔保証を満足するアルゴリズムを開発する。
多くの後悔の分析結果とは異なり、現在の問題では市場規模$m$が複雑さの基本的な要因である。
論文 参考訳(メタデータ) (2021-03-09T03:27:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。