論文の概要: Nonparametric Learning and Earning with One-Point Feedback under Nonstationarity
- arxiv url: http://arxiv.org/abs/2605.21263v1
- Date: Wed, 20 May 2026 14:52:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.73755
- Title: Nonparametric Learning and Earning with One-Point Feedback under Nonstationarity
- Title(参考訳): 非定常条件下での一点フィードバックを用いた非パラメトリック学習と聴取
- Authors: Xiangyu Yang, Feng Xu, Jian-Qiang Hu, Jiaqiao Hu,
- Abstract要約: 本研究では,一定期間に1回の観測から構築した収益ベース勾配近似を用いて価格を更新する学習フレームワークを開発する。
提案手法の性能保証を行い, 市場変動の大きさと時間的地平線に依存していることを示す。
- 参考スコア(独自算出の注目度): 8.48495542754409
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Firms increasingly rely on dynamic pricing to respond to evolving customer demand, yet in many applications they observe only the revenue generated by a single posted price in each period. At the same time, market conditions may shift gradually or abruptly due to changes in customer preferences, competition, or external shocks. These features create two intertwined challenges: learning the revenue--demand relationship from limited feedback and adapting pricing decisions to a changing environment. We study how a seller can learn and earn effectively under these constraints, without assuming a specific parametric form for demand. We develop a learning framework that updates prices using revenue-based gradient approximations constructed from one observation per period. To address environmental changes, we incorporate a restarting mechanism that periodically refreshes the learning process so that outdated information is discounted. When the degree of nonstationarity is unknown, we further introduce a meta-learning layer to adaptively hedge across multiple restarting schedules. We provide performance guarantees for our approach, showing how cumulative revenue loss relative to a fully informed benchmark depends on both the time horizon and the magnitude of market variation. Simulation experiments using synthetic and real-world data illustrate the effectiveness of the proposed procedures.
- Abstract(参考訳): 企業は顧客需要の進展に対応するために動的価格にますます依存しているが、多くのアプリケーションでは、各期間に投稿された1つの価格によって生成される収益のみを観察している。
同時に、市場の状況は、顧客の好みや競争、外部ショックの変化により、徐々に、あるいは突然に変化する可能性がある。
これらの機能は、限られたフィードバックから収益-需要関係を学習し、価格決定を変化する環境に適応する、という2つの相反する課題を生み出します。
需要に対して特定のパラメトリック形式を仮定することなく、これらの制約の下で販売者がどのように学習し、効果的に稼げるかを考察する。
本研究では,一定期間に1回の観測から構築した収益ベース勾配近似を用いて価格を更新する学習フレームワークを開発する。
環境変化に対処するため,学習過程を定期的にリフレッシュし,時代遅れの情報を割引する再起動機構を組み込んだ。
非定常性の度合いが不明な場合には、複数の再起動スケジュールを適応的にヘッジするメタラーニング層を導入する。
提案手法の性能保証を行い, 市場変動の大きさと時間的地平線に依存していることを示す。
合成および実世界のデータを用いたシミュレーション実験は,提案手法の有効性を示す。
関連論文リスト
- From Confounding to Learning: Dynamic Service Fee Pricing on Third-Party Platforms [16.56794300689239]
戦略エージェントに直面するサードパーティプラットフォームの価格変動について検討する。
我々は,$TildecO(sqrtTwedge_S-2)$を最適に後悔するアルゴリズムを開発した。
論文 参考訳(メタデータ) (2025-12-28T02:41:36Z) - Leveraging Microservices Architecture for Dynamic Pricing in the Travel Industry: Algorithms, Scalability, and Impact on Revenue and Customer Satisfaction [1.03590082373586]
本研究では,旅行分野を対象としたリアルタイム動的価格体系の実装について検討する。
このシステムは、需要、競合価格、その他の外部状況などの要因をリアルタイムに解決するように設計されている。
コントロールされたシミュレーションと実生活のアプリケーションの両方で、収益生成が22%、価格応答時間が17%改善した。
論文 参考訳(メタデータ) (2024-11-03T17:24:02Z) - A Primal-Dual Online Learning Approach for Dynamic Pricing of Sequentially Displayed Complementary Items under Sale Constraints [54.46126953873298]
顧客に対して順次表示される補完アイテムの動的価格設定の問題に対処する。
各項目の価格を個別に最適化するのは効果がないため、補完項目のコヒーレントな価格ポリシーが不可欠である。
実世界のデータからランダムに生成した合成設定を用いて,我々のアプローチを実証的に評価し,制約違反や後悔の観点からその性能を比較した。
論文 参考訳(メタデータ) (2024-07-08T09:55:31Z) - Incremental Profit per Conversion: a Response Transformation for Uplift
Modeling in E-Commerce Promotions [1.7640556247739623]
本稿では,購入時にのみ費用が発生する応答依存コストによるプロモーションに焦点を当てた。
既存のアップリフトモデルアプローチでは、メタラーナーのような複数のモデルをトレーニングする必要がしばしばあります。
本稿では, ユニット・エコノミクスにおける促進キャンペーンの効率を向上する新たな指標であるIncrmental Profit per Conversion(IPC)を紹介する。
論文 参考訳(メタデータ) (2023-06-23T19:46:02Z) - Resilient Constrained Learning [94.27081585149836]
本稿では,学習課題を同時に解決しながら,要求に適応する制約付き学習手法を提案する。
我々はこの手法を、その操作を変更することで破壊に適応する生態システムを記述する用語に因んで、レジリエントな制約付き学習と呼ぶ。
論文 参考訳(メタデータ) (2023-06-04T18:14:18Z) - Structured Dynamic Pricing: Optimal Regret in a Global Shrinkage Model [50.06663781566795]
消費者の嗜好と価格感が時間とともに変化する動的モデルを考える。
我々は,モデルパラメータの順序を事前に把握している透視者と比較して,収益損失が予想される,後悔による動的価格政策の性能を計測する。
提案した政策の最適性を示すだけでなく,政策立案のためには,利用可能な構造情報を組み込むことが不可欠であることを示す。
論文 参考訳(メタデータ) (2023-03-28T00:23:23Z) - When Do Curricula Work in Federated Learning? [56.88941905240137]
カリキュラム学習は非IID性を大幅に軽減する。
クライアント間でデータ配布を多様化すればするほど、学習の恩恵を受けるようになる。
本稿では,クライアントの現実的格差を生かした新しいクライアント選択手法を提案する。
論文 参考訳(メタデータ) (2022-12-24T11:02:35Z) - Model Distillation for Revenue Optimization: Interpretable Personalized
Pricing [8.07517029746865]
我々は、複雑なブラックボックス機械学習アルゴリズムから知識を抽出する、カスタマイズされた、規範的なツリーベースアルゴリズムを提案する。
同様のバリュエーションで顧客を分割し、解釈可能性を維持しながら収益を最大化するような価格を定めている。
論文 参考訳(メタデータ) (2020-07-03T18:33:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。