論文の概要: Online Learning for Equilibrium Pricing in Markets under Incomplete Information
- arxiv url: http://arxiv.org/abs/2303.11522v3
- Date: Mon, 16 Jun 2025 01:05:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-17 17:28:44.299587
- Title: Online Learning for Equilibrium Pricing in Markets under Incomplete Information
- Title(参考訳): 不完全情報に基づく市場における平衡価格のオンライン学習
- Authors: Devansh Jalota, Haoyuan Sun, Navid Azizan,
- Abstract要約: 不完全な情報設定において、均衡価格をT$の地平線上で学習する問題を考察する。
我々は、顧客需要が一定であれば$O(1)$、需要が時間とともに変化する場合は$O(sqrtT)$の後悔を同時に達成するアルゴリズムを開発する。
- 参考スコア(独自算出の注目度): 8.145115843220308
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The computation of equilibrium prices at which the supply of goods matches their demand typically relies on complete information on agents' private attributes, e.g., suppliers' cost functions, which are often unavailable in practice. Motivated by this practical consideration, we consider the problem of learning equilibrium prices over a horizon of $T$ periods in the incomplete information setting wherein a market operator seeks to satisfy the customer demand for a commodity by purchasing it from competing suppliers with cost functions unknown to the operator. We first consider the setting when suppliers' cost functions are fixed and develop algorithms that, on three pertinent regret metrics, simultaneously achieve a regret of $O(1)$ when the customer demand is constant over time, and $O(\sqrt{T})$ when the demand varies over time. In the setting when the suppliers' cost functions vary over time, we demonstrate that, in general, no online algorithm can achieve sublinear regret on all three metrics. Thus, we consider an augmented setting wherein the operator has access to hints/contexts that reflect the variation in the cost functions and propose an algorithm with sublinear regret in this augmented setting. Finally, we present numerical experiments that validate our results and discuss various model extensions.
- Abstract(参考訳): 商品の供給が彼らの需要に合致する均衡価格の計算は、通常、エージェントの私的属性(例えば、サプライヤーのコスト関数)に関する完全な情報に依存するが、実際には利用できないことが多い。
この実践的考察により、市場運営者が商品の顧客需要を満足させようとする不完全な情報設定において、競争相手の価格機能不明のサプライヤーから購入した不完全な情報設定において、均衡価格をT$の地平線上で学習する問題を考察する。
まず、サプライヤのコスト関数が固定されたときの設定について検討し、関連する3つの後悔指標に基づいて、顧客需要が一定であれば$O(1)$、需要が時間とともに変化する場合は$O(\sqrt{T})$の後悔を同時に達成するアルゴリズムを開発する。
供給者のコスト関数が時間とともに変化する場合、オンラインアルゴリズムが3つの指標すべてに対してサブ線形後悔を達成できないことを実証する。
そこで,本稿では,コスト関数の変動を反映したヒント/コンテキストにアクセス可能な拡張設定を検討し,この拡張設定においてサブ線形後悔を伴うアルゴリズムを提案する。
最後に,実験結果を検証する数値実験を行い,様々なモデル拡張について考察する。
関連論文リスト
- Optimal Nonlinear Online Learning under Sequential Price Competition via s-Concavity [24.586053819490985]
われわれは、複数の売り手の間での価格競争をT$の期間で検討している。
売り手は価格を同時に提供し、それぞれの需要を競合相手に見つからないように監視する。
すべての売り手が当社の政策を採用すると、その価格がナッシュ均衡価格に対して$O(T-1/7)のレートで収束し、もし売り手が十分に情報を得たらリーチできることが示される。
論文 参考訳(メタデータ) (2025-03-20T22:51:03Z) - Dynamic Pricing with Adversarially-Censored Demands [25.566323930646178]
我々は,各時点における潜在需要が$t=1,2,ldots,T$であり,価格に依存するオンライン動的価格問題について検討する。
一度に$t$が課せられ、在庫水準を超えた場合の潜在的な需要を検閲する。
本アルゴリズムは,逆在庫級数であっても,$tildeO(sqrtT)$Optimative regretを達成できることを示す。
論文 参考訳(メタデータ) (2025-02-10T05:37:39Z) - Leveraging Microservices Architecture for Dynamic Pricing in the Travel Industry: Algorithms, Scalability, and Impact on Revenue and Customer Satisfaction [1.03590082373586]
本研究では,旅行分野を対象としたリアルタイム動的価格体系の実装について検討する。
このシステムは、需要、競合価格、その他の外部状況などの要因をリアルタイムに解決するように設計されている。
コントロールされたシミュレーションと実生活のアプリケーションの両方で、収益生成が22%、価格応答時間が17%改善した。
論文 参考訳(メタデータ) (2024-11-03T17:24:02Z) - MetaTrading: An Immersion-Aware Model Trading Framework for Vehicular Metaverse Services [94.61039892220037]
我々は、フェデレーション学習(FL)によるプライバシーを確保しつつ、サービスのデータ提供を容易にする没入型モデルトレーディングフレームワークを提案する。
我々は,資源制約下での高価値モデルに貢献するために,メタバースユーザ(MU)にインセンティブを与えるインセンティブ機構を設計する。
我々は、MUやその他のMSPに関するプライベート情報にアクセスすることなく、深層強化学習に基づく完全に分散された動的報酬アルゴリズムを開発する。
論文 参考訳(メタデータ) (2024-10-25T16:20:46Z) - A Primal-Dual Online Learning Approach for Dynamic Pricing of Sequentially Displayed Complementary Items under Sale Constraints [54.46126953873298]
顧客に対して順次表示される補完アイテムの動的価格設定の問題に対処する。
各項目の価格を個別に最適化するのは効果がないため、補完項目のコヒーレントな価格ポリシーが不可欠である。
実世界のデータからランダムに生成した合成設定を用いて,我々のアプローチを実証的に評価し,制約違反や後悔の観点からその性能を比較した。
論文 参考訳(メタデータ) (2024-07-08T09:55:31Z) - Contractual Reinforcement Learning: Pulling Arms with Invisible Hands [68.77645200579181]
本稿では,契約設計によるオンライン学習問題において,利害関係者の経済的利益を整合させる理論的枠組みを提案する。
計画問題に対して、遠目エージェントに対する最適契約を決定するための効率的な動的プログラミングアルゴリズムを設計する。
学習問題に対して,契約の堅牢な設計から探索と搾取のバランスに至るまでの課題を解き放つために,非回帰学習アルゴリズムの汎用設計を導入する。
論文 参考訳(メタデータ) (2024-07-01T16:53:00Z) - Language Models Can Reduce Asymmetry in Information Markets [100.38786498942702]
我々は、言語モデルを利用した知的エージェントが外部参加者に代わって情報を売買する、オープンソースのシミュレートされたデジタルマーケットプレースを紹介した。
このマーケットプレースを実現する中心的なメカニズムはエージェントの二重機能であり、特権情報の品質を評価する能力を持つと同時に、忘れる能力も備えている。
適切に行動するためには、エージェントは合理的な判断をし、生成されたサブクエリを通じて市場を戦略的に探索し、購入した情報から回答を合成する必要がある。
論文 参考訳(メタデータ) (2024-03-21T14:48:37Z) - Online Learning under Budget and ROI Constraints via Weak Adaptivity [57.097119428915796]
制約付きオンライン学習問題に対する既存の原始双対アルゴリズムは、2つの基本的な仮定に依存している。
このような仮定は、標準の原始双対テンプレートを弱適応的後悔最小化器で与えることによって、どのように回避できるのかを示す。
上記の2つの前提が満たされていない場合に保証される、世界の最高の保証を証明します。
論文 参考訳(メタデータ) (2023-02-02T16:30:33Z) - Learning to Price Supply Chain Contracts against a Learning Retailer [3.7814216736076434]
データ駆動型サプライヤが直面するサプライチェーン契約設計問題について検討する。
サプライヤーも小売業者も市場の需要について不透明だ。
これらすべてのケースにおいて、私たちの価格ポリシーがサブリニアな後悔の限界につながることが示されています。
論文 参考訳(メタデータ) (2022-11-02T04:00:47Z) - KnowGraph-PM: a Knowledge Graph based Pricing Model for Semiconductors
Supply Chains [0.0]
KnowGraph-PMは知識グラフベースの動的価格モデルである。
価格変動は顧客との対立を引き起こす可能性がある。
セマンティックデータの統合によって、顧客に適した収益管理が可能になることを実証する。
論文 参考訳(メタデータ) (2022-05-13T10:34:57Z) - Stochastic Online Fisher Markets: Static Pricing Limits and Adaptive Enhancements [3.2732273647357437]
我々は、民間で知られたユーティリティーと予算パラメーターを持つユーザが順次到着する、オンライン型のフィッシャーマーケットについて研究する。
この設定では,まず静的な価格設定アルゴリズムの限界について検討し,全ユーザに対して均一な価格設定を行う。
我々は,ユーザの予算とユーティリティパラメータの分布を熟知した適応型ポストプライシングアルゴリズムを設計し,ユーザ消費の過去の観測に基づいて価格を調整した。
論文 参考訳(メタデータ) (2022-04-27T05:03:45Z) - Inducing Equilibria via Incentives: Simultaneous Design-and-Play Finds
Global Optima [114.31577038081026]
本稿では,デザイナーとエージェントの問題を同時に1ループで解くための効率的な手法を提案する。
設計者は平衡問題を何度も解決しないが、エージェントに対するインセンティブの全体的な影響を予測できる。
このアルゴリズムは,幅広い種類のゲームに対して,サブ線形速度で大域的最適値に収束することを示す。
論文 参考訳(メタデータ) (2021-10-04T06:53:59Z) - VCG Mechanism Design with Unknown Agent Values under Stochastic Bandit
Feedback [104.06766271716774]
本研究では,エージェントが自己の価値を知らない場合に,マルチラウンドの福祉最大化機構設計問題について検討する。
まず、福祉に対する後悔の3つの概念、各エージェントの個々のユーティリティ、メカニズムの3つの概念を定義します。
当社のフレームワークは価格体系を柔軟に制御し、エージェントと販売者の後悔のトレードオフを可能にする。
論文 参考訳(メタデータ) (2020-04-19T18:00:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。