Fugu-MT 論文翻訳(概要): Non-Stationary Dynamic Pricing Via Actor-Critic Information-Directed Pricing

論文の概要: Non-Stationary Dynamic Pricing Via Actor-Critic Information-Directed Pricing

arxiv url: http://arxiv.org/abs/2208.09372v1
Date: Fri, 19 Aug 2022 14:37:37 GMT
ステータス: 翻訳完了
システム内更新日: 2022-08-22 16:53:41.595877
Title: Non-Stationary Dynamic Pricing Via Actor-Critic Information-Directed Pricing
Title（参考訳）: アクタクリティカル情報指向価格による非定常動的価格設定
Authors: Po-Yi Liu, Chi-Hua Wang, Heng-Hsui Tsai
Abstract要約: 提案したACIDPは、統計機械学習から情報指向サンプリング(IDS)アルゴリズムを拡張し、ミクロ経済選択理論を含む。これは、アッパー信頼境界 (UCB) やトンプソンサンプリング (TS) といった競合するバンディットアルゴリズムを、一連の市場環境シフトで上回っている。
参考スコア（独自算出の注目度）: 1.4180331276028662
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This paper presents a novel non-stationary dynamic pricing algorithm design, where pricing agents face incomplete demand information and market environment shifts. The agents run price experiments to learn about each product's demand curve and the profit-maximizing price, while being aware of market environment shifts to avoid high opportunity costs from offering sub-optimal prices. The proposed ACIDP extends information-directed sampling (IDS) algorithms from statistical machine learning to include microeconomic choice theory, with a novel pricing strategy auditing procedure to escape sub-optimal pricing after market environment shift. The proposed ACIDP outperforms competing bandit algorithms including Upper Confidence Bound (UCB) and Thompson sampling (TS) in a series of market environment shifts.
Abstract（参考訳）: 本稿では,不完全な需要情報や市場環境の変化に直面する非定常動的価格決定アルゴリズムを提案する。エージェントは、各製品の需要曲線と利益を最大化する価格について学ぶために価格実験を行い、市場環境の変化を認識しながら、最適以下の価格の提供から高い機会コストを回避する。提案したACIDPは,情報指向サンプリング(IDS)アルゴリズムを統計機械学習からマイクロエコノミクス選択理論まで拡張し,市場環境シフト後の準最適価格を回避するための新たな価格戦略監査手法を提案する。提案したACIDPは,アッパー信頼境界 (UCB) やトンプソンサンプリング (TS) など,一連の市場環境シフトにおいて競合する帯域幅アルゴリズムより優れている。

関連論文リスト

Cost-Optimal Active AI Model Evaluation [71.2069549142394]
生成AIシステムの開発には、継続的な評価、データ取得、アノテーションが必要である。我々は、安価だがしばしば不正確で弱いレーダの使用を積極的にバランスさせる新しいコスト認識手法を開発した。我々は、弱者と強者の間で所定のアノテーション予算を割り当てるためのコスト最適化政策のファミリーを導出する。
論文参考訳（メタデータ） (2025-06-09T17:14:41Z)
BAT: Benchmark for Auto-bidding Task [67.56067222427946]
本稿では,最も普及している2種類のオークション形式を含むオークションベンチマークを提案する。我々は,新しいデータセットに基づいて,一連の堅牢なベースラインを実装した。このベンチマークは、研究者や実践者が革新的なオートバイディングアルゴリズムを開発し、洗練するための、ユーザフレンドリで直感的なフレームワークを提供する。
論文参考訳（メタデータ） (2025-05-13T12:12:34Z)
Learn to Bid as a Price-Maker Wind Power Producer [2.249916681499244]
短期的な電力市場に参加する風力発電会社(WPP)は、非散布可能で変動的な生産のため、かなりの不均衡なコストに直面している。価格設定におけるWPP入札の最適化に文脈情報を活用するオンライン学習アルゴリズムを提案する。このアルゴリズムの性能は、ドイツの日頭市場とリアルタイム市場の数値シミュレーションを用いて、様々なベンチマーク戦略に対して評価される。
論文参考訳（メタデータ） (2025-03-20T12:51:37Z)
Transfer Learning for Nonparametric Contextual Dynamic Pricing [17.420508136662257]
動的価格戦略は、市場条件や顧客特性に基づいて価格を調整することで、企業が収益を最大化する上で不可欠である。この制限を克服するための有望なアプローチの1つは、関連する製品や市場からの情報を活用して、焦点となる価格決定を知らせることである。本稿では,ソースドメインからの事前収集データを効果的に活用し,対象ドメインの価格決定を効率化する,新しいTLDPアルゴリズムを提案する。
論文参考訳（メタデータ） (2025-01-31T01:05:04Z)
A Tale of Two Cities: Pessimism and Opportunism in Offline Dynamic Pricing [20.06425698412548]
本稿では,データカバレッジを前提としないオフライン動的価格について検討する。我々は、関連する価格が観測されていない需要パラメータに限定した部分的識別を確立する。提案した部分的識別枠組みに悲観的・機会論的戦略を取り入れて,推定方針を導出する。
論文参考訳（メタデータ） (2024-11-12T19:09:41Z)
A Primal-Dual Online Learning Approach for Dynamic Pricing of Sequentially Displayed Complementary Items under Sale Constraints [54.46126953873298]
顧客に対して順次表示される補完アイテムの動的価格設定の問題に対処する。各項目の価格を個別に最適化するのは効果がないため、補完項目のコヒーレントな価格ポリシーが不可欠である。実世界のデータからランダムに生成した合成設定を用いて,我々のアプローチを実証的に評価し,制約違反や後悔の観点からその性能を比較した。
論文参考訳（メタデータ） (2024-07-08T09:55:31Z)
By Fair Means or Foul: Quantifying Collusion in a Market Simulation with Deep Reinforcement Learning [1.5249435285717095]
本研究は、反復価格競争の実験的なオリゴポリーモデルを用いる。我々は,エージェントが開発する戦略と価格パターンについて検討し,その結果を導出する可能性がある。以上の結果から,RLをベースとしたAIエージェントは,超競争的価格帯電を特徴とする癒着状態に収束することが示唆された。
論文参考訳（メタデータ） (2024-06-04T15:35:08Z)
Model-Based Epistemic Variance of Values for Risk-Aware Policy Optimization [59.758009422067]
モデルベース強化学習における累積報酬に対する不確実性を定量化する問題を考察する。我々は、解が値の真後分散に収束する新しい不確実性ベルマン方程式(UBE)を提案する。本稿では,リスク・サーキングとリスク・アバース・ポリシー最適化のいずれにも適用可能な汎用ポリシー最適化アルゴリズムQ-Uncertainty Soft Actor-Critic (QU-SAC)を導入する。
論文参考訳（メタデータ） (2023-12-07T15:55:58Z)
Diffusion Variational Autoencoder for Tackling Stochasticity in Multi-Step Regression Stock Price Prediction [54.21695754082441]
長期的地平線上での多段階の株価予測は、ボラティリティの予測に不可欠である。多段階の株価予測に対する現在の解決策は、主に単一段階の分類に基づく予測のために設計されている。深層階層型変分オートコーダ(VAE)と拡散確率的手法を組み合わせてセック2seqの株価予測を行う。本モデルでは, 予測精度と分散性の観点から, 最先端の解よりも優れていることを示す。
論文参考訳（メタデータ） (2023-08-18T16:21:15Z)
Insurance pricing on price comparison websites via reinforcement learning [7.023335262537794]
本稿では,モデルベースとモデルフリーの手法を統合することで,最適価格政策を学習する強化学習フレームワークを提案する。また、オフラインデータセットを一貫した方法で価格ポリシーを評価することの重要性を強調した。
論文参考訳（メタデータ） (2023-08-14T04:44:56Z)
Structured Dynamic Pricing: Optimal Regret in a Global Shrinkage Model [50.06663781566795]
消費者の嗜好と価格感が時間とともに変化する動的モデルを考える。我々は,モデルパラメータの順序を事前に把握している透視者と比較して,収益損失が予想される,後悔による動的価格政策の性能を計測する。提案した政策の最適性を示すだけでなく,政策立案のためには,利用可能な構造情報を組み込むことが不可欠であることを示す。
論文参考訳（メタデータ） (2023-03-28T00:23:23Z)
Adaptive Risk-Aware Bidding with Budget Constraint in Display Advertising [47.14651340748015]
本稿では,強化学習による予算制約を考慮した適応型リスク対応入札アルゴリズムを提案する。リスク・アット・バリュー(VaR)に基づく不確実性とリスク傾向の本質的関係を理論的に明らかにする。
論文参考訳（メタデータ） (2022-12-06T18:50:09Z)
Multi-Asset Spot and Option Market Simulation [52.77024349608834]
正規化フローに基づく1つの基盤となる1つのマーケットシミュレータを現実的に構築する。本研究では, 正規化流れの条件付き可逆性を活用し, 独立シミュレータの連立分布をキャリブレーションするスケーラブルな手法を提案する。
論文参考訳（メタデータ） (2021-12-13T17:34:28Z)
Machine Learning-Driven Virtual Bidding with Electricity Market Efficiency Analysis [7.014324899009043]
本稿では,電力市場における仮想入札のための機械学習によるポートフォリオ最適化フレームワークを開発する。我々は,提案した仮想入札取引戦略を利用して,仮想入札ポートフォリオの収益性と米国の電力市場全体の効率性を評価する。
論文参考訳（メタデータ） (2021-04-06T19:30:39Z)
Online Regularization towards Always-Valid High-Dimensional Dynamic Pricing [19.11333865618553]
本稿では,動的価格ポリシーに基づくオンライン統計学習を理論的保証付きで設計するための新しい手法を提案する。提案手法は,提案する楽観的オンライン定期化最大価格(OORMLP)に3つの大きな利点がある。理論的には,提案したOORMLPアルゴリズムは高次元モデルの空間構造を利用し,決定の地平線における対数的後悔を保証する。
論文参考訳（メタデータ） (2020-07-05T23:52:09Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。