論文の概要: Causal-Aware Foundation-Model for Bilevel Optimization in Discrete Choice Settings
- arxiv url: http://arxiv.org/abs/2605.06941v1
- Date: Thu, 07 May 2026 20:55:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.623636
- Title: Causal-Aware Foundation-Model for Bilevel Optimization in Discrete Choice Settings
- Title(参考訳): 離散的選択設定における二レベル最適化のための因果認識基礎モデル
- Authors: Shivaram Subramanian, Zhengliang Xue, Markus Ettl, Yingdong Lu, Jayant Kalagnanam,
- Abstract要約: 本稿では,二段階決定問題を解決するために,制約付き三重項価格最適化(C3PO)ネットワークを提案する。
C3POは、価格の模倣学習、収益のマルチタスク学習、価格弾力性の文脈学習を統合する。
医療、テンダー価格、航空会社の補助価格など、現実のアプリケーションに最適な価格設定のためのチューニングされたファンデーションモデルをデプロイする。
- 参考スコア(独自算出の注目度): 5.508443859567532
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce a causal aware foundation-model framework for real time optimal decision making in discrete choice environments. We propose a constrained triple-head price optimization (C3PO) network to solve a bilevel decision problem in which a service provider selects an optimal assortment while heterogeneous users make personalized acceptance or rejection choices optimizing their own personalized preferences. C3PO integrates imitation learning of prices, multi-task learning of revenue responses, and in context learning of price elasticity to generate pricing recommendations while adhering to business constraints. During inference, frontier model prompting retrieves an enhanced elasticity prior for new products from behavioral economics literature, improving pricing effectiveness. We demonstrate strong in context learning performance using simulated, synthetic, and real-world datasets. C3PO is trained on simulated data generated from multiple classical discrete choice models in economics. The model is trained on data comprising simulated customer segments and counterfactual action and outcome pairs and evaluated on randomly generated choice environments with no access to the underlying preference structure. The trained model consistently improves the pricing KPIs, with gains increasing as customer price sensitivity increases. We also deploy the tuned foundation model for optimal pricing in real-world applications such as healthcare, tender pricing, airline ancillary pricing, and other domains, achieving substantial gains across multiple products, markets, and divisions.
- Abstract(参考訳): 個別選択環境におけるリアルタイム最適意思決定のための因果認識基盤モデルフレームワークを提案する。
サービス提供者が最適な選択肢を選択し、異種ユーザーがパーソナライズされた受理または拒否の選択肢を最適化し、個人化された好みを最適化する二段階決定問題を解決するために、制約付き三重項価格最適化(C3PO)ネットワークを提案する。
C3POは、価格の模倣学習、収益のマルチタスク学習、価格弾力性の文脈学習を統合し、ビジネス制約を順守しながら価格推奨を生成する。
推論中、フロンティアモデルプロンプトは行動経済学の文献から新製品に先立って弾力性が向上し、価格効率が向上する。
シミュレーション,合成,実世界のデータセットを用いて,文脈学習の性能を示す。
C3POは、経済学における複数の古典的離散選択モデルから生成されたシミュレーションデータに基づいて訓練される。
このモデルは、シミュレーションされた顧客セグメントとカウンターファクトアクションと結果ペアからなるデータに基づいて訓練され、基礎となる嗜好構造にアクセスせずにランダムに生成された選択環境上で評価される。
トレーニングされたモデルは、価格のKPIを継続的に改善し、顧客価格の感度が上昇するにつれて上昇する。
また、医療、テンダー価格、航空会社の補助価格などの現実世界のアプリケーションにおける最適な価格設定のための調整されたファンデーションモデルも展開し、複数の製品、市場、部門でかなりの利益を上げています。
関連論文リスト
- Monodense Deep Neural Model for Determining Item Price Elasticity [0.013434289790264115]
商品価格の弾力性は、商品価格の変化に対する消費者需要の応答性の定量化に使用される。
本稿では, 処理制御が不要な場合に機能する新しい弾力性推定フレームワークを提案する。
我々は、新たに提案したMonodenseディープニューラルネットワークを含む、以下に挙げた機械学習ベースのアルゴリズムを用いて、このフレームワークをテストする。
論文 参考訳(メタデータ) (2026-03-31T04:50:51Z) - Bayesian Optimization for Dynamic Pricing and Learning [0.306238659426286]
ダイナミックな価格設定は、市場の需要に応じて企業の収益を最大化するために製品の販売価格を調整するプラクティスである。
従来の手法では需要関数の特定のパラメトリック形式を前提としており、強化学習(RL)を用いて最適に近い価格戦略を特定できる。
本稿では,制約付きモデリング仮定を避けるために,動的価格に対する非パラメトリックなアプローチを提案する。
論文 参考訳(メタデータ) (2025-10-14T12:28:06Z) - Client-Centric Federated Adaptive Optimization [78.30827455292827]
Federated Learning(FL)は、クライアントが独自のデータをプライベートに保ちながら、協調的にモデルをトレーニングする分散学習パラダイムである。
本稿では,新しいフェデレーション最適化手法のクラスであるフェデレーション中心適応最適化を提案する。
論文 参考訳(メタデータ) (2025-01-17T04:00:50Z) - GAS: Generative Auto-bidding with Post-training Search [26.229396732360787]
本稿では,GASと呼ばれるポストトレーニング後検索を用いたフレキシブルで実用的な自動入札方式を提案し,基本方針モデルの出力を改良する。
実世界のデータセットとKuaishou広告プラットフォーム上でのオンラインA/Bテストによる実験は、GASの有効性を実証している。
論文 参考訳(メタデータ) (2024-12-22T13:47:46Z) - Self-Steering Optimization: Autonomous Preference Optimization for Large Language Models [79.84205827056907]
本稿では,高品質な嗜好データを自律的に生成するアルゴリズムであるセルフステアリング最適化(SSO$)を提案する。
$SSO$は、ポリシーモデル自体からデータジェネレータを構築するために、特別な最適化目標を採用しています。
評価の結果,$SSO$は人選好アライメントと報酬最適化のベースラインを一貫して上回っていることがわかった。
論文 参考訳(メタデータ) (2024-10-22T16:04:03Z) - A Primal-Dual Online Learning Approach for Dynamic Pricing of Sequentially Displayed Complementary Items under Sale Constraints [54.46126953873298]
顧客に対して順次表示される補完アイテムの動的価格設定の問題に対処する。
各項目の価格を個別に最適化するのは効果がないため、補完項目のコヒーレントな価格ポリシーが不可欠である。
実世界のデータからランダムに生成した合成設定を用いて,我々のアプローチを実証的に評価し,制約違反や後悔の観点からその性能を比較した。
論文 参考訳(メタデータ) (2024-07-08T09:55:31Z) - LMaaS: Exploring Pricing Strategy of Large Model as a Service for
Communication [11.337245234301857]
有料サービスモードは、LM(Large Model as a Service)と呼ばれるこの文脈に適していると我々は主張する。
本稿では,顧客の将来的なレンタル決定を推論することで,大規模モデルの価格を反復的に最適化する反復モデル価格(IMP)アルゴリズムを提案する。
第2ステップでは、ロバストな選択とレンタルのアルゴリズムを設計することで、顧客の選択決定を最適化する。
論文 参考訳(メタデータ) (2024-01-05T07:19:19Z) - Benchmarking PtO and PnO Methods in the Predictive Combinatorial Optimization Regime [59.27851754647913]
予測最適化(英: Predictive optimization)は、エネルギーコストを意識したスケジューリングや広告予算配分など、多くの現実世界のアプリケーションの正確なモデリングである。
我々は,広告のための新しい産業データセットを含む8つの問題に対して,既存のPtO/PnOメソッド11をベンチマークするモジュラーフレームワークを開発した。
本研究は,8ベンチマーク中7ベンチマークにおいて,PnOアプローチがPtOよりも優れていることを示すが,PnOの設計選択に銀の弾丸は見つからない。
論文 参考訳(メタデータ) (2023-11-13T13:19:34Z) - Structured Dynamic Pricing: Optimal Regret in a Global Shrinkage Model [50.06663781566795]
消費者の嗜好と価格感が時間とともに変化する動的モデルを考える。
我々は,モデルパラメータの順序を事前に把握している透視者と比較して,収益損失が予想される,後悔による動的価格政策の性能を計測する。
提案した政策の最適性を示すだけでなく,政策立案のためには,利用可能な構造情報を組み込むことが不可欠であることを示す。
論文 参考訳(メタデータ) (2023-03-28T00:23:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。