論文の概要: Online Prompt Pricing based on Combinatorial Multi-Armed Bandit and Hierarchical Stackelberg Game
- arxiv url: http://arxiv.org/abs/2405.15154v1
- Date: Fri, 24 May 2024 02:13:46 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-27 18:28:28.259264
- Title: Online Prompt Pricing based on Combinatorial Multi-Armed Bandit and Hierarchical Stackelberg Game
- Title(参考訳): Combinatorial Multi-Armed Bandit and Hierarchical Stackelberg Game によるオンラインプロンプト価格設定
- Authors: Meiling Li, Hongrun Ren, Haixu Xiong, Zhenxing Qian, Xinpeng Zhang,
- Abstract要約: 当社の価格体系は、消費者、プラットフォーム、販売者の利益を考慮し、これら3人の参加者の利益満足度を同時に達成する。
既存の固定価格モードとは異なり、我々が提案するPBTの価格メカニズムはより柔軟で多様なものであり、現実のシナリオのトランザクション要求に応じている。
- 参考スコア(独自算出の注目度): 29.95198837731957
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generation models have shown promising performance in various tasks, making trading around machine learning models possible. In this paper, we aim at a novel prompt trading scenario, prompt bundle trading (PBT) system, and propose an online pricing mechanism. Based on the combinatorial multi-armed bandit (CMAB) and three-stage hierarchical Stackelburg (HS) game, our pricing mechanism considers the profits of the consumer, platform, and seller, simultaneously achieving the profit satisfaction of these three participants. We break down the pricing issue into two steps, namely unknown category selection and incentive strategy optimization. The former step is to select a set of categories with the highest qualities, and the latter is to derive the optimal strategy for each participant based on the chosen categories. Unlike the existing fixed pricing mode, the PBT pricing mechanism we propose is more flexible and diverse, which is more in accord with the transaction needs of real-world scenarios. We test our method on a simulated text-to-image dataset. The experimental results demonstrate the effectiveness of our algorithm, which provides a feasible price-setting standard for the prompt marketplaces.
- Abstract(参考訳): 生成モデルは様々なタスクにおいて有望なパフォーマンスを示し、機械学習モデルに関するトレーディングを可能にする。
本稿では,新しいプロンプト取引シナリオ,プロンプトバンドル取引(PBT)システム,オンライン価格設定機構を提案する。
本稿では,CMAB(Multiar Multi-armed bandit)と3段階階層型Stackelburg(HS)ゲームに基づいて,消費者,プラットフォーム,販売者の利益を考慮し,これら3つの参加者の利益満足度を同時に達成する。
価格問題を、未知のカテゴリ選択とインセンティブ戦略最適化の2つのステップに分類する。
前者のステップは、最高の品質のカテゴリを選択することであり、後者は、選択されたカテゴリに基づいて、各参加者の最適な戦略を導出することである。
既存の固定価格モードとは異なり、我々が提案するPBTの価格メカニズムはより柔軟で多様なものであり、現実のシナリオのトランザクション要求に応じている。
シミュレーションされたテキストと画像のデータセット上で本手法をテストする。
実験により,提案アルゴリズムの有効性が実証された。
関連論文リスト
- A Primal-Dual Online Learning Approach for Dynamic Pricing of Sequentially Displayed Complementary Items under Sale Constraints [54.46126953873298]
顧客に対して順次表示される補完アイテムの動的価格設定の問題に対処する。
各項目の価格を個別に最適化するのは効果がないため、補完項目のコヒーレントな価格ポリシーが不可欠である。
実世界のデータからランダムに生成した合成設定を用いて,我々のアプローチを実証的に評価し,制約違反や後悔の観点からその性能を比較した。
論文 参考訳(メタデータ) (2024-07-08T09:55:31Z) - Fair Allocation in Dynamic Mechanism Design [57.66441610380448]
競売業者が各ラウンドの買い手グループに、合計で$T$で分けない商品を販売している問題を考える。
競売人は、各グループの最低平均配分を保証する公正な制約に固執しつつ、割引された全体の収益を最大化することを目的としている。
論文 参考訳(メタデータ) (2024-05-31T19:26:05Z) - Doubly High-Dimensional Contextual Bandits: An Interpretable Model for
Joint Assortment-Pricing [24.80305303473745]
小売業を営む上での課題は、消費者に提示する商品の選択方法や、収益や利益を最大化する商品の価格設定方法だ。
コンテクスト的帯域幅に基づくアソシエーションプライシングへの共同アプローチを提案する。
我々は、バンディット方式による収益や利益の少なくとも3倍の増加と、学習された潜在因子モデルの解釈可能性を示す。
論文 参考訳(メタデータ) (2023-09-14T00:45:36Z) - Anytime Model Selection in Linear Bandits [61.97047189786905]
ALEXPは,その後悔に対するM$への依存を指数関数的に改善した。
提案手法は,オンライン学習と高次元統計学の新たな関連性を確立するために,ラッソの時間的一様解析を利用する。
論文 参考訳(メタデータ) (2023-07-24T15:44:30Z) - UniMatch: A Unified User-Item Matching Framework for the Multi-purpose
Merchant Marketing [27.459774494479227]
1つのモデルでアイテムレコメンデーションとユーザターゲティングを同時に行うために,統合されたユーザイテムマッチングフレームワークを提案する。
我々のフレームワークは、最先端の手法と比較して大幅に性能が向上し、計算資源や日々のメンテナンスにかかるコストが大幅に削減された。
論文 参考訳(メタデータ) (2023-07-19T13:49:35Z) - Price DOES Matter! Modeling Price and Interest Preferences in
Session-based Recommendation [55.0391061198924]
セッションベースのレコメンデーションは、匿名ユーザが自分の短い行動シーケンスに基づいて購入したいアイテムを予測することを目的としている。
セッションベースのレコメンデーションの価格設定を組み込むのは簡単ではない。
セッションベースレコメンデーションのためのCoHHN(Co-guided Heterogeneous Hypergraph Network)を提案する。
論文 参考訳(メタデータ) (2022-05-09T10:47:15Z) - Multiple Dynamic Pricing for Demand Response with Adaptive
Clustering-based Customer Segmentation in Smart Grids [9.125875181760625]
本稿では,小売市場における需要応答に対する現実的なマルチダイナミックな価格設定手法を提案する。
提案するフレームワークは,実世界のデータセットに基づくシミュレーションによって評価される。
論文 参考訳(メタデータ) (2021-06-10T16:47:15Z) - Markdowns in E-Commerce Fresh Retail: A Counterfactual Prediction and
Multi-Period Optimization Approach [29.11201102550876]
半パラメトリック構造モデルを構築し、価格の弾力性を学習し、対物需要を予測する。
本稿では,有限販売地平線上での消耗品全体の利益を最大化するために,多周期動的価格アルゴリズムを提案する。
提案されたフレームワークは、よく知られたeコマースの新鮮な小売シナリオであるFreshippoにうまくデプロイされている。
論文 参考訳(メタデータ) (2021-05-18T07:01:37Z) - Price Suggestion for Online Second-hand Items with Texts and Images [39.669905951338684]
価格予測の目標は、売り手が中古品の有効かつ合理的な価格を設定するのを支援することだ。
抽出された視覚的およびテキスト的特徴を入力として取るマルチモーダル価格提案システムを設計します。
提案する価格提案システムを評価するための指標のセットを導出する。
論文 参考訳(メタデータ) (2020-12-10T22:50:42Z) - Exploration in two-stage recommender systems [79.50534282841618]
2段階のレコメンデータシステムは、スケーラビリティと保守性のために業界で広く採用されている。
このセットアップの鍵となる課題は、各ステージの最適性能が最適なグローバルパフォーマンスを暗示していないことである。
そこで本研究では,ランクとノミネーター間の探索戦略を同期させる手法を提案する。
論文 参考訳(メタデータ) (2020-09-01T16:52:51Z) - MoTiAC: Multi-Objective Actor-Critics for Real-Time Bidding [47.555870679348416]
そこで本研究では,MoTiACというマルチエクティブ・アクタ・クリティカルスアルゴリズムを提案する。
従来のRLモデルとは異なり、提案されたMoTiACは複雑な入札環境で同時に多目的タスクを達成できる。
論文 参考訳(メタデータ) (2020-02-18T07:16:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。