Fugu-MT 論文翻訳(概要): Online Prompt Pricing based on Combinatorial Multi-Armed Bandit and Hierarchical Stackelberg Game

論文の概要: Online Prompt Pricing based on Combinatorial Multi-Armed Bandit and Hierarchical Stackelberg Game

arxiv url: http://arxiv.org/abs/2405.15154v2
Date: Fri, 31 May 2024 14:01:32 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-03 19:03:44.678447
Title: Online Prompt Pricing based on Combinatorial Multi-Armed Bandit and Hierarchical Stackelberg Game
Title（参考訳）: Combinatorial Multi-Armed Bandit and Hierarchical Stackelberg Game によるオンラインプロンプト価格設定
Authors: Meiling Li, Hongrun Ren, Haixu Xiong, Zhenxing Qian, Xinpeng Zhang,
Abstract要約: 当社の価格体系は、消費者、プラットフォーム、販売者の利益を考慮し、これら3人の参加者の利益満足度を同時に達成する。既存の固定価格モードとは異なり、我々が提案するPBTの価格メカニズムはより柔軟で多様なものであり、現実のシナリオのトランザクション要求に応じている。
参考スコア（独自算出の注目度）: 29.95198837731957
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Generation models have shown promising performance in various tasks, making trading around machine learning models possible. In this paper, we aim at a novel prompt trading scenario, prompt bundle trading (PBT) system, and propose an online pricing mechanism. Based on the combinatorial multi-armed bandit (CMAB) and three-stage hierarchical Stackelburg (HS) game, our pricing mechanism considers the profits of the consumer, platform, and seller, simultaneously achieving the profit satisfaction of these three participants. We break down the pricing issue into two steps, namely unknown category selection and incentive strategy optimization. The former step is to select a set of categories with the highest qualities, and the latter is to derive the optimal strategy for each participant based on the chosen categories. Unlike the existing fixed pricing mode, the PBT pricing mechanism we propose is more flexible and diverse, which is more in accord with the transaction needs of real-world scenarios. We test our method on a simulated text-to-image dataset. The experimental results demonstrate the effectiveness of our algorithm, which provides a feasible price-setting standard for the prompt marketplaces.
Abstract（参考訳）: 生成モデルは様々なタスクにおいて有望なパフォーマンスを示し、機械学習モデルに関するトレーディングを可能にする。本稿では,新しいプロンプト取引シナリオ,プロンプトバンドル取引(PBT)システム,オンライン価格設定機構を提案する。本稿では,CMAB(Multiar Multi-armed bandit)と3段階階層型Stackelburg(HS)ゲームに基づいて,消費者,プラットフォーム,販売者の利益を考慮し,これら3つの参加者の利益満足度を同時に達成する。価格問題を、未知のカテゴリ選択とインセンティブ戦略最適化の2つのステップに分類する。前者のステップは、最高の品質のカテゴリを選択することであり、後者は、選択されたカテゴリに基づいて、各参加者の最適な戦略を導出することである。既存の固定価格モードとは異なり、我々が提案するPBTの価格メカニズムはより柔軟で多様なものであり、現実のシナリオのトランザクション要求に応じている。シミュレーションされたテキストと画像のデータセット上で本手法をテストする。実験により,提案アルゴリズムの有効性が実証された。

関連論文リスト

How to Purchase Labels? A Cost-Effective Approach Using Active Learning Markets [2.7429630700600893]
ラベルの購入手段として,アクティブな学習市場を紹介し,分析する。これは、機能やサンプルを購入するためにすでに存在する多くの提案とは対照的である。本稿では,単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単
論文参考訳（メタデータ） (2025-11-25T18:34:33Z)
Multi-User Contextual Cascading Bandits for Personalized Recommendation [2.506355754272765]
Multi-User Contextual Cascading Banditモデルは、複数のユーザがシーケンシャルに表示されたアイテムと同時に対話するリアルなオンライン広告シナリオをキャプチャする。我々はまず,UCBBP(Upper Confidence Bound with Backward Planning)を提案する。この設定に適したUCBスタイルのアルゴリズムで,$widetildeO(sqrtTHN)$が$T$以上,セッションステップが$H$,コンテキストが$N$以上となることを証明している。多くのユーザが同時にシステムと対話するという事実に感銘を受けて、我々はActive Up Confidence Bound withという第2のアルゴリズムを導入しました。
論文参考訳（メタデータ） (2025-08-19T16:14:33Z)
Dynamic Assortment Selection and Pricing with Censored Preference Feedback [10.988222071035198]
本稿では,テキストセンタ型マルチノミアルロジット(C-MNL)選択モデルに基づく新しいフレームワークを提案する。売り手は価格で一連の商品を提示し、買い手は価格より高い価格で商品をフィルタリングし、残りの選択肢から少なくとも1つの商品を購入する。我々のアルゴリズムは $tildeO(dfrac32sqrtT/kappa)$ と $tildeO(d2sqrtT/kappa) の残差を実現する。
論文参考訳（メタデータ） (2025-04-03T06:56:08Z)
Learn then Decide: A Learning Approach for Designing Data Marketplaces [7.735168612333275]
最大競売価格(MAPP)機構を導入する。 MAPPはまずオークションを通じて入札者の価値分布を推定し、次に最適な上場価格を決定する。提案手法は,O_p(T-1/2(log T)2)$の平均的累積的後悔度を$O_p(T-1/2(log T)2)$で収束させることで,非回帰学習を実現する。
論文参考訳（メタデータ） (2025-03-13T18:07:30Z)
A Primal-Dual Online Learning Approach for Dynamic Pricing of Sequentially Displayed Complementary Items under Sale Constraints [54.46126953873298]
顧客に対して順次表示される補完アイテムの動的価格設定の問題に対処する。各項目の価格を個別に最適化するのは効果がないため、補完項目のコヒーレントな価格ポリシーが不可欠である。実世界のデータからランダムに生成した合成設定を用いて,我々のアプローチを実証的に評価し,制約違反や後悔の観点からその性能を比較した。
論文参考訳（メタデータ） (2024-07-08T09:55:31Z)
Fair Allocation in Dynamic Mechanism Design [57.66441610380448]
競売業者が各ラウンドの買い手グループに、合計で$T$で分けない商品を販売している問題を考える。競売人は、各グループの最低平均配分を保証する公正な制約に固執しつつ、割引された全体の収益を最大化することを目的としている。
論文参考訳（メタデータ） (2024-05-31T19:26:05Z)
Doubly High-Dimensional Contextual Bandits: An Interpretable Model for Joint Assortment-Pricing [24.80305303473745]
小売業を営む上での課題は、消費者に提示する商品の選択方法や、収益や利益を最大化する商品の価格設定方法だ。コンテクスト的帯域幅に基づくアソシエーションプライシングへの共同アプローチを提案する。我々は、バンディット方式による収益や利益の少なくとも3倍の増加と、学習された潜在因子モデルの解釈可能性を示す。
論文参考訳（メタデータ） (2023-09-14T00:45:36Z)
Anytime Model Selection in Linear Bandits [61.97047189786905]
ALEXPは,その後悔に対するM$への依存を指数関数的に改善した。提案手法は,オンライン学習と高次元統計学の新たな関連性を確立するために,ラッソの時間的一様解析を利用する。
論文参考訳（メタデータ） (2023-07-24T15:44:30Z)
UniMatch: A Unified User-Item Matching Framework for the Multi-purpose Merchant Marketing [27.459774494479227]
1つのモデルでアイテムレコメンデーションとユーザターゲティングを同時に行うために,統合されたユーザイテムマッチングフレームワークを提案する。我々のフレームワークは、最先端の手法と比較して大幅に性能が向上し、計算資源や日々のメンテナンスにかかるコストが大幅に削減された。
論文参考訳（メタデータ） (2023-07-19T13:49:35Z)
Price DOES Matter! Modeling Price and Interest Preferences in Session-based Recommendation [55.0391061198924]
セッションベースのレコメンデーションは、匿名ユーザが自分の短い行動シーケンスに基づいて購入したいアイテムを予測することを目的としている。セッションベースのレコメンデーションの価格設定を組み込むのは簡単ではない。セッションベースレコメンデーションのためのCoHHN(Co-guided Heterogeneous Hypergraph Network)を提案する。
論文参考訳（メタデータ） (2022-05-09T10:47:15Z)
Multiple Dynamic Pricing for Demand Response with Adaptive Clustering-based Customer Segmentation in Smart Grids [9.125875181760625]
本稿では,小売市場における需要応答に対する現実的なマルチダイナミックな価格設定手法を提案する。提案するフレームワークは,実世界のデータセットに基づくシミュレーションによって評価される。
論文参考訳（メタデータ） (2021-06-10T16:47:15Z)
Markdowns in E-Commerce Fresh Retail: A Counterfactual Prediction and Multi-Period Optimization Approach [29.11201102550876]
半パラメトリック構造モデルを構築し、価格の弾力性を学習し、対物需要を予測する。本稿では,有限販売地平線上での消耗品全体の利益を最大化するために,多周期動的価格アルゴリズムを提案する。提案されたフレームワークは、よく知られたeコマースの新鮮な小売シナリオであるFreshippoにうまくデプロイされている。
論文参考訳（メタデータ） (2021-05-18T07:01:37Z)
Price Suggestion for Online Second-hand Items with Texts and Images [39.669905951338684]
価格予測の目標は、売り手が中古品の有効かつ合理的な価格を設定するのを支援することだ。抽出された視覚的およびテキスト的特徴を入力として取るマルチモーダル価格提案システムを設計します。提案する価格提案システムを評価するための指標のセットを導出する。
論文参考訳（メタデータ） (2020-12-10T22:50:42Z)
Exploration in two-stage recommender systems [79.50534282841618]
2段階のレコメンデータシステムは、スケーラビリティと保守性のために業界で広く採用されている。このセットアップの鍵となる課題は、各ステージの最適性能が最適なグローバルパフォーマンスを暗示していないことである。そこで本研究では,ランクとノミネーター間の探索戦略を同期させる手法を提案する。
論文参考訳（メタデータ） (2020-09-01T16:52:51Z)
MoTiAC: Multi-Objective Actor-Critics for Real-Time Bidding [47.555870679348416]
そこで本研究では,MoTiACというマルチエクティブ・アクタ・クリティカルスアルゴリズムを提案する。従来のRLモデルとは異なり、提案されたMoTiACは複雑な入札環境で同時に多目的タスクを達成できる。
論文参考訳（メタデータ） (2020-02-18T07:16:39Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。