論文の概要: LMaaS: Exploring Pricing Strategy of Large Model as a Service for
Communication
- arxiv url: http://arxiv.org/abs/2401.02675v1
- Date: Fri, 5 Jan 2024 07:19:19 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-08 15:45:43.845928
- Title: LMaaS: Exploring Pricing Strategy of Large Model as a Service for
Communication
- Title(参考訳): LMaaS: 通信サービスとしての大規模モデルの価格戦略を探る
- Authors: Panlong Wu, Qi Liu, Yanjie Dong, Fangxin Wang
- Abstract要約: 有料サービスモードは、LM(Large Model as a Service)と呼ばれるこの文脈に適していると我々は主張する。
本稿では,顧客の将来的なレンタル決定を推論することで,大規模モデルの価格を反復的に最適化する反復モデル価格(IMP)アルゴリズムを提案する。
第2ステップでは、ロバストな選択とレンタルのアルゴリズムを設計することで、顧客の選択決定を最適化する。
- 参考スコア(独自算出の注目度): 11.337245234301857
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The next generation of communication is envisioned to be intelligent
communication, that can replace traditional symbolic communication, where
highly condensed semantic information considering both source and channel will
be extracted and transmitted with high efficiency. The recent popular large
models such as GPT4 and the boosting learning techniques lay a solid foundation
for the intelligent communication, and prompt the practical deployment of it in
the near future. Given the characteristics of "training once and widely use" of
those multimodal large language models, we argue that a pay-as-you-go service
mode will be suitable in this context, referred to as Large Model as a Service
(LMaaS). However, the trading and pricing problem is quite complex with
heterogeneous and dynamic customer environments, making the pricing
optimization problem challenging in seeking on-hand solutions. In this paper,
we aim to fill this gap and formulate the LMaaS market trading as a Stackelberg
game with two steps. In the first step, we optimize the seller's pricing
decision and propose an Iterative Model Pricing (IMP) algorithm that optimizes
the prices of large models iteratively by reasoning customers' future rental
decisions, which is able to achieve a near-optimal pricing solution. In the
second step, we optimize customers' selection decisions by designing a robust
selecting and renting (RSR) algorithm, which is guaranteed to be optimal with
rigorous theoretical proof. Extensive experiments confirm the effectiveness and
robustness of our algorithms.
- Abstract(参考訳): 次世代のコミュニケーションはインテリジェントなコミュニケーションであり、従来の象徴的コミュニケーションを置き換えることが可能であり、ソースとチャネルの両方を考慮した高度に凝縮された意味情報を抽出し、高効率で伝達する。
GPT4や強化学習技術といった最近の人気の高い大規模モデルは、インテリジェントなコミュニケーションの基礎を築き、近い将来その実践的な展開を促す。
このようなマルチモーダルな大規模言語モデルの「一度にトレーニングし、広く活用する」という特性を考えると、従量制のサービスモードは、この文脈では、LMaaS(Large Model as a Service)と呼ばれるのに適していると論じる。
しかし、トレーディングと価格問題は、異質で動的な顧客環境と非常に複雑であり、価格最適化の問題は、オンハンドソリューションを求める上で困難である。
本稿では,このギャップを埋め,lmaas市場取引を2つのステップでスタックルバーグゲームとして定式化することを目的とする。
最初のステップでは、販売者の価格決定を最適化し、顧客の将来的なレンタル決定を推論することで、大規模モデルの価格を反復的に最適化する反復モデル価格決定(IMP)アルゴリズムを提案する。
第2のステップでは、厳密な理論的証明で最適であることが保証されるロバストな選択とレンタル(RSR)アルゴリズムを設計することで、顧客の選択決定を最適化する。
広範な実験により,アルゴリズムの有効性と頑健性を確認した。
関連論文リスト
- From Large Language Models and Optimization to Decision Optimization
CoPilot: A Research Manifesto [2.4981381729038743]
我々は,大規模言語モデルと最適化の交点において,決定最適化CoPilot(DOCP)を作成するための研究を提案する。
DOCPは意思決定者を支援するために設計されたAIツールで、自然言語で対話してビジネスの問題を把握し、その後、対応する最適化モデルを定式化し、解決する。
a) LLMは、既にDOCPに関連する実質的な新しい能力を提供しており、b.主要な研究課題に対処する必要がある。
論文 参考訳(メタデータ) (2024-02-26T03:10:11Z) - Reinforcement Learning from Human Feedback with Active Queries [67.27150911254155]
現在の強化学習アプローチは、多くの場合、大量の人間による嗜好データを必要とする。
本稿では,能動学習の成功に触発されたクエリ効率の高いRLHF手法を提案する。
実験の結果,ADPOは人間の好みに対するクエリの約半分しか作成していないが,最先端のDPO法の性能と一致していることがわかった。
論文 参考訳(メタデータ) (2024-02-14T18:58:40Z) - Rethinking and Benchmarking Predict-then-Optimize Paradigm for
Combinatorial Optimization Problems [62.25108152764568]
多くのWebアプリケーションは、エネルギーコストを考慮したスケジューリング、Web広告の予算配分、ソーシャルネットワークでのグラフマッチングなど、最適化問題の解決に頼っている。
統一システムにおける予測と意思決定の性能について考察する。
我々は、現在のアプローチを包括的に分類し、既存の実験シナリオを統合する。
論文 参考訳(メタデータ) (2023-11-13T13:19:34Z) - Model-based Causal Bayesian Optimization [74.78486244786083]
乗算重み付き因果ベイズ最適化のための最初のアルゴリズム(CBO-MW)を提案する。
グラフ関連の量に自然に依存するCBO-MWに対する後悔の限界を導出する。
我々の実験は、共有モビリティシステムにおいて、ユーザの需要パターンを学習するためにCBO-MWをどのように使用できるかの現実的なデモを含む。
論文 参考訳(メタデータ) (2023-07-31T13:02:36Z) - Large Language Models for Supply Chain Optimization [4.554094815136834]
大規模言語モデル(LLM)がサプライチェーンの自動化と人間の理解と信頼のギャップを埋めるのにどのように役立つかを検討する。
我々はOptiGuideを設計する。これは平易なテキストで入力クエリとして受け付け、基礎となる結果に関する洞察を出力するフレームワークです。
当社のフレームワークがMicrosoftのクラウドサプライチェーン内の実際のサーバ配置シナリオに与える影響を実演する。
論文 参考訳(メタデータ) (2023-07-08T01:42:22Z) - Model-based Constrained MDP for Budget Allocation in Sequential
Incentive Marketing [28.395877073390434]
逐次インセンティブマーケティングは、オンラインビジネスにとって顧客を獲得し、忠誠心を高め、売上を伸ばすための重要なアプローチである。
予算制約下でのリターンを最大化するインセンティブを効果的に割り当てる方法については、文献ではあまり研究されていない。
本稿では,2項探索とモデルベース計画を組み合わせた効率的な学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-03-02T08:10:45Z) - Data-Driven Offline Decision-Making via Invariant Representation
Learning [97.49309949598505]
オフラインのデータ駆動意思決定は、アクティブなインタラクションなしで最適化された決定を合成する。
オフラインデータからトレーニングされたモデルへの入力に関して最適化する場合、誤って良いように見えるアウト・オブ・ディストリビューション(OOD)インプットを生成するのは簡単です。
本稿では、オフラインデータ駆動意思決定をドメイン適応として定式化し、最適化された決定値の正確な予測を行うことを目標とする。
論文 参考訳(メタデータ) (2022-11-21T11:01:37Z) - Sequential Information Design: Markov Persuasion Process and Its
Efficient Reinforcement Learning [156.5667417159582]
本稿では,逐次情報設計の新たなモデル,すなわちマルコフ説得過程(MPP)を提案する。
MPPのプランニングは、ミオピックレシーバーに同時に説得されるシグナルポリシーを見つけ、送信者の最適な長期累積ユーティリティを誘導する、というユニークな課題に直面している。
我々は,楽観主義と悲観主義の両原理の新たな組み合わせを特徴とする,実証可能な効率のよい非回帰学習アルゴリズム,Optimism-Pessimism Principle for Persuasion Process (OP4) を設計する。
論文 参考訳(メタデータ) (2022-02-22T05:41:43Z) - Markdowns in E-Commerce Fresh Retail: A Counterfactual Prediction and
Multi-Period Optimization Approach [29.11201102550876]
半パラメトリック構造モデルを構築し、価格の弾力性を学習し、対物需要を予測する。
本稿では,有限販売地平線上での消耗品全体の利益を最大化するために,多周期動的価格アルゴリズムを提案する。
提案されたフレームワークは、よく知られたeコマースの新鮮な小売シナリオであるFreshippoにうまくデプロイされている。
論文 参考訳(メタデータ) (2021-05-18T07:01:37Z) - Modeling the Second Player in Distributionally Robust Optimization [90.25995710696425]
我々は、最悪のケース分布を特徴付けるために神経生成モデルを使うことを議論する。
このアプローチは多くの実装と最適化の課題をもたらします。
提案されたアプローチは、同等のベースラインよりも堅牢なモデルを生み出す。
論文 参考訳(メタデータ) (2021-03-18T14:26:26Z) - Multi-Purchase Behavior: Modeling, Estimation and Optimization [0.9337154228221861]
本稿では,Bundle-MVL-Kファミリーと呼ばれる,同種の選択モデルのマルチ購入ファミリを提案する。
このモデルに対して最適化されたレコメンデーションを効率的に計算するバイナリ検索に基づく反復戦略を開発する。
論文 参考訳(メタデータ) (2020-06-14T23:47:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。