論文の概要: Scalable and Interpretable Contextual Bandits: A Literature Review and Retail Offer Prototype
- arxiv url: http://arxiv.org/abs/2505.16918v1
- Date: Thu, 22 May 2025 17:13:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-23 17:12:48.486989
- Title: Scalable and Interpretable Contextual Bandits: A Literature Review and Retail Offer Prototype
- Title(参考訳): スケーラブルで解釈可能なコンテキストバンド: 文献レビューとRetail Offer Prototype
- Authors: Nikola Tankovic, Robert Sajina,
- Abstract要約: 本稿では、CMAB(Contextual Multi-Armed Bandit)手法のレビューを行い、スケーラブルで解釈可能なオファー選択のための実験的なフレームワークを提案する。
アプローチは製品カテゴリレベルでコンテキストをモデル化し、オファーが複数のカテゴリにまたがり、類似のオファー間での知識伝達を可能にする。
- 参考スコア(独自算出の注目度): 2.7624021966289605
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a concise review of Contextual Multi-Armed Bandit (CMAB) methods and introduces an experimental framework for scalable, interpretable offer selection, addressing the challenge of fast-changing offers. The approach models context at the product category level, allowing offers to span multiple categories and enabling knowledge transfer across similar offers. This improves learning efficiency and generalization in dynamic environments. The framework extends standard CMAB methodology to support multi-category contexts, and achieves scalability through efficient feature engineering and modular design. Advanced features such as MPG (Member Purchase Gap) and MF (Matrix Factorization) capture nuanced user-offer interactions, with implementation in Python for practical deployment. A key contribution is interpretability at scale: logistic regression models yield transparent weight vectors, accessible via a large language model (LLM) interface for real-time, user-level tracking and explanation of evolving preferences. This enables the generation of detailed member profiles and identification of behavioral patterns, supporting personalized offer optimization and enhancing trust in automated decisions. By situating our prototype alongside established paradigms like Generalized Linear Models and Thompson Sampling, we demonstrate its value for both research and real-world CMAB applications.
- Abstract(参考訳): 本稿では、CMAB(Contextual Multi-Armed Bandit)手法の簡潔なレビューを行い、高速に変化するオファーの課題に対処し、スケーラブルで解釈可能なオファー選択のための実験的なフレームワークを提案する。
アプローチは製品カテゴリレベルでコンテキストをモデル化し、オファーが複数のカテゴリにまたがり、類似のオファー間での知識伝達を可能にする。
これにより、動的環境における学習効率と一般化が向上する。
このフレームワークは、標準的なCMAB方法論を拡張して、マルチカテゴリコンテキストをサポートし、効率的な機能エンジニアリングとモジュール設計を通じてスケーラビリティを実現する。
MPG(Member Purchase Gap)やMF(Matrix Factorization)といった高度な機能は、実践的なデプロイのためにPythonで実装された、ニュアンスなユーザ-オフアインタラクションをキャプチャする。
ロジスティック回帰モデルは透明な重みベクトルを生成し、大きな言語モデル(LLM)インターフェースを介してアクセスでき、リアルタイム、ユーザレベルの追跡と進化する好みの説明を行う。
これにより、詳細なメンバープロファイルの生成と行動パターンの識別が可能になり、パーソナライズされたオファー最適化をサポートし、自動決定の信頼性を高めることができる。
一般化線形モデルやトンプソンサンプリングのような確立したパラダイムとともにプロトタイプを配置することにより、研究と実世界のCMABアプリケーションの両方でその価値を実証する。
関連論文リスト
- Learning Item Representations Directly from Multimodal Features for Effective Recommendation [51.49251689107541]
マルチモーダルレコメンデータシステムは、主にベイズパーソナライズされたランク付け(BPR)最適化を利用してアイテム表現を学習する。
本稿では,マルチモーダルな特徴からアイテム表現を直接学習し,推薦性能を向上する新しいモデル(LIRDRec)を提案する。
論文 参考訳(メタデータ) (2025-05-08T05:42:22Z) - DashCLIP: Leveraging multimodal models for generating semantic embeddings for DoorDash [0.4288177321445912]
画像テキストデータに対するコントラスト学習を通じて,ユニモーダルエンコーダとマルチモーダルエンコーダを整列させることにより,製品およびユーザクエリのための共同トレーニングフレームワークを導入する。
提案手法では,クエリエンコーダをLLM計算した関連データセットでトレーニングし,エンゲージメント履歴への依存を解消する。
パーソナライズされた広告レコメンデーションでは、デプロイ後のクリックスルー率と変換レートが大きく上昇し、主要なビジネス指標への影響を確認します。
論文 参考訳(メタデータ) (2025-03-18T20:38:31Z) - ELICIT: LLM Augmentation via External In-Context Capability [16.237679215248196]
algは2つのモジュールからなるフレームワークで、タスクベクトルを効果的に保存し再利用する。
algは、モデル機能の適応的な適用を可能にするプラグイン・アンド・プレイパフォーマンス・ブースターとして機能する。
論文 参考訳(メタデータ) (2024-10-12T03:19:06Z) - Fine-tuning Multimodal Large Language Models for Product Bundling [53.01642741096356]
Bundle-MLLMは,大規模言語モデル(LLM)をハイブリットアイテムトークン化アプローチにより微調整する新しいフレームワークである。
具体的には、テキスト、メディア、およびリレーショナルデータを統一トークン化に統合し、テキストトークンと非テキストトークンを区別するソフトな分離トークンを導入する。
1)バンドルパターンを学習し,2)製品バンドル固有のマルチモーダルセマンティック理解の強化を行う。
論文 参考訳(メタデータ) (2024-07-16T13:30:14Z) - Self-Supervised Representation Learning with Meta Comprehensive
Regularization [11.387994024747842]
既存の自己管理フレームワークに組み込まれたCompMod with Meta Comprehensive Regularization (MCR)というモジュールを導入する。
提案したモデルを双方向最適化機構により更新し,包括的特徴を捉える。
本稿では,情報理論と因果対実的視点から提案手法の理論的支援を行う。
論文 参考訳(メタデータ) (2024-03-03T15:53:48Z) - Exploiting Modality-Specific Features For Multi-Modal Manipulation
Detection And Grounding [54.49214267905562]
マルチモーダルな操作検出とグラウンド処理のためのトランスフォーマーベースのフレームワークを構築する。
本フレームワークは,マルチモーダルアライメントの能力を維持しながら,モダリティ特有の特徴を同時に探求する。
本稿では,グローバルな文脈的キューを各モーダル内に適応的に集約する暗黙的操作クエリ(IMQ)を提案する。
論文 参考訳(メタデータ) (2023-09-22T06:55:41Z) - RefSAM: Efficiently Adapting Segmenting Anything Model for Referring Video Object Segmentation [53.4319652364256]
本稿では,ビデオオブジェクトのセグメンテーションを参照するためのSAMの可能性を探るRefSAMモデルを提案する。
提案手法は,Cross-RValModalを用いることで,モダリティ学習を向上させるためにオリジナルのSAMモデルに適応する。
我々は、言語と視覚の特徴を効果的に調整し、融合させるために、パラメータ効率のチューニング戦略を採用している。
論文 参考訳(メタデータ) (2023-07-03T13:21:58Z) - Bayesian Prompt Learning for Image-Language Model Generalization [64.50204877434878]
我々はベイズ法の正規化能力を用いて、変分推論問題としてプロンプト学習をフレーム化する。
提案手法は,プロンプト空間を正規化し,目に見えないプロンプトへの過剰適合を低減し,目に見えないプロンプトのプロンプト一般化を改善する。
ベイジアン・プロンプト学習がプロンプト空間の適切なカバレッジを提供する15のベンチマークを実証的に示す。
論文 参考訳(メタデータ) (2022-10-05T17:05:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。