論文の概要: A Hybrid Bandit Framework for Diversified Recommendation
- arxiv url: http://arxiv.org/abs/2012.13245v1
- Date: Thu, 24 Dec 2020 13:24:40 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-25 08:06:12.458646
- Title: A Hybrid Bandit Framework for Diversified Recommendation
- Title(参考訳): 多様な勧告のためのハイブリッドバンドフレームワーク
- Authors: Qinxu Ding, Yong Liu, Chunyan Miao, Fei Cheng, Haihong Tang
- Abstract要約: 本稿では,モジュール関数と分散関数の組み合わせを最適化するLinear Modular Dispersion Bandit (LMDB) フレームワークを提案する。
具体的には、LMDBは、各項目の関連性プロパティをモデル化するモジュラー関数と、アイテムセットの多様性特性を記述する分散関数を用いる。
また, lmdb問題を解くための線形モジュラ分散ハイブリッド(lmdh)と呼ばれる学習アルゴリズムを開発し, そのn段階の後悔にギャップのないバウンドを導出する。
- 参考スコア(独自算出の注目度): 42.516774050676254
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The interactive recommender systems involve users in the recommendation
procedure by receiving timely user feedback to update the recommendation
policy. Therefore, they are widely used in real application scenarios. Previous
interactive recommendation methods primarily focus on learning users'
personalized preferences on the relevance properties of an item set. However,
the investigation of users' personalized preferences on the diversity
properties of an item set is usually ignored. To overcome this problem, we
propose the Linear Modular Dispersion Bandit (LMDB) framework, which is an
online learning setting for optimizing a combination of modular functions and
dispersion functions. Specifically, LMDB employs modular functions to model the
relevance properties of each item, and dispersion functions to describe the
diversity properties of an item set. Moreover, we also develop a learning
algorithm, called Linear Modular Dispersion Hybrid (LMDH) to solve the LMDB
problem and derive a gap-free bound on its n-step regret. Extensive experiments
on real datasets are performed to demonstrate the effectiveness of the proposed
LMDB framework in balancing the recommendation accuracy and diversity.
- Abstract(参考訳): 対話型レコメンダシステムでは,ユーザの適切なフィードバックを受けてレコメンデーションポリシを更新することで,レコメンデーション手順にユーザを参加させる。
したがって、実際のアプリケーションシナリオで広く使われている。
これまでのインタラクティブレコメンデーション手法は、主にアイテムセットの関連性に関するユーザのパーソナライズされた好みの学習に焦点を当てている。
しかしながら、アイテムセットの多様性特性に対するユーザのパーソナライズされた好みの調査は通常無視される。
この問題を解決するために,モジュール関数と分散関数の組み合わせを最適化するためのオンライン学習環境であるLinear Modular Dispersion Bandit (LMDB) フレームワークを提案する。
具体的には、lmdbはモジュラー関数を使って各アイテムの関連性をモデル化し、分散関数はアイテム集合の多様性特性を記述する。
さらに,LMDH(Linear Modular Dispersion Hybrid)と呼ばれる学習アルゴリズムも開発し,LMDB問題を解くとともに,そのnステップの後悔に基づいてギャップのない境界を導出する。
推薦精度と多様性のバランスをとるためのlmdbフレームワークの有効性を実証するために,実データセットに関する広範な実験を行った。
関連論文リスト
- Relative Preference Optimization: Enhancing LLM Alignment through
Contrasting Responses across Identical and Diverse Prompts [100.76940486636121]
Relative Preference Optimization (RPO) は、同一のプロンプトと関連するプロンプトの両方から、より多く、あまり好まれない応答を識別するように設計されている。
RPOは、大きな言語モデルをユーザの好みに合わせて調整し、トレーニングプロセスにおける適応性を改善する優れた能力を示している。
論文で提示された結果を再現するために必要なPyTorchコードは、GitHubで公開されている。
論文 参考訳(メタデータ) (2024-02-12T22:47:57Z) - Multi-Objective Bayesian Optimization with Active Preference Learning [18.066263838953223]
本稿では,多目的最適化 (MOO) 問題において最も望ましい解を特定するためのベイズ最適化 (BO) 手法を提案する。
また、意思決定者(DM)との相互作用コストを最小限に抑えるため、選好推定のためのアクティブラーニング戦略を提案する。
論文 参考訳(メタデータ) (2023-11-22T15:24:36Z) - On Generative Agents in Recommendation [65.52796348055281]
Agent4RecはLarge Language Models (LLM)に基づく映画レコメンデーションシミュレータである。
ユーザプロファイル、メモリ、アクションモジュールを備えたLLMを内蔵した生成エージェントは、レコメンダシステムに特化している。
Agent4Recの評価では、エージェント間のアライメントと逸脱とユーザ個人化された好みの両方を強調している。
論文 参考訳(メタデータ) (2023-10-16T06:41:16Z) - Generative Slate Recommendation with Reinforcement Learning [49.75985313698214]
強化学習アルゴリズムは、レコメンデータシステムのユーザエンゲージメントを最適化するために使用することができる。
しかし、RLアプローチはスレートレコメンデーションシナリオでは難解である。
この設定では、アクションはアイテムの組み合わせを含むことができるスレートに対応する。
本研究では,変分オートエンコーダによって学習された連続低次元ラテント空間におけるスレートの符号化を提案する。
我々は、(i)以前の作業で要求される仮定を緩和し、(ii)完全なスレートをモデル化することで、アクション選択の品質を向上させることができる。
論文 参考訳(メタデータ) (2023-01-20T15:28:09Z) - Diversely Regularized Matrix Factorization for Accurate and Aggregately
Diversified Recommendation [15.483426620593013]
DivMF(Diversely Regularized Matrix Factorization)は、多彩な推薦のための新しい行列分解法である。
我々は,DivMFが総合的に多様化した推薦において最先端の性能を達成することを示す。
論文 参考訳(メタデータ) (2022-10-19T08:49:39Z) - Knowledge-Enhanced Hierarchical Graph Transformer Network for
Multi-Behavior Recommendation [56.12499090935242]
本研究では,ユーザとレコメンデータシステムにおける項目間の多種類の対話パターンを探索する知識強化階層型グラフトランスフォーマネットワーク(KHGT)を提案する。
KHGTはグラフ構造化ニューラルネットワーク上に構築され、タイプ固有の振る舞い特性をキャプチャする。
KHGTは、様々な評価設定において、最先端のレコメンデーション手法よりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2021-10-08T09:44:00Z) - Bayesian preference elicitation for multiobjective combinatorial
optimization [12.96855751244076]
DM(Decision Maker)のノイズ応答に対処できる新しいインクリメンタルな選好推論手法を提案する。
DMの選好はパラメータが未知の集約関数で表され、その不確実性はパラメータ空間上の密度関数で表されると仮定する。
論文 参考訳(メタデータ) (2020-07-29T12:28:37Z) - Supervised Hyperalignment for multi-subject fMRI data alignment [81.8694682249097]
本稿では,MVP解析における機能的アライメントを改善するために,SHA(Supervised Hyperalignment)手法を提案する。
マルチオブジェクトデータセットの実験では、SHA法は最大19%の性能がマルチクラス問題に対して達成されている。
論文 参考訳(メタデータ) (2020-01-09T09:17:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。