論文の概要: Cluster Based Deep Contextual Reinforcement Learning for top-k
Recommendations
- arxiv url: http://arxiv.org/abs/2012.02291v1
- Date: Sun, 29 Nov 2020 20:24:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-07 09:06:51.841605
- Title: Cluster Based Deep Contextual Reinforcement Learning for top-k
Recommendations
- Title(参考訳): クラスタに基づくトップk勧告のための深層文脈強化学習
- Authors: Anubha Kabra, Anu Agarwal, Anil Singh Parihar
- Abstract要約: 本稿では,強化学習を伴うクラスタリングのアンサンブルを作成することで,トップkレコメンデーションを生成する手法を提案する。
我々は,DB Scanクラスタリングを導入し,膨大なアイテム空間に対処した。
部分的な更新とバッチ更新によって、モデルはユーザパターンを継続的に学習する。
- 参考スコア(独自算出の注目度): 2.8207195763355704
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Rapid advancements in the E-commerce sector over the last few decades have
led to an imminent need for personalised, efficient and dynamic recommendation
systems. To sufficiently cater to this need, we propose a novel method for
generating top-k recommendations by creating an ensemble of clustering with
reinforcement learning. We have incorporated DB Scan clustering to tackle vast
item space, hence in-creasing the efficiency multi-fold. Moreover, by using
deep contextual reinforcement learning, our proposed work leverages the user
features to its full potential. With partial updates and batch updates, the
model learns user patterns continuously. The Duelling Bandit based exploration
provides robust exploration as compared to the state-of-art strategies due to
its adaptive nature. Detailed experiments conducted on a public dataset verify
our claims about the efficiency of our technique as com-pared to existing
techniques.
- Abstract(参考訳): 過去数十年間のEコマース分野の急速な進歩は、パーソナライズされ、効率的で、ダイナミックなレコメンデーションシステムの必要性を差し迫った。
このニーズを十分に満たすために,強化学習によるクラスタリングのアンサンブルを作成することにより,トップk推薦を生成する新しい手法を提案する。
我々は,DB Scanクラスタリングを導入し,膨大なアイテム空間に対処した。
さらに, 深層文脈強化学習を用いて, ユーザ特徴を最大限に活用する手法を提案する。
部分的な更新とバッチ更新によって、モデルはユーザパターンを継続的に学習する。
デュエル・バンディットに基づく探検は、その適応性による最先端の戦略と比較して、堅牢な探査を提供する。
公開データセット上で実施した詳細な実験は,既存の技術と同等の手法の効率性について,我々の主張を検証するものである。
関連論文リスト
- Leveraging Hierarchical Taxonomies in Prompt-based Continual Learning [41.13568563835089]
深層学習モデルの学習において,情報の整理・接続という人間の習慣を適用することが効果的な戦略として有効であることがわかった。
本稿では,モデルがより挑戦的な知識領域に集中するように促す新たな正規化損失関数を提案する。
論文 参考訳(メタデータ) (2024-10-06T01:30:40Z) - Hierarchical Reinforcement Learning for Temporal Abstraction of Listwise Recommendation [51.06031200728449]
我々はmccHRLと呼ばれる新しいフレームワークを提案し、リストワイドレコメンデーションにおける時間的抽象化のレベルを異なるものにする。
階層的な枠組みの中では、ハイレベルエージェントがユーザ知覚の進化を研究し、低レベルエージェントがアイテム選択ポリシーを作成している。
その結果,本手法による性能改善は,いくつかのよく知られたベースラインと比較して有意な結果が得られた。
論文 参考訳(メタデータ) (2024-09-11T17:01:06Z) - MMREC: LLM Based Multi-Modal Recommender System [2.3113916776957635]
本稿では,Large Language Models(LLM)とディープラーニング技術を活用して,レコメンデータシステムを強化する新しい手法を提案する。
提案フレームワークは,マルチモーダル情報処理を取り入れたレコメンデーションの精度と妥当性を,統一された潜在空間表現を用いて向上することを目的としている。
論文 参考訳(メタデータ) (2024-08-08T04:31:29Z) - Knowledge Adaptation from Large Language Model to Recommendation for Practical Industrial Application [54.984348122105516]
大規模テキストコーパスで事前訓練されたLarge Language Models (LLMs) は、推奨システムを強化するための有望な道を示す。
オープンワールドの知識と協調的な知識を相乗化するLlm-driven knowlEdge Adaptive RecommeNdation (LEARN) フレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-07T04:00:30Z) - Embedding in Recommender Systems: A Survey [67.67966158305603]
重要な側面は、ユーザやアイテムIDといった高次元の離散的な特徴を低次元連続ベクトルに包含する技法である。
埋め込み技術の適用は複雑なエンティティ関係を捉え、かなりの研究を刺激している。
この調査では、協調フィルタリング、自己教師付き学習、グラフベースのテクニックなどの埋め込み手法を取り上げている。
論文 参考訳(メタデータ) (2023-10-28T06:31:06Z) - Hierarchical Reinforcement Learning for Modeling User Novelty-Seeking
Intent in Recommender Systems [26.519571240032967]
本稿では,階層型ユーザ新規検索意図をモデル化する階層型強化学習手法を提案する。
さらに, 階層的RL (HRL) エージェントの報酬関数に多様性と新規性に関連する測定を取り入れ, ユーザの探索を促進する。
論文 参考訳(メタデータ) (2023-06-02T12:02:23Z) - A Deep Reinforcement Learning Approach for Composing Moving IoT Services [0.12891210250935145]
本稿では,移動領域としてモデル化されたクラウドソース型サービスモデルを提案する。
動作中のIoTサービスを選択し,構成するための,深層強化学習に基づく合成手法を提案する。
2つの実世界のデータセットに対する実験は、深層強化学習に基づくアプローチの有効性と効率性を検証する。
論文 参考訳(メタデータ) (2021-11-06T22:02:31Z) - Generative Inverse Deep Reinforcement Learning for Online Recommendation [62.09946317831129]
オンラインレコメンデーションのための新しい逆強化学習手法InvRecを提案する。
InvRecは、オンラインレコメンデーションのために、ユーザの行動から報酬関数を自動的に抽出する。
論文 参考訳(メタデータ) (2020-11-04T12:12:25Z) - Knowledge-guided Deep Reinforcement Learning for Interactive
Recommendation [49.32287384774351]
インタラクティブレコメンデーションは、アイテムとユーザ間の動的インタラクションから学び、応答性と精度を達成することを目的としている。
本稿では,知識指導型深層強化学習を提案する。
論文 参考訳(メタデータ) (2020-04-17T05:26:47Z) - Learning From Multiple Experts: Self-paced Knowledge Distillation for
Long-tailed Classification [106.08067870620218]
我々は,LFME(Learning From Multiple Experts)と呼ばれる自己評価型知識蒸留フレームワークを提案する。
提案するLFMEフレームワークは,複数の'Experts'からの知識を集約して,統一された学生モデルを学ぶ。
提案手法は,最先端の手法に比べて優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2020-01-06T12:57:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。