論文の概要: Knowledge-guided Deep Reinforcement Learning for Interactive
Recommendation
- arxiv url: http://arxiv.org/abs/2004.08068v1
- Date: Fri, 17 Apr 2020 05:26:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-12 12:59:00.412474
- Title: Knowledge-guided Deep Reinforcement Learning for Interactive
Recommendation
- Title(参考訳): インタラクティブレコメンデーションのための知識誘導深層強化学習
- Authors: Xiaocong Chen, Chaoran Huang, Lina Yao, Xianzhi Wang, Wei Liu, Wenjie
Zhang
- Abstract要約: インタラクティブレコメンデーションは、アイテムとユーザ間の動的インタラクションから学び、応答性と精度を達成することを目的としている。
本稿では,知識指導型深層強化学習を提案する。
- 参考スコア(独自算出の注目度): 49.32287384774351
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Interactive recommendation aims to learn from dynamic interactions between
items and users to achieve responsiveness and accuracy. Reinforcement learning
is inherently advantageous for coping with dynamic environments and thus has
attracted increasing attention in interactive recommendation research. Inspired
by knowledge-aware recommendation, we proposed Knowledge-Guided deep
Reinforcement learning (KGRL) to harness the advantages of both reinforcement
learning and knowledge graphs for interactive recommendation. This model is
implemented upon the actor-critic network framework. It maintains a local
knowledge network to guide decision-making and employs the attention mechanism
to capture long-term semantics between items. We have conducted comprehensive
experiments in a simulated online environment with six public real-world
datasets and demonstrated the superiority of our model over several
state-of-the-art methods.
- Abstract(参考訳): インタラクティブレコメンデーションは、アイテムとユーザ間の動的インタラクションから学び、応答性と精度を達成することを目的としている。
強化学習は本質的に動的環境に対処するのに有利であり、インタラクティブな推奨研究で注目を集めている。
知識を意識した深層強化学習 (KGRL) を提案し, 対話型レコメンデーションのための強化学習と知識グラフの双方の利点を生かした。
このモデルはアクター批判ネットワークフレームワーク上に実装されている。
意思決定をガイドするローカルな知識ネットワークを維持し、アイテム間の長期的な意味をキャプチャするアテンションメカニズムを採用している。
我々は,6つの実世界のデータセットを用いたシミュレーションオンライン環境での総合実験を行い,最先端の手法を用いたモデルの優位性を実証した。
関連論文リスト
- Foundations of Reinforcement Learning and Interactive Decision Making [81.76863968810423]
本稿では,頻度主義的アプローチとベイズ的アプローチを用いた探索・探索ジレンマに対処するための統一的な枠組みを提案する。
ニューラルネットワークのような近似とフレキシブルなモデルクラスを機能させるために特別な注意が払われる。
論文 参考訳(メタデータ) (2023-12-27T21:58:45Z) - RLIF: Interactive Imitation Learning as Reinforcement Learning [56.997263135104504]
我々は,対話型模倣学習と類似するが,さらに実践的な仮定の下で,非政治強化学習によってパフォーマンスが向上できることを実証する。
提案手法は,ユーザ介入信号を用いた強化学習を報奨として利用する。
このことは、インタラクティブな模倣学習において介入する専門家がほぼ最適であるべきだという仮定を緩和し、アルゴリズムが潜在的に最適でない人間の専門家よりも改善される行動を学ぶことを可能にする。
論文 参考訳(メタデータ) (2023-11-21T21:05:21Z) - A Broad-persistent Advising Approach for Deep Interactive Reinforcement
Learning in Robotic Environments [0.3683202928838613]
Deep Interactive Reinforcement Learning (DeepIRL)には、外部トレーナーやエキスパートからのインタラクティブなフィードバックが含まれており、学習プロセスのスピードアップのために、学習者がアクションを選択するのを支援する。
本稿では,BPA(Broad-peristent Advising)を提案する。
トレーナーは、現在の状態だけでなく、同様の状態に関するより一般的なアドバイスを与えるだけでなく、エージェントが学習プロセスのスピードアップを可能にする。
論文 参考訳(メタデータ) (2021-10-15T10:56:00Z) - Recent Advances in Heterogeneous Relation Learning for Recommendation [5.390295867837705]
異種関係学習に焦点を当てたレコメンデーションフレームワークの開発について概説する。
このタスクの目的は、不均一な関係データを潜在表現空間にマッピングすることである。
本稿では,行列分解,注意機構,グラフニューラルネットワークなど,各カテゴリの学習手法について論じる。
論文 参考訳(メタデータ) (2021-10-07T13:32:04Z) - Backprop-Free Reinforcement Learning with Active Neural Generative
Coding [84.11376568625353]
動的環境におけるエラー(バックプロップ)のバックプロパゲーションを伴わない行動駆動型生成モデルの学習のための計算フレームワークを提案する。
我々は、まばらな報酬でも機能するインテリジェントエージェントを開発し、推論として計画の認知理論からインスピレーションを得ている。
我々のエージェントの堅牢な性能は、神経推論と学習のためのバックプロップフリーアプローチがゴール指向の行動を促進するという有望な証拠を提供する。
論文 参考訳(メタデータ) (2021-07-10T19:02:27Z) - Generative Adversarial Reward Learning for Generalized Behavior Tendency
Inference [71.11416263370823]
ユーザの行動嗜好モデルのための生成的逆強化学習を提案する。
我々のモデルは,差別的アクター批判ネットワークとWasserstein GANに基づいて,ユーザの行動から報酬を自動的に学習することができる。
論文 参考訳(メタデータ) (2021-05-03T13:14:25Z) - Generative Inverse Deep Reinforcement Learning for Online Recommendation [62.09946317831129]
オンラインレコメンデーションのための新しい逆強化学習手法InvRecを提案する。
InvRecは、オンラインレコメンデーションのために、ユーザの行動から報酬関数を自動的に抽出する。
論文 参考訳(メタデータ) (2020-11-04T12:12:25Z) - A Conceptual Framework for Externally-influenced Agents: An Assisted
Reinforcement Learning Review [10.73121872355072]
支援強化学習のための概念的枠組みと分類法を提案する。
提案する分類法は,外部情報ソースと学習者エージェントの関係を詳細に記述する。
エージェントの性能向上のために外部情報を用いた強化学習の現在の流れを同定する。
論文 参考訳(メタデータ) (2020-07-03T08:07:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。