論文の概要: EasyRL4Rec: A User-Friendly Code Library for Reinforcement Learning
Based Recommender Systems
- arxiv url: http://arxiv.org/abs/2402.15164v1
- Date: Fri, 23 Feb 2024 07:54:26 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-26 15:20:27.458487
- Title: EasyRL4Rec: A User-Friendly Code Library for Reinforcement Learning
Based Recommender Systems
- Title(参考訳): EasyRL4Rec: 強化学習に基づくレコメンダシステムのためのユーザフレンドリーなコードライブラリ
- Authors: Yuanqing Yu, Chongming Gao, Jiawei Chen, Heng Tang, Yuefeng Sun, Qian
Chen, Weizhi Ma, Min Zhang
- Abstract要約: Reinforcement Learning-Based Recommender Systems(RS)は、長期のユーザエンゲージメントを改善する能力において、ますます認識されている。
EasyRL4Recは、RLベースのRS用にカスタマイズされた、ユーザフレンドリーで効率的なライブラリである。
EasyRL4Recは5つの広く使用されているパブリックデータセット上に構築された軽量で多様なRL環境を備えている。
- 参考スコア(独自算出の注目度): 19.006098059760305
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reinforcement Learning (RL)-Based Recommender Systems (RSs) are increasingly
recognized for their ability to improve long-term user engagement. Yet, the
field grapples with challenges such as the absence of accessible frameworks,
inconsistent evaluation standards, and the complexity of replicating prior
work. Addressing these obstacles, we present EasyRL4Rec, a user-friendly and
efficient library tailored for RL-based RSs. EasyRL4Rec features lightweight,
diverse RL environments built on five widely-used public datasets, and is
equipped with comprehensive core modules that offer rich options to ease the
development of models. It establishes consistent evaluation criteria with a
focus on long-term impacts and introduces customized solutions for state
modeling and action representation tailored to recommender systems.
Additionally, we share valuable insights gained from extensive experiments with
current methods. EasyRL4Rec aims to facilitate the model development and
experimental process in the domain of RL-based RSs. The library is openly
accessible at https://github.com/chongminggao/EasyRL4Rec.
- Abstract(参考訳): 強化学習(rl)ベースのレコメンダシステム(rss)は、長期ユーザエンゲージメントを改善する能力として認識されるようになっている。
しかしこの分野は、アクセシブルフレームワークの欠如、一貫性のない評価基準、事前の作業の複製の複雑さといった課題に悩まされている。
これらの障害に対処するため,ユーザフレンドリで効率的なライブラリであるEasyRL4Recを提案する。
EasyRL4Recは5つの広く使用されているパブリックデータセット上に構築された軽量で多様なRL環境を備え、モデルの開発を容易にするための豊富なオプションを提供する包括的なコアモジュールを備えている。
長期的影響に焦点を当てた一貫した評価基準を確立し、レコメンデーションシステムに適した状態モデリングとアクション表現のためのカスタマイズされたソリューションを導入する。
さらに、現在の手法による広範な実験から得られた貴重な洞察を共有します。
EasyRL4Recは、RLベースのRSのドメインにおけるモデル開発と実験プロセスを容易にすることを目的としている。
ライブラリはhttps://github.com/chongminggao/EasyRL4Recで公開されている。
関連論文リスト
- SUBER: An RL Environment with Simulated Human Behavior for Recommender Systems [18.716102193517315]
強化学習 (Reinforcement Learning, RL) はレコメンデーションシステムの領域で人気を集めている。
この研究は、RLベースのレコメンデータシステムをトレーニングするためのモジュラーで斬新なフレームワークを導入している。
RL環境を含むソフトウェアはGitHubで公開されている。
論文 参考訳(メタデータ) (2024-06-01T11:56:08Z) - DeLF: Designing Learning Environments with Foundation Models [3.6666767699199805]
強化学習(RL)は、基本的なシーケンシャルな意思決定問題に対して有能で直感な構造を提供する。
驚くべきブレークスルーにもかかわらず、多くの単純なアプリケーションで実際にRLを採用するのは難しい。
本稿では,ユーザが意図したアプリケーションに対して,RL環境のコンポーネントを設計する手法を提案する。
論文 参考訳(メタデータ) (2024-01-17T03:14:28Z) - Back to Basics: A Simple Recipe for Improving Out-of-Domain Retrieval in
Dense Encoders [63.28408887247742]
得られたモデルにおいて,より優れた一般化能力を得るために,トレーニング手順の改善が可能であるかを検討する。
我々は、高密度エンコーダをトレーニングするための簡単なレシピを推奨する: LoRAのようなパラメータ効率のよいMSMARCOのトレーニング。
論文 参考訳(メタデータ) (2023-11-16T10:42:58Z) - Contextualize Me -- The Case for Context in Reinforcement Learning [49.794253971446416]
文脈強化学習(cRL)は、このような変化を原則的にモデル化するためのフレームワークを提供する。
我々は,cRLが有意義なベンチマークや一般化タスクに関する構造化推論を通じて,RLのゼロショット一般化の改善にどのように貢献するかを示す。
論文 参考訳(メタデータ) (2022-02-09T15:01:59Z) - Supervised Advantage Actor-Critic for Recommender Systems [76.7066594130961]
本稿では、RL成分を学習するための負のサンプリング戦略を提案し、それを教師付き逐次学習と組み合わせる。
サンプル化された(負の)作用 (items) に基づいて、平均ケース上での正の作用の「アドバンテージ」を計算することができる。
SNQNとSA2Cを4つのシーケンシャルレコメンデーションモデルでインスタンス化し、2つの実世界のデータセットで実験を行う。
論文 参考訳(メタデータ) (2021-11-05T12:51:15Z) - RL4RS: A Real-World Dataset for Reinforcement Learning based Recommender
System [26.097154801770245]
強化学習に基づく推薦システム (RL-based RS) は,収集したデータのバッチから適切なポリシーを学習することを目的としている。
現在のRLベースのRS研究は、一般的に大きな現実的ギャップがある。
人工データセットと半シミュレートされたRSデータセットを置き換えることを願っている、最初のオープンソースの実世界のデータセットであるRL4RSを紹介します。
論文 参考訳(メタデータ) (2021-10-18T12:48:02Z) - RL-DARTS: Differentiable Architecture Search for Reinforcement Learning [62.95469460505922]
我々は、強化学習(RL)における微分可能なアーキテクチャ探索(DARTS)の最初の応用の1つであるRL-DARTSを紹介する。
画像エンコーダをDARTSスーパーネットに置き換えることにより、検索方法はサンプリング効率が高く、余分な計算資源が最小限必要であり、また、既存のコードに小さな変更を加える必要がなく、オフ・ポリティクスとオン・ポリティクスのRLアルゴリズムとも互換性がある。
スーパーネットはより優れたセルを徐々に学習し、手作業で設計したポリシーに対して高い競争力を持つ代替アーキテクチャへとつながり、RLポリシーの以前の設計選択も検証できることを示す。
論文 参考訳(メタデータ) (2021-06-04T03:08:43Z) - Information Directed Reward Learning for Reinforcement Learning [64.33774245655401]
我々は、標準rlアルゴリズムが可能な限り少数の専門家クエリで高い期待値を達成することができる報酬関数のモデルを学ぶ。
特定のタイプのクエリ用に設計された以前のアクティブな報酬学習方法とは対照的に、IDRLは自然に異なるクエリタイプに対応します。
我々は,複数の環境における広範囲な評価と,異なるタイプのクエリでこの結果を支持する。
論文 参考訳(メタデータ) (2021-02-24T18:46:42Z) - Integrating Distributed Architectures in Highly Modular RL Libraries [4.297070083645049]
ほとんどの人気のある強化学習ライブラリは、高度にモジュール化されたエージェントの構成性を主張している。
本稿では、RLエージェントを独立した再利用可能なコンポーネントによって異なるスケールで定義できる汎用的アプローチを提案する。
論文 参考訳(メタデータ) (2020-07-06T10:22:07Z) - MushroomRL: Simplifying Reinforcement Learning Research [60.70556446270147]
MushroomRLはオープンソースのPythonライブラリで、強化学習(RL)実験の実装と実行を簡単にするために開発された。
他の利用可能なライブラリと比較して、MushroomRLは、新しいRL方法論の実装とテストの労力を最小限に抑えるために、包括的で柔軟なフレームワークを提供することを目的として作られた。
論文 参考訳(メタデータ) (2020-01-04T17:23:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。