論文の概要: Optimized Recommender Systems with Deep Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2110.03039v1
- Date: Wed, 6 Oct 2021 19:54:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-09 11:41:37.578359
- Title: Optimized Recommender Systems with Deep Reinforcement Learning
- Title(参考訳): 深層強化学習を用いた最適レコメンダシステム
- Authors: Lucas Farris
- Abstract要約: 本研究は,再現性のあるテストベッドをセットアップし,現実的な環境下での異なる技術アルゴリズムの状態を評価する手法について検討・開発する。
提案、文献レビュー、方法論、結果、コメントを含む。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recommender Systems have been the cornerstone of online retailers.
Traditionally they were based on rules, relevance scores, ranking algorithms,
and supervised learning algorithms, but now it is feasible to use reinforcement
learning algorithms to generate meaningful recommendations. This work
investigates and develops means to setup a reproducible testbed, and evaluate
different state of the art algorithms in a realistic environment. It entails a
proposal, literature review, methodology, results, and comments.
- Abstract(参考訳): Recommender Systemsはオンライン小売の基盤となっている。
従来はルール、適合度スコア、ランキングアルゴリズム、教師付き学習アルゴリズムに基づいていたが、現在では強化学習アルゴリズムを使用して有意義な推奨を生成することは可能である。
本研究は,再現性テストベッドの設置方法を調査し,現実的な環境下での異なる技術アルゴリズムの状態を評価する。
提案、文献レビュー、方法論、結果、コメントが含まれています。
関連論文リスト
- Pre-trained Language Model and Knowledge Distillation for Lightweight Sequential Recommendation [51.25461871988366]
本稿では,事前学習言語モデルと知識蒸留に基づく逐次推薦アルゴリズムを提案する。
提案アルゴリズムは,推薦精度を高め,タイムリーな推薦サービスを提供する。
論文 参考訳(メタデータ) (2024-09-23T08:39:07Z) - Improvements on Recommender System based on Mathematical Principles [10.027420333081084]
本稿では,数理原理に基づくRecommender Systemのアルゴリズムを説明し,改善のための有効な方法を見出す。
確率に基づくアルゴリズムはRecommender Systemにおいて重要であり、アルゴリズムの精度と速度を高めるためにどのように役立つかを説明する。
論文 参考訳(メタデータ) (2023-04-26T14:13:46Z) - Optimistically Tempered Online Learning [19.12634663761194]
最適化オンライン学習アルゴリズムは、楽観的に常に有用であると仮定された専門家のアドバイスを利用する。
我々は,オンライン学習フレームワークと,オンラインアルゴリズムのOT適応を開発する。
我々のアルゴリズムは、動的後悔境界という形で、音理論上の保証を伴っている。
論文 参考訳(メタデータ) (2023-01-18T13:48:20Z) - Tree-Based Adaptive Model Learning [62.997667081978825]
我々はKearns-Vazirani学習アルゴリズムを拡張し、時間とともに変化するシステムを扱う。
本稿では,学習前の動作を再利用し,更新し,LearnerLibライブラリに実装し,大規模な実例で評価する学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-08-31T21:24:22Z) - Emergent Instabilities in Algorithmic Feedback Loops [3.4711828357576855]
教師-学生の学習シミュレーションを用いて,推薦アルゴリズムにおけるアルゴリズムの相違について検討する。
結果は、人とアルゴリズム間の相互作用から創発的な行動を説明する必要性を強調している。
論文 参考訳(メタデータ) (2022-01-18T18:58:03Z) - Safe Learning and Optimization Techniques: Towards a Survey of the State
of the Art [3.6954802719347413]
安全な学習と最適化は、できるだけ安全でない入力ポイントの評価を避ける学習と最適化の問題に対処します。
安全強化学習アルゴリズムに関する包括的な調査は2015年に発表されたが、アクティブラーニングと最適化に関する関連研究は考慮されなかった。
本稿では,強化学習,ガウス過程の回帰と分類,進化的アルゴリズム,アクティブラーニングなど,様々な分野のアルゴリズムについて概説する。
論文 参考訳(メタデータ) (2021-01-23T13:58:09Z) - Evolving Reinforcement Learning Algorithms [186.62294652057062]
メタラーニング強化学習アルゴリズムの手法を提案する。
学習アルゴリズムはドメインに依存しないため、トレーニング中に見えない新しい環境に一般化することができる。
従来の制御タスク、gridworld型タスク、atariゲームよりも優れた一般化性能を得る2つの学習アルゴリズムに注目した。
論文 参考訳(メタデータ) (2021-01-08T18:55:07Z) - A Systematic Review on Context-Aware Recommender Systems using Deep
Learning and Embeddings [0.0]
コンテキスト認識レコメンダシステム(Context-Aware Recommender Systems)が作成され、最先端の結果が得られた。
ディープラーニングと埋め込み技術は、コンテキスト認識レコメンダシステムを改善するために適用されています。
論文 参考訳(メタデータ) (2020-07-09T13:23:40Z) - Reinforcement Learning as Iterative and Amortised Inference [62.997667081978825]
我々は、この制御を推論フレームワークとして使用し、償却および反復推論に基づく新しい分類スキームを概説する。
この観点から、比較的探索されていないアルゴリズム設計空間の一部を特定できることを示す。
論文 参考訳(メタデータ) (2020-06-13T16:10:03Z) - Rethinking Few-Shot Image Classification: a Good Embedding Is All You
Need? [72.00712736992618]
メタトレーニングセット上で教師付きあるいは自己教師型表現を学習する単純なベースラインが、最先端の数ショット学習方法より優れていることを示す。
追加の増量は自己蒸留によって達成できる。
我々は,この発見が,画像分類ベンチマークとメタ学習アルゴリズムの役割を再考する動機となっていると考えている。
論文 参考訳(メタデータ) (2020-03-25T17:58:42Z) - Reward-Conditioned Policies [100.64167842905069]
模倣学習には、ほぼ最適の専門家データが必要である。
実演なしで指導的学習を通じて効果的な政策を学べるか?
政策探索の原則的手法として,このようなアプローチを導出する方法を示す。
論文 参考訳(メタデータ) (2019-12-31T18:07:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。