論文の概要: Adaptive Neural Architectures for Recommender Systems
- arxiv url: http://arxiv.org/abs/2012.00743v1
- Date: Wed, 11 Nov 2020 09:43:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-26 23:40:20.137331
- Title: Adaptive Neural Architectures for Recommender Systems
- Title(参考訳): レコメンダシステムのための適応型ニューラルネットワークアーキテクチャ
- Authors: Dimitrios Rafailidis, Stefanos Antaris
- Abstract要約: 本稿では,ニューラルアーキテクチャの固定化による主な制約について検討し,推薦のための深層強化学習戦略を提案する。
我々は、強化学習を通じて各ユーザのフィードバックに基づいて、最高のニューラルアーキテクチャを探すためのガイドラインを提供する。
- 参考スコア(独自算出の注目度): 4.568777157687959
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep learning has proved an effective means to capture the non-linear
associations of user preferences. However, the main drawback of existing deep
learning architectures is that they follow a fixed recommendation strategy,
ignoring users' real time-feedback. Recent advances of deep reinforcement
strategies showed that recommendation policies can be continuously updated
while users interact with the system. In doing so, we can learn the optimal
policy that fits to users' preferences over the recommendation sessions. The
main drawback of deep reinforcement strategies is that are based on predefined
and fixed neural architectures. To shed light on how to handle this issue, in
this study we first present deep reinforcement learning strategies for
recommendation and discuss the main limitations due to the fixed neural
architectures. Then, we detail how recent advances on progressive neural
architectures are used for consecutive tasks in other research domains.
Finally, we present the key challenges to fill the gap between deep
reinforcement learning and adaptive neural architectures. We provide guidelines
for searching for the best neural architecture based on each user feedback via
reinforcement learning, while considering the prediction performance on
real-time recommendations and the model complexity.
- Abstract(参考訳): ディープラーニングは、ユーザの好みの非線形関連を捉える効果的な手段であることが証明されている。
しかし、既存のディープラーニングアーキテクチャの主な欠点は、ユーザのリアルタイムフィードバックを無視して、一定の推奨戦略に従うことだ。
近年の深層強化戦略の進歩により,ユーザがシステムと対話しながらレコメンデーションポリシーを継続的に更新できることがわかった。
そうすることで、レコメンデーションセッションよりもユーザの好みに合った最適なポリシーを学ぶことができます。
深い強化戦略の主な欠点は、事前定義された固定されたニューラルネットワークアーキテクチャに基づいていることである。
この問題に対処するために,我々はまず推奨のための深層強化学習戦略を提示し,固定されたニューラルネットワークアーキテクチャによる主な限界について議論する。
そして、他の研究領域における連続的なタスクに、最近の進歩的ニューラルアーキテクチャの進歩がどのように使われているのかを詳述する。
最後に、深層強化学習と適応型ニューラルアーキテクチャのギャップを埋めるための重要な課題を示す。
強化学習による各ユーザからのフィードバックに基づいて最適なニューラルアーキテクチャを探索するためのガイドラインを提示し,リアルタイムレコメンデーションの予測性能とモデルの複雑さを考察した。
関連論文リスト
- CaAdam: Improving Adam optimizer using connection aware methods [0.0]
我々はAdamにインスパイアされた新しい手法を導入し、収束速度を高め、損失関数の最小化を実現する。
Adamを含む従来のプロキシは、アーキテクチャの詳細を考慮せずに、ニューラルネットワーク全体で均一またはグローバルに調整された学習率を適用している。
我々のアルゴリズムであるCaAdamは、アーキテクチャ情報を慎重に設計することで、接続対応の最適化を導入することで、見落としている領域を探索する。
論文 参考訳(メタデータ) (2024-10-31T17:59:46Z) - Hierarchical Reinforcement Learning for Temporal Abstraction of Listwise Recommendation [51.06031200728449]
我々はmccHRLと呼ばれる新しいフレームワークを提案し、リストワイドレコメンデーションにおける時間的抽象化のレベルを異なるものにする。
階層的な枠組みの中では、ハイレベルエージェントがユーザ知覚の進化を研究し、低レベルエージェントがアイテム選択ポリシーを作成している。
その結果,本手法による性能改善は,いくつかのよく知られたベースラインと比較して有意な結果が得られた。
論文 参考訳(メタデータ) (2024-09-11T17:01:06Z) - GI-NAS: Boosting Gradient Inversion Attacks through Adaptive Neural Architecture Search [45.57494859267399]
グラディエント・インバージョン・アタック (Gradient Inversion Attacks) は、Federated Learning (FL) システムの伝達勾配を反転させ、ローカルクライアントの機密データを再構築する。
勾配反転法の大半は明示的な事前知識に大きく依存しており、現実的なシナリオでは利用できないことが多い。
本稿では,ニューラルネットワークを適応的に探索し,ニューラルネットワークの背後にある暗黙の先行情報をキャプチャするニューラルアーキテクチャ探索(GI-NAS)を提案する。
論文 参考訳(メタデータ) (2024-05-31T09:29:43Z) - Neural Architecture Search for Speech Emotion Recognition [72.1966266171951]
本稿では,SERモデルの自動構成にニューラルアーキテクチャサーチ(NAS)技術を適用することを提案する。
NASはモデルパラメータサイズを維持しながらSER性能(54.89%から56.28%)を向上させることができることを示す。
論文 参考訳(メタデータ) (2022-03-31T10:16:10Z) - Reinforcement Learning based Path Exploration for Sequential Explainable
Recommendation [57.67616822888859]
強化学習(TMER-RL)を活用した新しい時間的メタパスガイド型説明可能な勧告を提案する。
TMER-RLは, 動的知識グラフ上での動的ユーザ・イテム進化を逐次モデル化するために, 注意機構を持つ連続項目間の強化項目・イテムパスをモデル化する。
2つの実世界のデータセットに対するTMERの大規模な評価は、最近の強いベースラインと比較して最先端のパフォーマンスを示している。
論文 参考訳(メタデータ) (2021-11-24T04:34:26Z) - Adversarial Robustness of Deep Learning: Theory, Algorithms, and
Applications [27.033174829788404]
本チュートリアルは,ディープラーニングの敵対的堅牢性の基礎を紹介することを目的としている。
我々は、ディープニューラルネットワーク(DNN)の敵攻撃と堅牢性検証における最先端技術を強調します。
深層学習モデルの堅牢性を改善するための効果的な対策も導入する。
論文 参考訳(メタデータ) (2021-08-24T00:08:33Z) - Generative Adversarial Reward Learning for Generalized Behavior Tendency
Inference [71.11416263370823]
ユーザの行動嗜好モデルのための生成的逆強化学習を提案する。
我々のモデルは,差別的アクター批判ネットワークとWasserstein GANに基づいて,ユーザの行動から報酬を自動的に学習することができる。
論文 参考訳(メタデータ) (2021-05-03T13:14:25Z) - A Survey on Neural Recommendation: From Collaborative Filtering to
Content and Context Enriched Recommendation [70.69134448863483]
レコメンデーションの研究は、ニューラルネットワークに基づく新しいレコメンダーモデルの発明にシフトした。
近年,神経リコメンデータモデルの開発が著しい進展を遂げている。
論文 参考訳(メタデータ) (2021-04-27T08:03:52Z) - Hybrid Model with Time Modeling for Sequential Recommender Systems [0.15229257192293202]
Booking.comはWSDM WebTour 2021 Challengeを組織した。
レコメンダシステムのための最先端のディープラーニングアーキテクチャをテストするために,いくつかの実験を行った。
実験結果から,narmの改善は他のベンチマーク手法よりも優れていた。
論文 参考訳(メタデータ) (2021-03-07T19:28:22Z) - Generative Inverse Deep Reinforcement Learning for Online Recommendation [62.09946317831129]
オンラインレコメンデーションのための新しい逆強化学習手法InvRecを提案する。
InvRecは、オンラインレコメンデーションのために、ユーザの行動から報酬関数を自動的に抽出する。
論文 参考訳(メタデータ) (2020-11-04T12:12:25Z) - Attention-Based Deep Learning Framework for Human Activity Recognition
with User Adaptation [5.629161809575013]
センサに基づく人間活動認識(HAR)は、センサ生成時系列データに基づいて人の行動を予測する必要がある。
純粋に注意に基づくメカニズムに基づく新しいディープラーニングフレームワーク、algnameを提案する。
提案した注目に基づくアーキテクチャは,従来のアプローチよりもはるかに強力であることを示す。
論文 参考訳(メタデータ) (2020-06-06T09:26:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。