論文の概要: Context Uncertainty in Contextual Bandits with Applications to
Recommender Systems
- arxiv url: http://arxiv.org/abs/2202.00805v1
- Date: Tue, 1 Feb 2022 23:23:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-03 13:54:13.720162
- Title: Context Uncertainty in Contextual Bandits with Applications to
Recommender Systems
- Title(参考訳): コンテキスト帯域におけるコンテキスト不確かさとリコメンダシステムへの応用
- Authors: Hao Wang, Yifei Ma, Hao Ding, Yuyang Wang
- Abstract要約: 本稿では,リカレントサーベイネットワーク(REN)と呼ばれる新しいタイプのリカレントニューラルネットワークを提案する。
我々の理論的分析は,RENが学習表現に不確実性がある場合でも,速度-線形準最適後悔を保てることを示す。
我々の実証研究は、RENが合成および実世界のレコメンデーションデータセットに満足な長期報酬を得られることを示した。
- 参考スコア(独自算出の注目度): 16.597836265345634
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recurrent neural networks have proven effective in modeling sequential user
feedbacks for recommender systems. However, they usually focus solely on item
relevance and fail to effectively explore diverse items for users, therefore
harming the system performance in the long run. To address this problem, we
propose a new type of recurrent neural networks, dubbed recurrent exploration
networks (REN), to jointly perform representation learning and effective
exploration in the latent space. REN tries to balance relevance and exploration
while taking into account the uncertainty in the representations. Our
theoretical analysis shows that REN can preserve the rate-optimal sublinear
regret even when there exists uncertainty in the learned representations. Our
empirical study demonstrates that REN can achieve satisfactory long-term
rewards on both synthetic and real-world recommendation datasets, outperforming
state-of-the-art models.
- Abstract(参考訳): リカレントニューラルネットワークは,レコメンデータシステムの逐次ユーザフィードバックのモデル化に有効であることが証明されている。
しかし、通常はアイテムの関連性のみに重点を置いており、ユーザのための多様なアイテムを効果的に探索できないため、長期的にはシステムパフォーマンスを損なう。
この問題に対処するために,リカレント探索ネットワーク(REN)と呼ばれる新しいタイプのリカレントニューラルネットワークを提案する。
RENは、表現の不確実性を考慮して、妥当性と探索のバランスをとる。
我々の理論的分析は,RENが学習表現に不確実性がある場合でも,レート最適サブ線形後悔を保てることを示す。
我々の実証研究は、RENが合成および実世界のレコメンデーションデータセットに満足な長期報酬を得られることを示した。
関連論文リスト
- Evaluating Deep Neural Networks in Deployment (A Comparative and Replicability Study) [11.242083685224554]
ディープニューラルネットワーク(DNN)は、安全クリティカルなアプリケーションでますます利用されている。
デプロイにおけるDNNの信頼性を評価するために提案されている最近のアプローチについて検討する。
複製パッケージ上でこれらのアプローチの結果を実行して再現することは困難であり、それ自身以外のアーティファクト上でも実行することがさらに困難であることに気付きました。
論文 参考訳(メタデータ) (2024-07-11T17:58:12Z) - EASRec: Elastic Architecture Search for Efficient Long-term Sequential
Recommender Systems [82.76483989905961]
現在のSRS(Sequential Recommender Systems)は、計算とリソースの非効率に悩まされている。
我々は、効率的な長期シーケンスレコメンダシステム(EASRec)のための弾性アーキテクチャー探索を開発する。
EASRecは、入力データバッチから履歴情報を活用するデータ認識ゲートを導入し、レコメンデーションネットワークの性能を改善する。
論文 参考訳(メタデータ) (2024-02-01T07:22:52Z) - Visual Prompting Upgrades Neural Network Sparsification: A Data-Model Perspective [64.04617968947697]
より優れた重量空間を実現するために、新しいデータモデル共設計視点を導入する。
具体的には、提案したVPNフレームワークでニューラルネットワークのスパーシフィケーションをアップグレードするために、カスタマイズされたVisual Promptが実装されている。
論文 参考訳(メタデータ) (2023-12-03T13:50:24Z) - Ensuring User-side Fairness in Dynamic Recommender Systems [37.20838165555877]
本稿では,動的レコメンデーションシステムにおけるユーザ側の公正性を保証するための第一原理的な研究について述べる。
本稿では,FAir Dynamic rEcommender (FADE)を提案する。
FADEは、全体的なレコメンデーション性能を犠牲にすることなく、性能格差を効果的かつ効率的に低減することを示す。
論文 参考訳(メタデータ) (2023-08-29T22:03:17Z) - Comparative Analysis of Interval Reachability for Robust Implicit and
Feedforward Neural Networks [64.23331120621118]
我々は、暗黙的ニューラルネットワーク(INN)の堅牢性を保証するために、区間到達可能性分析を用いる。
INNは暗黙の方程式をレイヤとして使用する暗黙の学習モデルのクラスである。
提案手法は, INNに最先端の区間境界伝搬法を適用するよりも, 少なくとも, 一般的には, 有効であることを示す。
論文 参考訳(メタデータ) (2022-04-01T03:31:27Z) - WSLRec: Weakly Supervised Learning for Neural Sequential Recommendation
Models [24.455665093145818]
我々は、WSLRecと呼ばれる新しいモデルに依存しないトレーニング手法を提案し、3段階のフレームワーク(事前学習、トップ$k$マイニング、本質的、微調整)を採用する。
WSLRec は、BR や ItemCF のようなモデルフリーメソッドから、余分な弱い監督のモデルを事前訓練することで、不完全性の問題を解決すると同時に、最上位の$k のマイニングを活用して、微調整のための弱い監督の信頼性の高いユーザ・イテム関連を検査することで、不正確な問題を解消する。
論文 参考訳(メタデータ) (2022-02-28T08:55:12Z) - Recency Dropout for Recurrent Recommender Systems [23.210278548403185]
本稿では,リコメンデータシステムにおけるリコメンデーションバイアスを軽減するために,簡易かつ効果的なデータ拡張手法であるリコメンデーションドロップアウト手法を提案する。
シミュレーション実験,オフライン実験,大規模産業レコメンデーションプラットフォームでのライブ実験など,各種実験環境における遅延降下の有効性を実証する。
論文 参考訳(メタデータ) (2022-01-26T15:50:20Z) - Reinforcement Learning based Path Exploration for Sequential Explainable
Recommendation [57.67616822888859]
強化学習(TMER-RL)を活用した新しい時間的メタパスガイド型説明可能な勧告を提案する。
TMER-RLは, 動的知識グラフ上での動的ユーザ・イテム進化を逐次モデル化するために, 注意機構を持つ連続項目間の強化項目・イテムパスをモデル化する。
2つの実世界のデータセットに対するTMERの大規模な評価は、最近の強いベースラインと比較して最先端のパフォーマンスを示している。
論文 参考訳(メタデータ) (2021-11-24T04:34:26Z) - Improving Music Performance Assessment with Contrastive Learning [78.8942067357231]
本研究では,既存のMPAシステムを改善するための潜在的手法として,コントラスト学習について検討する。
畳み込みニューラルネットワークに適用された回帰タスクに適した重み付きコントラスト損失を導入する。
この結果から,MPA回帰タスクにおいて,コントラッシブ・ベースの手法がSoTA性能に適合し,超越できることが示唆された。
論文 参考訳(メタデータ) (2021-08-03T19:24:25Z) - Continual Learning in Recurrent Neural Networks [67.05499844830231]
リカレントニューラルネットワーク(RNN)を用いた逐次データ処理における連続学習手法の有効性を評価する。
RNNに弾性重み強化などの重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重
そこで本研究では,重み付け手法の性能が処理シーケンスの長さに直接的な影響を受けず,むしろ高動作メモリ要求の影響を受けていることを示す。
論文 参考訳(メタデータ) (2020-06-22T10:05:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。