論文の概要: Learning User Preferences in Non-Stationary Environments
- arxiv url: http://arxiv.org/abs/2101.12506v1
- Date: Fri, 29 Jan 2021 10:26:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-06 12:59:52.639086
- Title: Learning User Preferences in Non-Stationary Environments
- Title(参考訳): 非定常環境におけるユーザ嗜好の学習
- Authors: Wasim Huleihel and Soumyabrata Pal and Ofer Shayevitz
- Abstract要約: オンラインノンステーショナリーレコメンデーションシステムのための新しいモデルを紹介します。
好みが変化しない場合でも,我々のアルゴリズムが他の静的アルゴリズムよりも優れていることを示す。
- 参考スコア(独自算出の注目度): 42.785926822853746
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recommendation systems often use online collaborative filtering (CF)
algorithms to identify items a given user likes over time, based on ratings
that this user and a large number of other users have provided in the past.
This problem has been studied extensively when users' preferences do not change
over time (static case); an assumption that is often violated in practical
settings. In this paper, we introduce a novel model for online non-stationary
recommendation systems which allows for temporal uncertainties in the users'
preferences. For this model, we propose a user-based CF algorithm, and provide
a theoretical analysis of its achievable reward. Compared to related
non-stationary multi-armed bandit literature, the main fundamental difficulty
in our model lies in the fact that variations in the preferences of a certain
user may affect the recommendations for other users severely. We also test our
algorithm over real-world datasets, showing its effectiveness in real-world
applications. One of the main surprising observations in our experiments is the
fact our algorithm outperforms other static algorithms even when preferences do
not change over time. This hints toward the general conclusion that in
practice, dynamic algorithms, such as the one we propose, might be beneficial
even in stationary environments.
- Abstract(参考訳): レコメンデーションシステムは、オンラインコラボレーティブ・フィルタリング(CF)アルゴリズムを使用して、ユーザーが過去に提供したレーティングに基づいて、あるユーザが好むアイテムを時間とともに識別する。
この問題は、ユーザの好みが時間とともに変化しない場合(静的の場合)に広く研究されてきた。
本稿では,ユーザの嗜好に時間的不確実性をもたらすオンライン非定常レコメンデーションシステムのための新しいモデルを提案する。
本モデルでは,ユーザベースのCFアルゴリズムを提案し,その達成可能な報酬の理論的解析を行う。
関連する非定常的マルチアームバンディット文学と比較して、本モデルの主な難しさは、あるユーザの好みの変化が他のユーザの推薦に深刻な影響を及ぼすという事実にある。
また、実世界のデータセット上でアルゴリズムをテストし、実世界のアプリケーションでその効果を示す。
我々の実験で最も驚くべき観察の1つは、我々のアルゴリズムが時間とともに好みが変化しない場合でも、他の静的アルゴリズムよりも優れているという事実である。
これは、実際に我々が提案したような動的アルゴリズムは静止環境においても有益である、という一般的な結論を示唆している。
関連論文リスト
- Countering Mainstream Bias via End-to-End Adaptive Local Learning [17.810760161534247]
CF(Collaborative Filtering)ベースのレコメンデーションは、主流のバイアスに悩まされる。
主流ユーザとニッチユーザの両方に高品質なレコメンデーションを提供するために,新しいエンドツーエンド適応型ローカル学習フレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-13T03:17:33Z) - Meta-Learning with Adaptive Weighted Loss for Imbalanced Cold-Start
Recommendation [4.379304291229695]
本稿では,勾配に基づくメタラーニングに基づく新しいシーケンシャルレコメンデーションフレームワークを提案する。
私たちの仕事は、コールドスタートシーケンシャルなレコメンデーションシナリオにおいて、不均衡な評価の影響に最初に取り組みます。
論文 参考訳(メタデータ) (2023-02-28T15:18:42Z) - Federated Privacy-preserving Collaborative Filtering for On-Device Next
App Prediction [52.16923290335873]
本稿では,モバイルデバイス使用時の次のアプリの起動を予測するための新しいSeqMFモデルを提案する。
古典行列分解モデルの構造を修正し、学習手順を逐次学習に更新する。
提案手法のもうひとつの要素は,ユーザからリモートサーバへの送信データの保護を保証する,新たなプライバシメカニズムである。
論文 参考訳(メタデータ) (2023-02-05T10:29:57Z) - Latent User Intent Modeling for Sequential Recommenders [92.66888409973495]
逐次リコメンデータモデルは、プラットフォーム上での氏のインタラクション履歴に基づいて、ユーザが次に対話する可能性のあるアイテムを予測することを学習する。
しかし、ほとんどのシーケンシャルなレコメンデータは、ユーザの意図に対する高いレベルの理解を欠いている。
したがって、インテントモデリングはユーザー理解と長期ユーザーエクスペリエンスの最適化に不可欠である。
論文 参考訳(メタデータ) (2022-11-17T19:00:24Z) - Modeling Dynamic User Preference via Dictionary Learning for Sequential
Recommendation [133.8758914874593]
ユーザの好みのダイナミックさを捉えることは、ユーザの将来の行動を予測する上で非常に重要です。
浅いものも深いものも含む、既存のレコメンデーションアルゴリズムの多くは、このようなダイナミクスを独立してモデル化することが多い。
本稿では、ユーザのシーケンシャルな振る舞いを、ユーザ好みの潜伏した空間に埋め込むことの問題について考察する。
論文 参考訳(メタデータ) (2022-04-02T03:23:46Z) - Top-N Recommendation with Counterfactual User Preference Simulation [26.597102553608348]
ユーザーランキングに基づく好みの学習を目的としたTop-Nレコメンデーションは、長い間、広範囲のアプリケーションにおいて基本的な問題だった。
本稿では,データ不足問題に対処するため,因果推論フレームワーク内での推薦タスクの再構築を提案する。
論文 参考訳(メタデータ) (2021-09-02T14:28:46Z) - Control Variates for Slate Off-Policy Evaluation [112.35528337130118]
多次元動作を伴うバッチ化されたコンテキスト帯域データから政治外評価の問題について検討する。
我々は, PIと自己正規化PIの双方に対して, リスク改善を保証した新しい推定器を得る。
論文 参考訳(メタデータ) (2021-06-15T06:59:53Z) - Non-Stationary Latent Bandits [68.21614490603758]
非定常ユーザに対して高速なパーソナライズのための実践的アプローチを提案する。
鍵となる考え方は、この問題を潜在バンディットとみなすことであり、ユーザ行動のプロトタイプモデルがオフラインで学習され、ユーザの潜伏状態がオンラインで推論される。
我々は,非定常潜伏帯域における後悔最小化のためのトンプソンサンプリングアルゴリズムを提案し,それらを解析し,実世界のデータセット上で評価する。
論文 参考訳(メタデータ) (2020-12-01T10:31:57Z) - Optimizing Offer Sets in Sub-Linear Time [5.027714423258537]
本稿では,各項目数のサブ線形時間内で動作するパーソナライズされたオファーセット最適化アルゴリズムを提案する。
私たちのアルゴリズムは完全にデータ駆動で、ユーザーのサンプルに依存します。
論文 参考訳(メタデータ) (2020-11-17T13:02:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。