Fugu-MT 論文翻訳(概要): Learning User Preferences in Non-Stationary Environments

論文の概要: Learning User Preferences in Non-Stationary Environments

arxiv url: http://arxiv.org/abs/2101.12506v1
Date: Fri, 29 Jan 2021 10:26:16 GMT
ステータス: 翻訳完了
システム内更新日: 2021-04-06 12:59:52.639086
Title: Learning User Preferences in Non-Stationary Environments
Title（参考訳）: 非定常環境におけるユーザ嗜好の学習
Authors: Wasim Huleihel and Soumyabrata Pal and Ofer Shayevitz
Abstract要約: オンラインノンステーショナリーレコメンデーションシステムのための新しいモデルを紹介します。好みが変化しない場合でも,我々のアルゴリズムが他の静的アルゴリズムよりも優れていることを示す。
参考スコア（独自算出の注目度）: 42.785926822853746
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Recommendation systems often use online collaborative filtering (CF) algorithms to identify items a given user likes over time, based on ratings that this user and a large number of other users have provided in the past. This problem has been studied extensively when users' preferences do not change over time (static case); an assumption that is often violated in practical settings. In this paper, we introduce a novel model for online non-stationary recommendation systems which allows for temporal uncertainties in the users' preferences. For this model, we propose a user-based CF algorithm, and provide a theoretical analysis of its achievable reward. Compared to related non-stationary multi-armed bandit literature, the main fundamental difficulty in our model lies in the fact that variations in the preferences of a certain user may affect the recommendations for other users severely. We also test our algorithm over real-world datasets, showing its effectiveness in real-world applications. One of the main surprising observations in our experiments is the fact our algorithm outperforms other static algorithms even when preferences do not change over time. This hints toward the general conclusion that in practice, dynamic algorithms, such as the one we propose, might be beneficial even in stationary environments.
Abstract（参考訳）: レコメンデーションシステムは、オンラインコラボレーティブ・フィルタリング(CF)アルゴリズムを使用して、ユーザーが過去に提供したレーティングに基づいて、あるユーザが好むアイテムを時間とともに識別する。この問題は、ユーザの好みが時間とともに変化しない場合(静的の場合)に広く研究されてきた。本稿では,ユーザの嗜好に時間的不確実性をもたらすオンライン非定常レコメンデーションシステムのための新しいモデルを提案する。本モデルでは,ユーザベースのCFアルゴリズムを提案し,その達成可能な報酬の理論的解析を行う。関連する非定常的マルチアームバンディット文学と比較して、本モデルの主な難しさは、あるユーザの好みの変化が他のユーザの推薦に深刻な影響を及ぼすという事実にある。また、実世界のデータセット上でアルゴリズムをテストし、実世界のアプリケーションでその効果を示す。我々の実験で最も驚くべき観察の1つは、我々のアルゴリズムが時間とともに好みが変化しない場合でも、他の静的アルゴリズムよりも優れているという事実である。これは、実際に我々が提案したような動的アルゴリズムは静止環境においても有益である、という一般的な結論を示唆している。

関連論文リスト

Online Clustering of Dueling Bandits [59.09590979404303]
本稿では、優先フィードバックに基づく協調的な意思決定を可能にするために、最初の「デュエルバンディットアルゴリズムのクラスタリング」を導入する。本稿では,(1)ユーザ報酬関数をコンテキストベクトルの線形関数としてモデル化する線形デューリング帯域のクラスタリング(COLDB)と,(2)ニューラルネットワークを用いて複雑な非線形ユーザ報酬関数をモデル化するニューラルデューリング帯域のクラスタリング(CONDB)の2つの新しいアルゴリズムを提案する。
論文参考訳（メタデータ） (2025-02-04T07:55:41Z)
When Online Algorithms Influence the Environment: A Dynamical Systems Analysis of the Unintended Consequences [5.4209739979186295]
オンラインアルゴリズムが学習環境に与える影響を分析する。提案アルゴリズムは,このミスマッチの存在下で個体群の嗜好を学習できる場合,利用者の嗜好に類似性をもたらすことを示す。
論文参考訳（メタデータ） (2024-11-21T06:47:53Z)
Quantifying User Coherence: A Unified Framework for Cross-Domain Recommendation Analysis [69.37718774071793]
本稿では,レコメンデーションシステムを理解するための新しい情報理論手法を提案する。 9つのデータセットで7つのレコメンデーションアルゴリズムを評価し、測定値と標準的なパフォーマンス指標の関係を明らかにする。
論文参考訳（メタデータ） (2024-10-03T13:02:07Z)
Algorithmic Drift: A Simulation Framework to Study the Effects of Recommender Systems on User Preferences [7.552217586057245]
本稿では,長期シナリオにおけるユーザ-リコメンダ間のインタラクションを模倣するシミュレーションフレームワークを提案する。本稿では,ユーザの嗜好に対するアルゴリズムの影響を定量化する2つの新しい指標について紹介する。
論文参考訳（メタデータ） (2024-09-24T21:54:22Z)
Federated Privacy-preserving Collaborative Filtering for On-Device Next App Prediction [52.16923290335873]
本稿では,モバイルデバイス使用時の次のアプリの起動を予測するための新しいSeqMFモデルを提案する。古典行列分解モデルの構造を修正し、学習手順を逐次学習に更新する。提案手法のもうひとつの要素は,ユーザからリモートサーバへの送信データの保護を保証する,新たなプライバシメカニズムである。
論文参考訳（メタデータ） (2023-02-05T10:29:57Z)
Modeling Dynamic User Preference via Dictionary Learning for Sequential Recommendation [133.8758914874593]
ユーザの好みのダイナミックさを捉えることは、ユーザの将来の行動を予測する上で非常に重要です。浅いものも深いものも含む、既存のレコメンデーションアルゴリズムの多くは、このようなダイナミクスを独立してモデル化することが多い。本稿では、ユーザのシーケンシャルな振る舞いを、ユーザ好みの潜伏した空間に埋め込むことの問題について考察する。
論文参考訳（メタデータ） (2022-04-02T03:23:46Z)
Top-N Recommendation with Counterfactual User Preference Simulation [26.597102553608348]
ユーザーランキングに基づく好みの学習を目的としたTop-Nレコメンデーションは、長い間、広範囲のアプリケーションにおいて基本的な問題だった。本稿では,データ不足問題に対処するため,因果推論フレームワーク内での推薦タスクの再構築を提案する。
論文参考訳（メタデータ） (2021-09-02T14:28:46Z)
Control Variates for Slate Off-Policy Evaluation [112.35528337130118]
多次元動作を伴うバッチ化されたコンテキスト帯域データから政治外評価の問題について検討する。我々は, PIと自己正規化PIの双方に対して, リスク改善を保証した新しい推定器を得る。
論文参考訳（メタデータ） (2021-06-15T06:59:53Z)
Non-Stationary Latent Bandits [68.21614490603758]
非定常ユーザに対して高速なパーソナライズのための実践的アプローチを提案する。鍵となる考え方は、この問題を潜在バンディットとみなすことであり、ユーザ行動のプロトタイプモデルがオフラインで学習され、ユーザの潜伏状態がオンラインで推論される。我々は,非定常潜伏帯域における後悔最小化のためのトンプソンサンプリングアルゴリズムを提案し,それらを解析し,実世界のデータセット上で評価する。
論文参考訳（メタデータ） (2020-12-01T10:31:57Z)
Optimizing Offer Sets in Sub-Linear Time [5.027714423258537]
本稿では,各項目数のサブ線形時間内で動作するパーソナライズされたオファーセット最適化アルゴリズムを提案する。私たちのアルゴリズムは完全にデータ駆動で、ユーザーのサンプルに依存します。
論文参考訳（メタデータ） (2020-11-17T13:02:56Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。