論文の概要: Theoretical Modeling of the Iterative Properties of User Discovery in a
Collaborative Filtering Recommender System
- arxiv url: http://arxiv.org/abs/2008.13526v1
- Date: Fri, 21 Aug 2020 20:30:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-26 20:53:32.158472
- Title: Theoretical Modeling of the Iterative Properties of User Discovery in a
Collaborative Filtering Recommender System
- Title(参考訳): 協調フィルタリング推薦システムにおけるユーザ発見の反復的特性の理論的モデル化
- Authors: Sami Khenissi and Mariem Boujelbene and Olfa Nasraoui
- Abstract要約: レコメンデータシステムにおけるクローズドなフィードバックループは、さまざまな種類のバイアスを引き起こす可能性がある一般的な設定である。
本稿では,フィードバックループ設定内で動作するレコメンデータシステムの様々なコンポーネントの進化をモデル化するための理論的枠組みを提案する。
本研究は,フィードバックループの効果を定量化し,人工知能と機械学習アルゴリズムを設計するための理論的基礎を定めている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The closed feedback loop in recommender systems is a common setting that can
lead to different types of biases. Several studies have dealt with these biases
by designing methods to mitigate their effect on the recommendations. However,
most existing studies do not consider the iterative behavior of the system
where the closed feedback loop plays a crucial role in incorporating different
biases into several parts of the recommendation steps.
We present a theoretical framework to model the asymptotic evolution of the
different components of a recommender system operating within a feedback loop
setting, and derive theoretical bounds and convergence properties on
quantifiable measures of the user discovery and blind spots. We also validate
our theoretical findings empirically using a real-life dataset and empirically
test the efficiency of a basic exploration strategy within our theoretical
framework.
Our findings lay the theoretical basis for quantifying the effect of feedback
loops and for designing Artificial Intelligence and machine learning algorithms
that explicitly incorporate the iterative nature of feedback loops in the
machine learning and recommendation process.
- Abstract(参考訳): レコメンダシステムのクローズドフィードバックループは、異なるタイプのバイアスにつながる一般的な設定である。
これらのバイアスに対するいくつかの研究は、レコメンデーションへの影響を緩和する手法を設計することで対処している。
しかし、既存の研究の多くは、クローズドフィードバックループが様々なバイアスをレコメンデーションステップのいくつかの部分に組み込む上で重要な役割を果たすシステムの反復的な振る舞いを考慮していない。
本稿では,フィードバックループ内で動作するレコメンダシステムの異なるコンポーネントの漸近的進化をモデル化する理論的枠組みを提案し,ユーザ発見と盲点の定量化に関する理論的境界と収束特性を導出する。
また,実生活データセットを用いて実験的に理論的知見を検証し,理論的枠組みにおける基本探索戦略の効率を実証的に検証した。
本研究は,フィードバックループの効果の定量化と,機械学習とレコメンデーションプロセスにおけるフィードバックループの反復性を明確に組み込んだ人工知能と機械学習アルゴリズムの設計に関する理論的基礎を定めている。
関連論文リスト
- Learning Recommender Systems with Soft Target: A Decoupled Perspective [49.83787742587449]
そこで本研究では,ソフトラベルを活用することで,目的を2つの側面として捉えるために,分離されたソフトラベル最適化フレームワークを提案する。
本稿では,ラベル伝搬アルゴリズムをモデル化したソフトラベル生成アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-09T04:20:15Z) - Optimizing Circuit Reusing and its Application in Randomized Benchmarking [5.783105931700547]
量子学習タスクは、ランダムにサンプリングされた量子回路を利用して未知のシステムを特徴づける。
回路再利用 (circuit reusing) と呼ばれる効率的な手法では、各回路を複数回実行することで、新しい回路を実装するよりもコストを削減できる。
本研究では,所定の実験コストに対する測定結果の分散を最小化する最適再利用パラメータについて検討する。
論文 参考訳(メタデータ) (2024-07-22T12:18:12Z) - Top-K Pairwise Ranking: Bridging the Gap Among Ranking-Based Measures for Multi-Label Classification [120.37051160567277]
本稿では,Top-K Pairwise Ranking(TKPR)という新しい尺度を提案する。
一連の分析により、TKPRは既存のランキングベースの尺度と互換性があることが示されている。
一方,データ依存縮約法という新しい手法に基づいて,提案手法の急激な一般化を確立する。
論文 参考訳(メタデータ) (2024-07-09T09:36:37Z) - Iterative Preference Learning from Human Feedback: Bridging Theory and Practice for RLHF under KL-Constraint [56.74058752955209]
本稿では,RLHFによる強化学習を用いた生成モデルのアライメント過程について検討する。
まず、オフラインPPOやオフラインDPOのような既存の一般的な手法の主な課題を、環境の戦略的探索に欠如していると認識する。
有限サンプル理論保証を用いた効率的なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-12-18T18:58:42Z) - Exploring Popularity Bias in Session-based Recommendation [0.6798775532273751]
セッションベースの設定と適応確率計算に分析を拡張し、セッションベースのレコメンデーションタスクの独特な特性に適応する。
本研究では、異なるデータセット上での確率分布と異なる階層化手法について検討し、確率関連特性が実際にデータセット固有のものであることを見出した。
論文 参考訳(メタデータ) (2023-12-13T02:48:35Z) - A PAC-Bayesian Perspective on the Interpolating Information Criterion [54.548058449535155]
補間系の性能に影響を及ぼす要因を特徴付ける一般モデルのクラスに対して,PAC-Bayes境界がいかに得られるかを示す。
オーバーパラメータ化モデルに対するテスト誤差が、モデルとパラメータの初期化スキームの組み合わせによって課される暗黙の正規化の品質に依存するかの定量化を行う。
論文 参考訳(メタデータ) (2023-11-13T01:48:08Z) - Provable Reward-Agnostic Preference-Based Reinforcement Learning [61.39541986848391]
PbRL(Preference-based Reinforcement Learning)は、RLエージェントが、軌道上のペアワイドな嗜好に基づくフィードバックを用いてタスクを最適化することを学ぶパラダイムである。
本稿では,隠れた報酬関数の正確な学習を可能にする探索軌道を求める理論的報酬非依存PbRLフレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-29T15:00:09Z) - CausPref: Causal Preference Learning for Out-of-Distribution
Recommendation [36.22965012642248]
現在のレコメンデータシステムは、現実的なシナリオにおけるユーザやアイテムの配布シフトに対して、依然として脆弱である。
本稿では,推奨特化DAG学習者を因果選好に基づく推薦フレームワークCausPrefに組み込むことを提案する。
当社のアプローチは、アウト・オブ・ディストリビューション・セッティングのタイプにおいて、ベンチマークモデルを大幅に上回っている。
論文 参考訳(メタデータ) (2022-02-08T16:42:03Z) - Top-N Recommendation with Counterfactual User Preference Simulation [26.597102553608348]
ユーザーランキングに基づく好みの学習を目的としたTop-Nレコメンデーションは、長い間、広範囲のアプリケーションにおいて基本的な問題だった。
本稿では,データ不足問題に対処するため,因果推論フレームワーク内での推薦タスクの再構築を提案する。
論文 参考訳(メタデータ) (2021-09-02T14:28:46Z) - Learning the Truth From Only One Side of the Story [58.65439277460011]
一般化線形モデルに焦点をあて、このサンプリングバイアスを調整しなければ、モデルは準最適に収束するか、あるいは最適解に収束しないかもしれないことを示す。
理論的保証を伴って適応的なアプローチを提案し、いくつかの既存手法を実証的に上回っていることを示す。
論文 参考訳(メタデータ) (2020-06-08T18:20:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。