論文の概要: WSLRec: Weakly Supervised Learning for Neural Sequential Recommendation
Models
- arxiv url: http://arxiv.org/abs/2202.13616v1
- Date: Mon, 28 Feb 2022 08:55:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-01 18:28:16.264422
- Title: WSLRec: Weakly Supervised Learning for Neural Sequential Recommendation
Models
- Title(参考訳): wslrec: ニューラルネットワークの逐次レコメンデーションモデルのための弱い教師付き学習
- Authors: Jingwei Zhuo, Bin Liu, Xiang Li, Han Zhu, Xiaoqiang Zhu
- Abstract要約: 我々は、WSLRecと呼ばれる新しいモデルに依存しないトレーニング手法を提案し、3段階のフレームワーク(事前学習、トップ$k$マイニング、本質的、微調整)を採用する。
WSLRec は、BR や ItemCF のようなモデルフリーメソッドから、余分な弱い監督のモデルを事前訓練することで、不完全性の問題を解決すると同時に、最上位の$k のマイニングを活用して、微調整のための弱い監督の信頼性の高いユーザ・イテム関連を検査することで、不正確な問題を解消する。
- 参考スコア(独自算出の注目度): 24.455665093145818
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning the user-item relevance hidden in implicit feedback data plays an
important role in modern recommender systems. Neural sequential recommendation
models, which formulates learning the user-item relevance as a sequential
classification problem to distinguish items in future behaviors from others
based on the user's historical behaviors, have attracted a lot of interest in
both industry and academic due to their substantial practical value. Though
achieving many practical successes, we argue that the intrinsic {\bf
incompleteness} and {\bf inaccuracy} of user behaviors in implicit feedback
data is ignored and conduct preliminary experiments for supporting our claims.
Motivated by the observation that model-free methods like behavioral
retargeting (BR) and item-based collaborative filtering (ItemCF) hit different
parts of the user-item relevance compared to neural sequential recommendation
models, we propose a novel model-agnostic training approach called WSLRec,
which adopts a three-stage framework: pre-training, top-$k$ mining, and
fine-tuning. WSLRec resolves the incompleteness problem by pre-training models
on extra weak supervisions from model-free methods like BR and ItemCF, while
resolves the inaccuracy problem by leveraging the top-$k$ mining to screen out
reliable user-item relevance from weak supervisions for fine-tuning.
Experiments on two benchmark datasets and online A/B tests verify the
rationality of our claims and demonstrate the effectiveness of WSLRec.
- Abstract(参考訳): 暗黙のフィードバックデータに隠されたユーザ関連性を学ぶことは、現代のレコメンデータシステムにおいて重要な役割を果たす。
ニューラルネットワークのシーケンシャルレコメンデーションモデルは,ユーザの過去の行動に基づいて,将来の行動の項目を他者と区別するシーケンシャルな分類問題としてユーザ関連を学習し,その実質的な価値から,産業と学術の両方に大きな関心を惹きつけている。
多くの実践的な成功をおさめながら、暗黙的なフィードバックデータにおけるユーザ行動の内在的不完全性と不完全性は無視され、我々の主張を支持する予備実験が実施される。
行動的リターゲティング(BR)やアイテムベース協調フィルタリング(ItemCF)といったモデルフリー手法が,ニューラルシーケンシャルレコメンデーションモデルと比較して,ユーザとイテムの関係の異なる部分に到達しているという観察に触発されて,WSLRecと呼ばれる新しいモデル非依存トレーニングアプローチを提案する。
WSLRec は、BR や ItemCF のようなモデルフリーな手法から、余分な弱い監督のモデルを事前訓練することで、不完全性の問題を解決すると同時に、最上位の$k のマイニングを活用して、微調整のための弱い監督の信頼性の高いユーザ・イテム関連を検査することで、不正確性問題を解決する。
2つのベンチマークデータセットとオンラインA/Bテストの実験は、我々の主張の合理性を検証し、WSLRecの有効性を実証する。
関連論文リスト
- Alternate Preference Optimization for Unlearning Factual Knowledge in Large Language Models [2.0962367975513496]
機械学習は、特定のトレーニングデータの影響をモデルから効率的に排除することを目的としている。
既存の未学習手法は, 無視集合に関連する応答を抑制するために, 負のフィードバックのみに頼っている。
本稿では,AltPO(Alternate Preference Optimization)と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2024-09-20T13:05:07Z) - Weak Reward Model Transforms Generative Models into Robust Causal Event Extraction Systems [17.10762463903638]
我々は人的評価を近似するために評価モデルを訓練し、高い合意を得る。
そこで本研究では,アノテートデータの一部を用いて評価モデルを訓練する弱強監督手法を提案する。
論文 参考訳(メタデータ) (2024-06-26T10:48:14Z) - Getting More Juice Out of the SFT Data: Reward Learning from Human Demonstration Improves SFT for LLM Alignment [65.15914284008973]
我々は、報酬モデルと政策モデルを同時に構築するために、逆強化学習(IRL)技術を活用することを提案する。
提案アルゴリズムはIRL問題の定常解に収束することを示す。
その結果,アライメントプロセス全体を通じて報酬学習を活用することは有益であることが示唆された。
論文 参考訳(メタデータ) (2024-05-28T07:11:05Z) - Noisy Correspondence Learning with Self-Reinforcing Errors Mitigation [63.180725016463974]
クロスモーダル検索は、実際は精力的な、十分に整合した大規模データセットに依存している。
我々は、新しい雑音対応学習フレームワーク、textbfSelf-textbfReinforcing textbfErrors textbfMitigation(SREM)を導入する。
論文 参考訳(メタデータ) (2023-12-27T09:03:43Z) - TDCGL: Two-Level Debiased Contrastive Graph Learning for Recommendation [1.5836776102398225]
実世界におけるKGの実体の長期分布とノイズ問題により、アイテム・エンティリティ依存関係は真の特性を反映しない。
我々はTDCL(Two-Level Debiased Contrastive Learning)を設計し、知識グラフに展開する。
オープンソースデータセットに関する検討実験により,提案手法は優れたアンチノイズ性能を有することが示された。
論文 参考訳(メタデータ) (2023-10-01T03:56:38Z) - Effective and Efficient Training for Sequential Recommendation using
Recency Sampling [91.02268704681124]
本稿では,新しいRecency-based Smpling of Sequencesトレーニング目標を提案する。
提案手法により拡張されたモデルにより,最先端のBERT4Recに近い性能が得られることを示す。
論文 参考訳(メタデータ) (2022-07-06T13:06:31Z) - Top-N Recommendation with Counterfactual User Preference Simulation [26.597102553608348]
ユーザーランキングに基づく好みの学習を目的としたTop-Nレコメンデーションは、長い間、広範囲のアプリケーションにおいて基本的な問題だった。
本稿では,データ不足問題に対処するため,因果推論フレームワーク内での推薦タスクの再構築を提案する。
論文 参考訳(メタデータ) (2021-09-02T14:28:46Z) - Contrastive Self-supervised Sequential Recommendation with Robust
Augmentation [101.25762166231904]
Sequential Recommendation Describes a set of technique to model dynamic user behavior to order to predict future interaction in sequence user data。
データスパーシリティやノイズの多いデータなど、古くて新しい問題はまだ残っている。
逐次レコメンデーション(CoSeRec)のためのコントラスト型自己監督学習を提案する。
論文 参考訳(メタデータ) (2021-08-14T07:15:25Z) - S^3-Rec: Self-Supervised Learning for Sequential Recommendation with
Mutual Information Maximization [104.87483578308526]
本稿では,シーケンスレコメンデーションのための自己改善学習のためのモデルS3-Recを提案する。
そこで本稿では,属性,項目,サブシーケンス,シーケンス間の相関関係を学習するために,4つの補助的自己教師対象を考案する。
6つの実世界のデータセットで実施された大規模な実験は、既存の最先端手法よりも提案手法が優れていることを示す。
論文 参考訳(メタデータ) (2020-08-18T11:44:10Z) - Self-Supervised Reinforcement Learning for Recommender Systems [77.38665506495553]
逐次リコメンデーションタスクのための自己指導型強化学習を提案する。
提案手法は,2つの出力層を持つ標準レコメンデーションモデルを強化する。
このようなアプローチに基づいて、自己監督型Q-ラーニング(SQN)と自己監督型アクター・クライブ(SAC)という2つのフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-10T11:18:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。