論文の概要: Improving Sequential Recommenders through Counterfactual Augmentation of System Exposure
- arxiv url: http://arxiv.org/abs/2504.13482v1
- Date: Fri, 18 Apr 2025 05:46:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-28 19:00:20.234425
- Title: Improving Sequential Recommenders through Counterfactual Augmentation of System Exposure
- Title(参考訳): システム露出の非現実的増大によるシーケンスレコメンダの改善
- Authors: Ziqi Zhao, Zhaochun Ren, Jiyuan Yang, Zuming Yan, Zihan Wang, Liu Yang, Pengjie Ren, Zhumin Chen, Maarten de Rijke, Xin Xin,
- Abstract要約: シーケンシャルレコメンデーション(CaseRec)のためのシステム露出に対する反ファクト改善を提案する。
CaseRecは、異なる露出報酬を考慮に入れた強化学習を導入する。
拡張項目に対するユーザフィードバック報酬を予測するために,トランスフォーマーベースのユーザシミュレータを提案する。
- 参考スコア(独自算出の注目度): 75.45798019935947
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In sequential recommendation (SR), system exposure refers to items that are exposed to the user. Typically, only a few of the exposed items would be interacted with by the user. Although SR has achieved great success in predicting future user interests, existing SR methods still fail to fully exploit system exposure data. Most methods only model items that have been interacted with, while the large volume of exposed but non-interacted items is overlooked. Even methods that consider the whole system exposure typically train the recommender using only the logged historical system exposure, without exploring unseen user interests. In this paper, we propose counterfactual augmentation over system exposure for sequential recommendation (CaseRec). To better model historical system exposure, CaseRec introduces reinforcement learning to account for different exposure rewards. CaseRec uses a decision transformer-based sequential model to take an exposure sequence as input and assigns different rewards according to the user feedback. To further explore unseen user interests, CaseRec proposes to perform counterfactual augmentation, where exposed original items are replaced with counterfactual items. Then, a transformer-based user simulator is proposed to predict the user feedback reward for the augmented items. Augmentation, together with the user simulator, constructs counterfactual exposure sequences to uncover new user interests. Finally, CaseRec jointly uses the logged exposure sequences with the counterfactual exposure sequences to train a decision transformer-based sequential model for generating recommendation. Experiments on three real-world benchmarks show the effectiveness of CaseRec. Our code is available at https://github.com/ZiqiZhao1/CaseRec.
- Abstract(参考訳): シーケンシャルレコメンデーション(SR)では、システムエクスポージャー(system exposure)は、ユーザに露出したアイテムを指す。
通常、露出したアイテムのうち、ユーザによって操作されるのはごくわずかである。
SRは将来のユーザ関心を予測する上で大きな成功をおさめたが、既存のSR手法はまだシステム露出データを完全に活用できていない。
たいていの方法は相互作用したアイテムのみをモデル化するが、露出するアイテムは多く、相互作用しないアイテムは見過ごされてしまう。
システム全体の露出を考慮する方法でさえ、通常、未確認のユーザ関心を探索することなく、記録された履歴システム露出のみを使用してレコメンデーターを訓練する。
本稿では,シーケンシャルレコメンデーション(CaseRec)のためのシステム露出に対する反実的拡張を提案する。
履歴システムの露出をより良くモデル化するために、CaseRecは様々な露出報酬を考慮に入れた強化学習を導入した。
CaseRecは、決定トランスフォーマーベースのシーケンシャルモデルを使用して、露出シーケンスを入力として取り、ユーザのフィードバックに応じて異なる報酬を割り当てる。
目に見えないユーザの興味をさらに探求するために、CaseRecは、露出したオリジナルのアイテムを偽のアイテムに置き換える、反ファクト的な拡張を実行することを提案する。
次に,改良項目に対するユーザフィードバック報酬を予測するために,トランスフォーマーを用いたユーザシミュレータを提案する。
Augmentationは、ユーザシミュレータとともに、新しいユーザ興味を明らかにするために、反ファクトの露光シーケンスを構築する。
最後に、CaseRecはログ化された露光シーケンスと反ファクト的な露光シーケンスを併用して、レコメンデーションを生成するための決定トランスフォーマーベースのシーケンシャルモデルをトレーニングする。
実世界の3つのベンチマークの実験は、CaseRecの有効性を示している。
私たちのコードはhttps://github.com/ZiqiZhao1/CaseRec.comで利用可能です。
関連論文リスト
- Finding Interest Needle in Popularity Haystack: Improving Retrieval by Modeling Item Exposure [0.0]
本稿では、アイテムの露出確率を明示的にモデル化し、推論時に検索ステージランキングを調整する、露出認識型検索スコアリング手法を提案する。
実世界のビデオレコメンデーションシステムにおけるオンラインA/B実験によるアプローチの有効性を検証し、一意に検索されたアイテムの25%増加と、過度な人気コンテンツの優位性の40%低下を実証した。
本研究は,検索段階で人気バイアスを緩和するためのスケーラブルでデプロイ可能なソリューションを構築し,バイアス認識のパーソナライゼーションのための新しいパラダイムを提供する。
論文 参考訳(メタデータ) (2025-03-31T00:04:01Z) - OneRec: Unifying Retrieve and Rank with Generative Recommender and Iterative Preference Alignment [9.99840965933561]
ケースドラーニングフレームワークを統一的な生成モデルで置き換えるOneRecを提案する。
1) ユーザの履歴行動シーケンスをエンコードし、ユーザが興味を持っているかもしれない動画を徐々にデコードするエンコーダ・デコーダ構造。
論文 参考訳(メタデータ) (2025-02-26T09:25:10Z) - Breaking Determinism: Fuzzy Modeling of Sequential Recommendation Using Discrete State Space Diffusion Model [66.91323540178739]
シークエンシャルレコメンデーション(SR)は、ユーザーが過去の行動に基づいて興味を持つかもしれない項目を予測することを目的としている。
我々はSRを新しい情報理論の観点から再検討し、逐次モデリング手法がユーザの行動のランダム性と予測不可能性を適切に把握できないことを発見した。
ファジィ情報処理理論に触発された本論文では,制限を克服し,ユーザの関心事の進化をよりよく捉えるために,ファジィなインタラクションシーケンスの組を導入する。
論文 参考訳(メタデータ) (2024-10-31T14:52:01Z) - Bridging User Dynamics: Transforming Sequential Recommendations with Schrödinger Bridge and Diffusion Models [49.458914600467324]
拡散に基づく逐次レコメンデーションモデルにSchr"odinger Bridgeを導入し、SdifRecモデルを作成する。
また、ユーザクラスタリング情報を誘導条件として利用するcon-SdifRecと呼ばれるSdifRecの拡張版も提案する。
論文 参考訳(メタデータ) (2024-08-30T09:10:38Z) - CSRec: Rethinking Sequential Recommendation from A Causal Perspective [25.69446083970207]
シーケンシャルなレコメンデータシステム(RecSys)の本質は、ユーザが意思決定を行う方法を理解することです。
我々は、CSRec(Causal Sequential Recommendation)と呼ばれる、シーケンシャルレコメンデーションの新しい定式化を提案する。
CSRecは、シーケンシャルなコンテキスト内で推奨項目が受け入れられる確率を予測し、現在の決定がどのようになされるかをバックトラックすることを目的としている。
論文 参考訳(メタデータ) (2024-08-23T23:19:14Z) - Diffusion-based Contrastive Learning for Sequential Recommendation [6.3482831836623355]
本稿では,CaDiRecという,文脈対応拡散に基づく逐次推薦のためのコントラスト学習を提案する。
CaDiRecは、コンテキスト対応拡散モデルを使用して、シーケンス内の所定の位置に対する代替アイテムを生成する。
フレームワーク全体をエンドツーエンドでトレーニングし、拡散モデルとレコメンデーションモデルの間でアイテムの埋め込みを共有します。
論文 参考訳(メタデータ) (2024-05-15T14:20:37Z) - MMGRec: Multimodal Generative Recommendation with Transformer Model [81.61896141495144]
MMGRecは、マルチモーダルレコメンデーションに生成パラダイムを導入することを目指している。
まず,階層的な量子化手法であるGraph CF-RQVAEを考案し,各項目にRec-IDを割り当てる。
次に、Transformerベースのレコメンデータをトレーニングし、過去のインタラクションシーケンスに基づいて、ユーザが推奨するアイテムのRec-IDを生成する。
論文 参考訳(メタデータ) (2024-04-25T12:11:27Z) - AutoSAM: Towards Automatic Sampling of User Behaviors for Sequential Recommender Systems [48.461157194277504]
本稿では,歴史的挙動を一様に扱わない汎用的な自動サンプリングフレームワークであるAutoSAMを提案する。
具体的には、AutoSAMは、サンプル層を追加して標準のシーケンシャルレコメンデーションアーキテクチャを拡張し、生入力のスキュー分布を適応的に学習する。
理論的には、Future PredictionやSequence Perplexityなどの多目的サンプリング報酬を設計し、フレームワーク全体をエンドツーエンドで最適化する。
論文 参考訳(メタデータ) (2023-11-01T09:25:21Z) - Generating Negative Samples for Sequential Recommendation [83.60655196391855]
逐次レコメンデーション(SR)のための負のサンプル(イテム)を生成することを提案する。
アイテムに対する現在のSRモデルの学習されたユーザの好みに基づいて、各タイムステップで負の項目をサンプリングする。
4つの公開データセットの実験は、SRに高品質な負のサンプルを提供することの重要性を検証する。
論文 参考訳(メタデータ) (2022-08-07T05:44:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。