論文の概要: Bake Two Cakes with One Oven: RL for Defusing Popularity Bias and Cold-start in Third-Party Library Recommendations
- arxiv url: http://arxiv.org/abs/2504.13772v1
- Date: Fri, 18 Apr 2025 16:17:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-28 15:02:46.7193
- Title: Bake Two Cakes with One Oven: RL for Defusing Popularity Bias and Cold-start in Third-Party Library Recommendations
- Title(参考訳): Bake Two Cake with One Oven: RL for Defusing Popularity Bias and Cold-start in Third-Party Library Recommendations
- Authors: Minh Hoang Vuong, Anh M. T. Bui, Phuong T. Nguyen, Davide Di Ruscio,
- Abstract要約: サードパーティ製ライブラリ(TPL)は現代のソフトウェア開発において不可欠な部分となり、開発者の生産性を高め、市場投入までの時間を短縮している。
通常、コラボレーティブ・フィルタリング(CF)に依存しており、レコメンデーションを行う際に2次元のプロジェクト・ライブラリ・マトリックス(一般的にはユーザ・イテム)を利用する。
本稿では,TPLレコメンデーションにおける人気バイアスとコールドスタート問題に対処するための強化学習(RL)に基づくアプローチを提案する。
- 参考スコア(独自算出の注目度): 5.874782446136913
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Third-party libraries (TPLs) have become an integral part of modern software development, enhancing developer productivity and accelerating time-to-market. However, identifying suitable candidates from a rapidly growing and continuously evolving collection of TPLs remains a challenging task. TPL recommender systems have been studied, offering a promising solution to address this issue. They typically rely on collaborative filtering (CF) that exploits a two-dimensional project-library matrix (user-item in general context of recommendation) when making recommendations. We have noticed that CF-based approaches often encounter two challenges: (i) a tendency to recommend popular items more frequently, making them even more dominant, a phenomenon known as popularity bias, and (ii) difficulty in generating recommendations for new users or items due to limited user-item interactions, commonly referred to as the cold-start problem. In this paper, we propose a reinforcement learning (RL)-based approach to address popularity bias and the cold-start problem in TPL recommendation. Our method comprises three key components. First, we utilize a graph convolution network (GCN)-based embedding model to learn user preferences and user-item interactions, allowing us to capture complex relationships within interaction subgraphs and effectively represent new user/item embeddings. Second, we introduce an aggregation operator to generate a representative embedding from user and item embeddings, which is then used to model cold-start users. Finally, we adopt a model-based RL framework for TPL recommendation, where popularity bias is mitigated through a carefully designed reward function and a rarity-based replay buffer partitioning strategy. The results demonstrated that our proposed approach outperforms state-of-the-art models in cold-start scenarios while effectively mitigating the impact of popularity bias.
- Abstract(参考訳): サードパーティ製ライブラリ(TPL)は現代のソフトウェア開発において不可欠な部分となり、開発者の生産性を高め、市場投入までの時間を短縮している。
しかし、急速に成長し、継続的に進化するTPLのコレクションから適切な候補を特定することは難しい課題である。
TPLレコメンデータシステムは研究されており、この問題に対処するための有望な解決策を提供している。
通常、コラボレーティブ・フィルタリング(CF)に依存しており、レコメンデーションを行う際に2次元のプロジェクト・ライブラリ・マトリックス(一般的にはユーザ・イテム)を利用する。
私たちはCFベースのアプローチが2つの課題に直面することが多いことに気付きました。
(i)人気アイテムをより頻繁に推薦する傾向があり、さらに支配的になり、人気バイアスとして知られる現象
(II) コールドスタート問題(コールドスタート問題)と呼ばれる, ユーザとイテムの相互作用が限定されているため, 新規ユーザや項目のレコメンデーション作成が困難である。
本稿では,TPLレコメンデーションにおける人気バイアスとコールドスタート問題に対処するための強化学習(RL)に基づくアプローチを提案する。
提案手法は3つのキーコンポーネントから構成される。
まず,グラフ畳み込みネットワーク(GCN)をベースとした埋め込みモデルを用いて,ユーザの好みやユーザとイテムのインタラクションを学習し,インタラクションサブグラフ内の複雑な関係をキャプチャし,新たなユーザ/イテムの埋め込みを効果的に表現する。
第2に、ユーザとアイテムの埋め込みから代表埋め込みを生成するアグリゲーション演算子を導入し、コールドスタートユーザをモデル化する。
最後に、モデルベースのRLフレームワークをTPLレコメンデーションに適用し、慎重に設計された報酬関数とランダムなリプレイバッファ分割戦略により、人気バイアスを緩和する。
その結果,提案手法は,人気バイアスの影響を効果的に軽減しつつ,コールドスタートシナリオにおける最先端モデルよりも優れていた。
関連論文リスト
- Slow Thinking for Sequential Recommendation [88.46598279655575]
本稿では,STREAM-Recという新しいスローシンキングレコメンデーションモデルを提案する。
弊社のアプローチは、過去のユーザの振る舞いを分析し、多段階の熟考的推論プロセスを生成し、パーソナライズされたレコメンデーションを提供する。
具体的には,(1)レコメンデーションシステムにおける適切な推論パターンを特定すること,(2)従来のレコメンデーションシステムの推論能力を効果的に刺激する方法を検討すること,の2つの課題に焦点を当てる。
論文 参考訳(メタデータ) (2025-04-13T15:53:30Z) - Online Clustering of Dueling Bandits [59.09590979404303]
本稿では、優先フィードバックに基づく協調的な意思決定を可能にするために、最初の「デュエルバンディットアルゴリズムのクラスタリング」を導入する。
本稿では,(1)ユーザ報酬関数をコンテキストベクトルの線形関数としてモデル化する線形デューリング帯域のクラスタリング(COLDB)と,(2)ニューラルネットワークを用いて複雑な非線形ユーザ報酬関数をモデル化するニューラルデューリング帯域のクラスタリング(CONDB)の2つの新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-02-04T07:55:41Z) - Topology-Aware Popularity Debiasing via Simplicial Complexes [19.378410889819165]
TSP(Test-time Simplicial Propagation)は、グラフニューラルネットワーク(GNN)の表現性を高めるために、simplicial Complex(SC)を組み込んだ。
提案手法は, SCを用いて複数順序関係を捕捉し, ユーザとイテムのインタラクションをより包括的に表現する。
提案手法はより均一なアイテム表現分布を生成し,より公平で正確なレコメンデーションを実現する。
論文 参考訳(メタデータ) (2024-11-21T07:12:47Z) - Improved Diversity-Promoting Collaborative Metric Learning for Recommendation [127.08043409083687]
CML(Collaborative Metric Learning)は、リコメンデーションシステムにおいて人気のある手法として最近登場した。
本稿では,ユーザが複数のカテゴリの関心を持つ,困難なシナリオに焦点をあてる。
textitDiversity-Promoting Collaborative Metric Learning (DPCML) と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2024-09-02T07:44:48Z) - Retrieval Augmentation via User Interest Clustering [57.63883506013693]
インダストリアルレコメンデータシステムは、ユーザ・イテム・エンゲージメントのパターンに敏感である。
本稿では,ユーザの関心を効率的に構築し,計算コストの低減を図る新しい手法を提案する。
当社のアプローチはMetaの複数の製品に展開されており、ショートフォームビデオ関連の推奨を助長しています。
論文 参考訳(メタデータ) (2024-08-07T16:35:10Z) - Sparsity Regularization For Cold-Start Recommendation [7.848143873095096]
ユーザ人口統計とユーザ嗜好を組み合わせることで,ユーザベクタのための新しい表現を導入する。
我々は,スパースユーザ・購入行動を利用したコールド・スタート・レコメンデーションのための新しいスパース・逆モデルSRLGANを開発した。
SRLGANを2つの一般的なデータセットで評価し、最先端の結果を示す。
論文 参考訳(メタデータ) (2022-01-26T02:28:08Z) - Learning to Learn a Cold-start Sequential Recommender [70.5692886883067]
コールドスタート勧告は、現代のオンラインアプリケーションにおいて緊急の問題である。
メタ学習に基づくコールドスタートシーケンシャルレコメンデーションフレームワークMetaCSRを提案する。
MetaCSRは、通常のユーザの行動から共通のパターンを学ぶ能力を持っている。
論文 参考訳(メタデータ) (2021-10-18T08:11:24Z) - Self-Supervised Reinforcement Learning for Recommender Systems [77.38665506495553]
逐次リコメンデーションタスクのための自己指導型強化学習を提案する。
提案手法は,2つの出力層を持つ標準レコメンデーションモデルを強化する。
このようなアプローチに基づいて、自己監督型Q-ラーニング(SQN)と自己監督型アクター・クライブ(SAC)という2つのフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-10T11:18:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。