論文の概要: PI2I: A Personalized Item-Based Collaborative Filtering Retrieval Framework
- arxiv url: http://arxiv.org/abs/2601.16815v1
- Date: Fri, 23 Jan 2026 15:10:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-26 14:27:27.74219
- Title: PI2I: A Personalized Item-Based Collaborative Filtering Retrieval Framework
- Title(参考訳): PI2I:パーソナライズされたアイテムベース協調フィルタリング検索フレームワーク
- Authors: Shaoqing Wang, Yingcai Ma, Kairui Fu, Ziyang Wang, Dunxian Huang, Yuliang Yan, Jian Wu,
- Abstract要約: 項目間協調フィルタリング(CF)のパーソナライズ機能を向上させる新しい2段階検索フレームワークを提案する。
第1回Indexer Building Stage (IBS)では、トラクション閾値を緩和して検索プールを最適化し、ヒット率を最大化する。
第2回Personalized Retrieval Stage (PRS)では,内部積計算の限界を克服する対話型スコアリングモデルを導入する。
大規模な実世界のデータセットに対するオフライン実験は、PI2Iが従来のCFメソッドよりも優れており、Two-Towerモデルと競合することを示している。
- 参考スコア(独自算出の注目度): 15.34118278015945
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Efficiently selecting relevant content from vast candidate pools is a critical challenge in modern recommender systems. Traditional methods, such as item-to-item collaborative filtering (CF) and two-tower models, often fall short in capturing the complex user-item interactions due to uniform truncation strategies and overdue user-item crossing. To address these limitations, we propose Personalized Item-to-Item (PI2I), a novel two-stage retrieval framework that enhances the personalization capabilities of CF. In the first Indexer Building Stage (IBS), we optimize the retrieval pool by relaxing truncation thresholds to maximize Hit Rate, thereby temporarily retaining more items users might be interested in. In the second Personalized Retrieval Stage (PRS), we introduce an interactive scoring model to overcome the limitations of inner product calculations, allowing for richer modeling of intricate user-item interactions. Additionally, we construct negative samples based on the trigger-target (item-to-item) relationship, ensuring consistency between offline training and online inference. Offline experiments on large-scale real-world datasets demonstrate that PI2I outperforms traditional CF methods and rivals Two-Tower models. Deployed in the "Guess You Like" section on Taobao, PI2I achieved a 1.05% increase in online transaction rates. In addition, we have released a large-scale recommendation dataset collected from Taobao, containing 130 million real-world user interactions used in the experiments of this paper. The dataset is publicly available at https://huggingface.co/datasets/PI2I/PI2I, which could serve as a valuable benchmark for the research community.
- Abstract(参考訳): 膨大な候補プールから関連コンテンツを効果的に選択することは、現代のレコメンデータシステムにおいて重要な課題である。
アイテム・ツー・イット・コラボレーティブ・フィルタリング(CF)やツー・トウワー・モデルといった従来の手法は、一様トランケーション戦略やオーバーデュー・ユーザ・イット・クロスによる複雑なユーザ・イット・インタラクションのキャプチャに不足することが多い。
これらの制約に対処するため、CFのパーソナライズ機能を強化する新しい2段階検索フレームワークであるPersonalized Item-to-Item (PI2I)を提案する。
第1回Indexer Building Stage (IBS)では、トラクション閾値を緩和することで検索プールを最適化し、ヒット率を最大化し、ユーザーが興味を持つかもしれないアイテムを一時的に保持する。
第2回Personalized Retrieval Stage (PRS)では、内部積計算の限界を克服するインタラクティブスコアリングモデルを導入する。
さらに、トリガー・ターゲット(item-to-item)関係に基づいた負のサンプルを構築し、オフライントレーニングとオンライン推論の整合性を確保する。
大規模実世界のデータセットに関するオフライン実験は、PI2Iが従来のCFメソッドよりも優れており、Two-Towerモデルと競合していることを示している。
Taobaoの"Guess You Like"セクションにデプロイされたPI2Iは,オンライントランザクションレートの1.05%向上を達成した。
さらに,本論文では,1億3000万人の実世界のユーザインタラクションを含む大規模レコメンデーションデータセットを公開している。
データセットはhttps://huggingface.co/datasets/PI2I/PI2Iで公開されている。
関連論文リスト
- Improving E-commerce Search with Category-Aligned Retrieval [0.0]
カテゴリー対応検索システム(CARS)は,まずユーザのクエリから製品カテゴリを予測し,そのカテゴリ内で製品を強化することによって,検索関連性を向上させる。
本稿では,クエリの埋め込みから"Trainable Category Prototypes"を作成する新しい手法を提案する。
論文 参考訳(メタデータ) (2025-09-03T20:43:52Z) - ENCODE: Breaking the Trade-Off Between Performance and Efficiency in Long-Term User Behavior Modeling [12.963611514800656]
EfficieNt Clustering を用いた twO-stage interest moDEling (ENCODE) と呼ばれる2段階の効率的な長期配列モデリング手法を提案する。
オフラインの抽出段階では、ENCODEは全動作シーケンスをクラスタリングし、正確な関心を抽出する。
オンライン推論の段階では、ECNODEは、ターゲットアイテムとの関連性を予測するために、既成のユーザ関心を生かしている。
論文 参考訳(メタデータ) (2025-08-19T06:58:21Z) - User Long-Term Multi-Interest Retrieval Model for Recommendation [20.2928687653132]
我々は,検索段階における数千の行動モデリングを可能にする,ユーザ長期多目的検索モデル (ULIM) という新しいフレームワークを提案する。
我々は, ULIMが最先端の手法よりも大幅に向上し, タオオオのミニアプリであるタオオオオシャの5.54%のクリック, 11.01%の注文, 4.03%のGMVリフトを実現していることを示す。
論文 参考訳(メタデータ) (2025-07-14T09:32:26Z) - Unleashing the Potential of Two-Tower Models: Diffusion-Based Cross-Interaction for Large-Scale Matching [25.672699790866726]
2towerモデルは、幅広いアプリケーション領域にわたる産業規模のマッチング段階で広く採用されている。
マッチングパラダイム内での"クロスインタラクションデカップリングアーキテクチャ"を提案する。
論文 参考訳(メタデータ) (2025-02-28T03:40:37Z) - Multi-granularity Interest Retrieval and Refinement Network for Long-Term User Behavior Modeling in CTR Prediction [68.90783662117936]
クリックスルーレート(CTR)の予測は、オンラインパーソナライズプラットフォームにとって不可欠である。
近年の進歩は、リッチなユーザの振る舞いをモデル化することで、CTR予測の性能を大幅に改善できることを示している。
マルチグラニュラリティ興味検索ネットワーク(MIRRN)を提案する。
論文 参考訳(メタデータ) (2024-11-22T15:29:05Z) - Beyond Two-Tower Matching: Learning Sparse Retrievable
Cross-Interactions for Recommendation [80.19762472699814]
2-towerモデルは、産業アプリケーションに広くデプロイされている推奨のための一般的なマッチングフレームワークである。
機能間相互作用の制限と、オンラインサービスにおける精度の低下など、主な課題が2つある。
我々は,高度な機能相互作用だけでなく,効率的な検索もサポートするSparCodeという新しいマッチングパラダイムを提案する。
論文 参考訳(メタデータ) (2023-11-30T03:13:36Z) - Entity-Graph Enhanced Cross-Modal Pretraining for Instance-level Product
Retrieval [152.3504607706575]
本研究の目的は, 細粒度製品カテゴリを対象とした, 弱制御型マルチモーダル・インスタンスレベルの製品検索である。
まず、Product1Mデータセットをコントリビュートし、2つの実際のインスタンスレベルの検索タスクを定義します。
我々は、マルチモーダルデータから重要な概念情報を組み込むことができるより効果的なクロスモーダルモデルを訓練するために活用する。
論文 参考訳(メタデータ) (2022-06-17T15:40:45Z) - Broad Recommender System: An Efficient Nonlinear Collaborative Filtering
Approach [56.12815715932561]
我々はBroad Collaborative Filtering (BroadCF)と呼ばれる新しい広帯域リコメンデータシステムを提案する。
深層ニューラルネットワーク(DNN)の代わりに、ユーザとアイテム間の複雑な非線形関係を学習するためのマッピング機能として、Broad Learning System(BLS)が使用されている。
7つのベンチマークデータセットで実施された大規模な実験により、提案したBroadCFアルゴリズムの有効性が確認された。
論文 参考訳(メタデータ) (2022-04-20T01:25:08Z) - Dual-embedding based Neural Collaborative Filtering for Recommender
Systems [0.7949579654743338]
本稿では,DNCF をベースとしたニューラル・コラボレーティブ・フィルタリングのために,DNCF という汎用的な協調フィルタリングフレームワークを提案する。
ユーザ(アイテム)に対するプリミティブな埋め込みの学習に加えて,インタラクションされたアイテム(ユーザ)の観点から追加的な埋め込みを導入し,ユーザ(item)表現を拡大する。
論文 参考訳(メタデータ) (2021-02-04T11:32:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。