Fugu-MT 論文翻訳(概要): SPARC: Soft Probabilistic Adaptive multi-interest Retrieval Model via Codebooks for recommender system

論文の概要: SPARC: Soft Probabilistic Adaptive multi-interest Retrieval Model via Codebooks for recommender system

arxiv url: http://arxiv.org/abs/2508.09090v2
Date: Wed, 13 Aug 2025 01:51:32 GMT
ステータス: 翻訳完了
システム内更新日: 2025-08-14 11:55:47.630486
Title: SPARC: Soft Probabilistic Adaptive multi-interest Retrieval Model via Codebooks for recommender system
Title（参考訳）: SPARC: 推薦システムのためのコードブックによるソフト確率適応型多目的検索モデル
Authors: Jialiang Shi, Yaguang Dou, Tian Qi,
Abstract要約: 現在の多目的検索手法には3つの大きな課題がある。オンライン推論では、通常過剰な戦略が採用される。我々は,「ソフト確率適応検索モデル」という新しい検索フレームワークを提案する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Modeling multi-interests has arisen as a core problem in real-world RS. Current multi-interest retrieval methods pose three major challenges: 1) Interests, typically extracted from predefined external knowledge, are invariant. Failed to dynamically evolve with users' real-time consumption preferences. 2) Online inference typically employs an over-exploited strategy, mainly matching users' existing interests, lacking proactive exploration and discovery of novel and long-tail interests. To address these challenges, we propose a novel retrieval framework named SPARC(Soft Probabilistic Adaptive Retrieval Model via Codebooks). Our contribution is two folds. First, the framework utilizes Residual Quantized Variational Autoencoder (RQ-VAE) to construct a discretized interest space. It achieves joint training of the RQ-VAE with the industrial large scale recommendation model, mining behavior-aware interests that can perceive user feedback and evolve dynamically. Secondly, a probabilistic interest module that predicts the probability distribution over the entire dynamic and discrete interest space. This facilitates an efficient "soft-search" strategy during online inference, revolutionizing the retrieval paradigm from "passive matching" to "proactive exploration" and thereby effectively promoting interest discovery. Online A/B tests on an industrial platform with tens of millions daily active users, have achieved substantial gains in business metrics: +0.9% increase in user view duration, +0.4% increase in user page views (PV), and a +22.7% improvement in PV500(new content reaching 500 PVs in 24 hours). Offline evaluations are conducted on open-source Amazon Product datasets. Metrics, such as Recall@K and Normalized Discounted Cumulative Gain@K(NDCG@K), also showed consistent improvement. Both online and offline experiments validate the efficacy and practical value of the proposed method.
Abstract（参考訳）: マルチ関心のモデリングは、現実世界のRSの中核的な問題として生まれてきた。現在の多目的検索手法には3つの課題がある。 1) 主に事前定義された外部知識から抽出される興味は不変である。ユーザのリアルタイム消費嗜好で動的に進化することができない。 2) オンライン推論では,主にユーザの既存の関心にマッチし,新規・長期的関心の探索や発見が積極的に行われていない,過度に露見した戦略が採用されている。本研究では,SPARC (Soft Probabilistic Adaptive Retrieval Model via Codebooks) という新しい検索フレームワークを提案する。私たちの貢献は2倍です。まず、Residual Quantized Variational Autoencoder (RQ-VAE) を用いて、離散化関心空間を構築する。産業大規模レコメンデーションモデルとRQ-VAEの共同トレーニングを実現し,ユーザのフィードバックを知覚し,動的に進化する行動意識のマイニングを行う。第二に、動的かつ離散的な利害空間全体の確率分布を予測する確率的利害モジュールである。これにより、オンライン推論における効率的な「ソフト検索」戦略が促進され、検索パラダイムを「パッシブマッチング」から「プロアクティブ探索」に革命させ、効果的に興味発見を促進する。数千万人のアクティブユーザを持つ産業プラットフォーム上でのオンラインA/Bテストは、ユーザビュー期間の0.9%増加、ユーザページビュー(PV)の0.4%増加、PV500(新しいコンテンツは24時間で500 PVに達する)の+22.7%改善など、ビジネスメトリクスで大幅に向上している。オフライン評価は、オープンソースのAmazon Productデータセット上で実施される。 Recall@K や Normalized Discounted Cumulative Gain@K(NDCG@K) のようなメトリクスも一貫した改善を示した。オンライン実験とオフライン実験の両方で提案手法の有効性と実用性を検証した。

関連論文リスト

IterResearch: Rethinking Long-Horizon Agents via Markovian State Reconstruction [107.49922328855025]
IterResearchは、マルコフ決定過程として長期研究を再構築する、新しい反復的深層研究パラダイムである。 6つのベンチマークで平均+14.5ppの既存のオープンソースエージェントよりも大幅に改善されている。これは効果的なプロンプト戦略として機能し、ロングホライゾンタスクにおけるReActよりも19.2ppのフロンティアモデルを改善する。
論文参考訳（メタデータ） (2025-11-10T17:30:08Z)
Modeling Long-term User Behaviors with Diffusion-driven Multi-interest Network for CTR Prediction [18.302602011055775]
本稿では,DiffuMIN (Diffusion-driven Multi-Interest Network) を提案する。オンラインA/BテストではDiffuMINが1.52%,CPMが1.10%増加した。
論文参考訳（メタデータ） (2025-08-21T07:10:01Z)
Enhancing Serendipity Recommendation System by Constructing Dynamic User Knowledge Graphs with Large Language Models [0.9262403397108375]
大規模言語モデル(LLM)は、豊富な世界知識と優れた推論能力のおかげで、推奨されるセレンディピティーを示す。本稿では,LLmを利用してユーザ知識グラフを動的に構築し,レコメンデーションシステムのセレンディピティーを高める手法を提案する。
論文参考訳（メタデータ） (2025-08-06T02:52:09Z)
EPR-GAIL: An EPR-Enhanced Hierarchical Imitation Learning Framework to Simulate Complex User Consumption Behaviors [13.436303786475348]
本研究では,データ駆動型GAIL(Generative Adversarial Learning)手法の忠実さと信頼性を高めることを提案する。 EPR-GAILフレームワークの中核となる考え方は、ユーザの消費行動を複雑なEPR決定プロセスとしてモデル化することです。オンラインプラットフォーム上での2つの実世界のユーザ消費行動データセットの実験では、EPR-GAILフレームワークが、データの忠実度において、最高の最先端ベースラインを19%以上上回っていることが示されている。
論文参考訳（メタデータ） (2025-03-09T01:56:42Z)
LLM-based Bi-level Multi-interest Learning Framework for Sequential Recommendation [54.396000434574454]
本稿では,暗黙的行動と明示的意味論的視点を組み合わせた新しい多目的SRフレームワークを提案する。 Implicit Behavioral Interest ModuleとExplicit Semantic Interest Moduleの2つのモジュールが含まれている。 4つの実世界のデータセットの実験は、フレームワークの有効性と実用性を検証する。
論文参考訳（メタデータ） (2024-11-14T13:00:23Z)
Retrieval Augmentation via User Interest Clustering [57.63883506013693]
インダストリアルレコメンデータシステムは、ユーザ・イテム・エンゲージメントのパターンに敏感である。本稿では,ユーザの関心を効率的に構築し,計算コストの低減を図る新しい手法を提案する。当社のアプローチはMetaの複数の製品に展開されており、ショートフォームビデオ関連の推奨を助長しています。
論文参考訳（メタデータ） (2024-08-07T16:35:10Z)
Cost-Effective Proxy Reward Model Construction with On-Policy and Active Learning [70.22819290458581]
人間のフィードバックによる強化学習(RLHF)は、現在の大規模言語モデルパイプラインにおいて広く採用されているアプローチである。提案手法では,(1)OODを回避するためのオン・ポリシー・クエリと,(2)プライオリティ・クエリの最も情報性の高いデータを選択するためのアクティブ・ラーニングという2つの重要なイノベーションを導入している。
論文参考訳（メタデータ） (2024-07-02T10:09:19Z)
InfoRM: Mitigating Reward Hacking in RLHF via Information-Theoretic Reward Modeling [66.3072381478251]
Reward Hacking(報酬の過度な最適化)は依然として重要な課題だ。本稿では,報奨モデル,すなわちInfoRMのためのフレームワークを提案する。 InfoRMの過度な最適化検出機構は、有効であるだけでなく、幅広いデータセットにわたって堅牢であることを示す。
論文参考訳（メタデータ） (2024-02-14T17:49:07Z)
Deep Evolutional Instant Interest Network for CTR Prediction in Trigger-Induced Recommendation [28.29435760797856]
本稿では,TIRシナリオにおけるクリックスルーレート予測のための新しい手法であるDeep Evolutional Instant Interest Network (DEI2N)を提案する。我々は,ユーザがスクロールダウンした場合の瞬間的関心の強度の動的変化を予測するために,ユーザインスタント・関心モデリング・レイヤを設計する。オフラインおよび実世界の産業データセットを用いて,本手法の評価を行った。
論文参考訳（メタデータ） (2024-01-15T15:27:24Z)
Unified Embedding Based Personalized Retrieval in Etsy Search [0.206242362470764]
グラフ, 変換器, 項ベース埋め込みを終末に組み込んだ統合埋め込みモデルを学習することを提案する。我々のパーソナライズされた検索モデルは、検索購入率5.58%、サイト全体のコンバージョン率2.63%によって、検索体験を著しく改善する。
論文参考訳（メタデータ） (2023-06-07T23:24:50Z)
Meta-Wrapper: Differentiable Wrapping Operator for User Interest Selection in CTR Prediction [97.99938802797377]
クリックスルー率(CTR)予測は、ユーザーが商品をクリックする確率を予測することを目的としており、リコメンデーションシステムにおいてますます重要になっている。近年,ユーザの行動からユーザの興味を自動的に抽出する深層学習モデルが大きな成功を収めている。そこで我々は,メタラッパー(Meta-Wrapper)と呼ばれるラッパー手法の枠組みに基づく新しい手法を提案する。
論文参考訳（メタデータ） (2022-06-28T03:28:15Z)
Reward Uncertainty for Exploration in Preference-based Reinforcement Learning [88.34958680436552]
好みに基づく強化学習アルゴリズムを対象とした探索手法を提案する。我々の基本的な考え方は、学習した報酬に基づいて、斬新さを測定することによって、本質的な報酬を設計することである。実験により、学習報酬の不確実性からの探索ボーナスは、好みに基づくRLアルゴリズムのフィードバック効率とサンプル効率の両方を改善することが示された。
論文参考訳（メタデータ） (2022-05-24T23:22:10Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。