論文の概要: Deploying Semantic ID-based Generative Retrieval for Large-Scale Podcast Discovery at Spotify
- arxiv url: http://arxiv.org/abs/2603.17540v1
- Date: Wed, 18 Mar 2026 09:46:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-19 18:32:57.617308
- Title: Deploying Semantic ID-based Generative Retrieval for Large-Scale Podcast Discovery at Spotify
- Title(参考訳): Spotifyにおける大規模ポッドキャスト発見のためのセマンティックIDベースの生成検索
- Authors: Edoardo D'Amico, Marco De Nadai, Praveen Chandar, Divita Vohra, Shawn Lin, Max Lefarov, Paul Gigioli, Gustavo Penha, Ilya Kopysitsky, Ivo Joel Senese, Darren Mei, Francesco Fabbri, Oguz Semerci, Yu Zhao, Vincent Tang, Brian St. Thomas, Alexandra Ranieri, Matthew N. K. Smith, Aaron Bernkopf, Bryan Leung, Ghazal Fazelnia, Mark VanMiddlesworth, Timothy Christopher Heath, Petter Pehrson Skiden, Alice Y. Wang, Doug J. Cole, Andreas Damianou, Maya Hristakeva, Reid Wilbur, Tarun Chillara, Vladan Radosavljevic, Pooja Chitkara, Sainath Adapa, Juan Elenter, Bernd Huber, Jacqueline Wood, Saaketh Vedantam, Jan Stypka, Sandeep Ghael, Martin D. Gould, David Murgatroyd, Yves Raimond, Mounia Lalmas, Paul N. Bennett,
- Abstract要約: Spotifyにおけるポッドキャスト発見のためのプロダクションスケール生成レコメンデータを開発した。
GLIDEは、セマンティックIDを使用して識別されたカタログ上の命令追従タスクとして推奨を定式化する。
GLIDEはSpotifyのホームサーフェス上での非居住ポッドキャストストリーミングを最大5.4%増加し、新しいショー発見を最大14.3%増加させる。
- 参考スコア(独自算出の注目度): 29.37272382643475
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Podcast listening is often grounded in a set of favorite shows, while listener intent can evolve over time. This combination of stable preferences and changing intent motivates recommendation approaches that support both familiarity and exploration. Traditional recommender systems typically emphasize long-term interaction patterns, and are less explicitly designed to incorporate rich contextual signals or flexible, intent-aware discovery objectives. In this setting, models that can jointly reason over semantics, context, and user state offer a promising direction. Large Language Models (LLMs) provide strong semantic reasoning and contextual conditioning for discovery-oriented recommendation, but deploying them in production introduces challenges in catalog grounding, user-level personalization, and latency-critical serving. We address these challenges with GLIDE, a production-scale generative recommender for podcast discovery at Spotify. GLIDE formulates recommendation as an instruction-following task over a discretized catalog using Semantic IDs, enabling grounded generation over a large inventory. The model conditions on recent listening history and lightweight user context, while injecting long-term user embeddings as soft prompts to capture stable preferences under strict inference constraints. We evaluate GLIDE using offline retrieval metrics, human judgments, and LLM-based evaluation, and validate its impact through large-scale online A/B testing. Across experiments involving millions of users, GLIDE increases non-habitual podcast streaming on Spotify home surface by up to 5.4% and new-show discovery by up to 14.3%, while meeting production cost and latency constraints.
- Abstract(参考訳): ポッドキャストのリスニングはしばしばお気に入りの番組のセットに根ざされ、リスナーの意図は時間とともに進化する。
この安定した嗜好と意図の変化の組み合わせは、親しみと探索の両方を支援するレコメンデーションアプローチを動機付けている。
従来のレコメンデータシステムは、一般的に長期的な相互作用パターンを強調しており、リッチなコンテキスト信号や柔軟な意図認識の発見目的を組み込むように設計されていない。
この設定では、セマンティクス、コンテキスト、およびユーザ状態に対して共同で推論できるモデルが、有望な方向性を提供する。
大規模言語モデル(LLM)は、発見指向のレコメンデーションに対して強力なセマンティック推論とコンテキスト条件を提供するが、それらを本番環境にデプロイすることは、カタログの基盤化、ユーザレベルのパーソナライゼーション、レイテンシクリティカルなサービスに課題をもたらす。
Spotifyのポッドキャスト発見のための大規模生成レコメンデータであるGLIDEで,これらの課題に対処する。
GLIDEは、セマンティックIDを使用して離散化されたカタログ上での命令追従タスクとして推奨を定式化し、大規模な在庫に対して基底生成を可能にする。
近年のリスニング履歴と軽量ユーザコンテキストのモデル条件は,長期ユーザ埋め込みをソフトプロンプトとして注入することで,厳密な推論制約の下で安定した嗜好を捉えている。
オフライン検索指標,人的判断,LCMに基づく評価を用いてGLIDEを評価し,大規模オンラインA/Bテストによる影響を検証した。
数百万人のユーザを巻き込んだ実験を通じて、GLIDEはSpotifyのホームサーフェス上での非ライブポッドキャストストリーミングを最大5.4%増加し、新しいショー発見を最大14.3%増加させ、生産コストとレイテンシの制約を満たす。
関連論文リスト
- Towards Realistic Personalization: Evaluating Long-Horizon Preference Following in Personalized User-LLM Interactions [50.70965714314064]
大規模言語モデル(LLM)は、ユーザが拡張されたインタラクションよりも複雑で多様な好みを共有するパーソナルアシスタントとして、ますます機能している。
この研究は、パーソナライズされたユーザ-LLMインタラクションにおいて、リアルな嗜好フォローを評価するためのベンチマークであるRealPrefを提案する。
論文 参考訳(メタデータ) (2026-03-04T15:42:43Z) - GLASS: A Generative Recommender for Long-sequence Modeling via SID-Tier and Semantic Search [51.44490997013772]
GLASSは、SID-TierとSemantic Searchを通じて、長期的なユーザ関心を生成プロセスに統合する新しいフレームワークである。
GLASSは2つの大規模実世界のデータセットの実験において最先端のベースラインを上回っていることを示す。
論文 参考訳(メタデータ) (2026-02-05T13:48:33Z) - HyMiRec: A Hybrid Multi-interest Learning Framework for LLM-based Sequential Recommendation [24.720767926024433]
HyMiRecは、大規模言語モデルのためのハイブリッドシーケンシャルレコメンデーションフレームワークである。
長いユーザシーケンスから粗い関心埋め込みを抽出し、洗練された関心埋め込みをキャプチャするためのLLMベースのレコメンデータを抽出する。
ユーザの多様な嗜好をモデル化するために,不整合型多目的学習モジュールを設計する。
論文 参考訳(メタデータ) (2025-10-15T16:45:59Z) - Evaluating Podcast Recommendations with Profile-Aware LLM-as-a-Judge [8.554894195710204]
本稿では,ポッドキャスト推薦の質を評価するために,Large Language Models (LLMs) をオフライン裁判官として活用する新しいフレームワークを提案する。
まず,90日間の聴取履歴から抽出した自然言語のユーザプロファイルを構築した。
47名の被験者を対象にした対照研究において, プロファイル・アウェア・ジャッジは, 人間の判断に高い忠実度で一致し, 生聴取履歴を用いた変種よりも優れ, あるいは優れていた。
論文 参考訳(メタデータ) (2025-08-12T09:23:35Z) - Rhapsody: A Dataset for Highlight Detection in Podcasts [49.576469262265455]
Rhapsodyは13Kポッドキャストのエピソードで、セグメントレベルのハイライトと組み合わせています。
ポッドキャストハイライト検出をセグメントレベルのバイナリ分類タスクとして設定する。
様々なベースライン言語モデルと軽量な微調整言語モデルについて検討する。
論文 参考訳(メタデータ) (2025-05-26T02:39:34Z) - Towards Explainable Temporal User Profiling with LLMs [3.719862246745416]
我々は,大規模言語モデル(LLM)を利用して,ユーザのインタラクション履歴の自然言語要約を生成する。
我々のフレームワークは、時間的ユーザの好みをモデル化するだけでなく、解釈可能な方法でレコメンデーションを説明するために使える自然言語プロファイルも生成する。
論文 参考訳(メタデータ) (2025-05-01T22:02:46Z) - Mind the Gap! Static and Interactive Evaluations of Large Audio Models [55.87220295533817]
大型オーディオモデル(LAM)は、音声ネイティブな体験をパワーアップするために設計されている。
本研究は,484名の参加者から,LAMを評価し,7,500名のLAMインタラクションを収集する対話的アプローチを提案する。
論文 参考訳(メタデータ) (2025-02-21T20:29:02Z) - Latent User Intent Modeling for Sequential Recommenders [92.66888409973495]
逐次リコメンデータモデルは、プラットフォーム上での氏のインタラクション履歴に基づいて、ユーザが次に対話する可能性のあるアイテムを予測することを学習する。
しかし、ほとんどのシーケンシャルなレコメンデータは、ユーザの意図に対する高いレベルの理解を欠いている。
したがって、インテントモデリングはユーザー理解と長期ユーザーエクスペリエンスの最適化に不可欠である。
論文 参考訳(メタデータ) (2022-11-17T19:00:24Z) - Trajectory Based Podcast Recommendation [6.366468661321732]
ポッドキャストライブラリを次々に移動するユーザを見ることで、成功し、一貫したレコメンデーションを実現できることを示す。
提案手法により,協調フィルタリングベースライン上での効率が450%向上する。
論文 参考訳(メタデータ) (2020-09-08T16:49:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。