論文の概要: Gryphon: A Unified Architecture for Semantic-ID Generation and Item-Level Scoring in Industrial Recommendations
- arxiv url: http://arxiv.org/abs/2606.08604v2
- Date: Tue, 09 Jun 2026 13:50:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-10 13:21:50.725232
- Title: Gryphon: A Unified Architecture for Semantic-ID Generation and Item-Level Scoring in Industrial Recommendations
- Title(参考訳): Gryphon: インダストリアルレコメンデーションにおけるセマンティックID生成とアイテムレベルスコーリングのための統一アーキテクチャ
- Authors: Daria Tikhonovich, Oleg Sorokin, Vladislav Dodonov, Mariia Ulianova, Ilya Murzin,
- Abstract要約: 我々は、SID生成とともに、共同で訓練されたアイテムレベルスコアリングコンポーネントを導入する。
累積トークン確率でSIDをランク付けする代わりに、Gryphonは生成された各SIDを具体的なアイテムに分解する。
産業音楽サービスでは、次点の予測目標に基づいてアイテムレベルのスコアがトレーニングされた上で、GryphonはアイテムレベルのRecall@1000を最高レベルに到達した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative retrieval (GR) has become a scalable approach to candidate generation: each item is assigned a short hierarchical token sequence called a Semantic ID (SID), and the next item's SID is decoded autoregressively. A practical limitation is that the decoder's beam search optimizes the likelihood of token sequences, not the relevance of the underlying items. These objectives diverge when sequence likelihood is poorly calibrated due to beam search error accumulation, and when several items collapse onto a single SID and receive identical scores. We introduce Gryphon, an encoder-decoder generative recommendation architecture that adds a jointly trained item-level scoring component alongside SID generation, reusing the encoder's user representation computed in a single forward pass. Instead of ranking SIDs by accumulated token likelihood, Gryphon resolves each generated SID to its concrete items and re-scores those items directly, which sidesteps miscalibrated sequence scores and separates items that collide on the same identifier. On an industrial music service, with item-level scoring trained under a next-item-prediction objective, Gryphon attains the highest item-level Recall@1000, above the strongest baselines (+3.7% over vanilla GR and +2.5% over collision-resolved GR) at comparable parameter count and latency. Gryphon's item-level ranking also surpasses its beam-likelihood ranking of the same candidates (+4.2% gain), demonstrating the benefit of item-level scoring in GR. Deployed as the sole candidate source in a 7-day A/B test, Gryphon produced no statistically significant change in total listening time (+0.25%) while replacing a pipeline of more than 15 candidate generators and a separate preranking stage, substantially simplifying the candidate-generation system.
- Abstract(参考訳): 生成検索(GR)は、候補生成に対するスケーラブルなアプローチとなり、各項目は、セマンティックID(SID)と呼ばれる短い階層的なトークンシーケンスが割り当てられ、次の項目のSIDは自己回帰的にデコードされる。
現実的な制限は、デコーダのビームサーチは、基礎となるアイテムの関連性ではなく、トークンシーケンスの可能性を最適化するということである。
これらの目的は、ビーム探索誤差の蓄積によるシーケンス精度の低下と、複数の項目が1つのSIDに崩壊し、同一のスコアを受信した場合に分散する。
我々は,エンコーダ-デコーダ生成レコメンデーションアーキテクチャであるGryphonを紹介した。このアーキテクチャでは,SID生成と同時に,単一のフォワードパスで計算されたエンコーダのユーザ表現を再利用して,共同でトレーニングされた項目レベルスコアリングコンポーネントを追加する。
トークンの可能性の蓄積によってSIDをランク付けする代わりに、Gryphonは生成された各SIDを具体的項目に分解し、それらの項目を直接スコア付けする。
産業音楽サービスでは、次点の予測目標に基づいてアイテムレベルのスコアが訓練され、Gryphonは最も高いベースライン(バニラGR+3.7%、衝突解決GR+2.5%)を、同等のパラメータカウントとレイテンシで上回る、アイテムレベルのRecall@1000を達成している。
グリフォンのアイテムレベルランキングは、同じ候補者のビームライクなランキング(+4.2%)を上回り、GRのアイテムレベルスコアの利点を示している。
7日間のA/Bテストで唯一の候補として展開されたGryphonは、全聴取時間(+0.25%)に統計的に有意な変化は生じなかった。
関連論文リスト
- Closing the Indexing-Decoding Gap in Multimodal Generative Retrieval via Prefix Retention Optimization [68.48718919047127]
マルチモーダル生成検索式は、複数のモーダル検索を離散識別子生成として定義し、外部埋め込みよりも明示的な類似性探索を不要とする。
既存の手法では、残差量子化によって識別子を構築し、トリエ制約ビームサーチでデコードする。
この組み合わせは、インデックス化とデコーディングのギャップを導入している: 識別子学習の目的は、再構成や対照的な損失を含むが、デコーディング中にプレフィックスの識別性を明示的に強制しない。
1)プレフィックスの格付け蒸留は、リストワイドロスを用いた事前量子化埋め込みによって誘導されるプレフィックスと整合する; (ii)語彙スケジューリングは、コードブックを増大させる。
論文 参考訳(メタデータ) (2026-06-08T09:15:47Z) - How Reliable Are Semantic-ID Tokenizer Comparisons in Generative Recommendation? [3.9133310867939177]
生成レコメンデーションでは、各項目を離散コードのシーケンスとして表現し、自己回帰モデルを訓練して次の項目のSIDシーケンスを生成する。
この評価プロトコルは、SIDレベルのマッチングとアイテムレベルのレコメンデーションとを等価とし、各SIDシーケンスが1つのアイテムにマップされたときにのみ保持される同値である。
トークンーはアイテムの特徴をコード空間に圧縮するので、意味的に類似しているが協調的に異なるアイテムは、しばしば同じSIDシーケンスに割り当てられる。
論文 参考訳(メタデータ) (2026-05-25T01:22:45Z) - F-GRPO: Factorized Group-Relative Policy Optimization for Unified Candidate Generation and Ranking [79.49893545611779]
大規模言語モデル(LLM)はサブセットを生成し、それを1つの自己回帰パス内で順序付けることができる。
この柔軟性は、新しい最適化課題をもたらす: モデルが出力空間を検索し、完全なランクリストが生成された後にのみユーティリティフィードバックを受けなければならない。
このクレジット割り当てギャップは、エンドツーエンドの最適化を不安定にし、サンプル非効率にする。
本稿では,単一自己回帰的ロールアウト内の両方を実行する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2026-05-13T04:52:33Z) - CapsID: Soft-Routed Variable-Length Semantic IDs for Generative Recommendation [6.439016735163573]
生成レコメンデーションは、各項目をセマンティックID(SID)のシーケンスにマッピングし、検索を自己回帰トークン生成として再キャストする。
CAPSIDは硬質残留量子化をカプセルルーティングに置き換える。
Amazon Beauty, Sports, Toys, and a 35M-item industrial catalogでは、CAPSID+SEMANTICBPEはReSIDよりも平均して10.6%改善している。
論文 参考訳(メタデータ) (2026-05-06T16:33:13Z) - From Local Indices to Global Identifiers: Generative Reranking for Recommender Systems via Global Action Space [50.72071213515985]
GloRankは、ローカルインデックスの選択からグローバル識別子の生成に移行する、ジェネレーティブなフレームワークである。
我々はGloRankが最先端のベースラインを一貫して上回り、コールドスタートシナリオにおいて優れたロバスト性を実現することを示す。
論文 参考訳(メタデータ) (2026-04-28T06:57:00Z) - UniRec: Bridging the Expressive Gap between Generative and Discriminative Recommendation via Chain-of-Attribute [12.89120699793625]
Generative Recommendation (GR) reframes search and ranking as autoregressive decoding over Semantic IDs (SIDs)
p(y|f,u) によるランクは p(f|y,u) によるランクと同値であり、アイテムの特徴を自己回帰的に分解する。
提案するUniRecとChain-of-Attribute(CoA)は、その中核となるメカニズムである。CoAは、SIDを復号する前に構造化属性トークン:カテゴリ、販売者、ブランドを含む各SIDシーケンスをプレフィックスし、識別モデルが活用するアイテム側の特徴交差を復元する。
論文 参考訳(メタデータ) (2026-04-14T03:13:50Z) - Differentiable Semantic ID for Generative Recommendation [65.83703273297492]
生成的推薦は、各項目がリッチコンテンツから学習された個別意味ID(SID)によって表現される新しいパラダイムを提供する。
実際には、SIDはレコメンデーションの正確さよりもコンテンツ再構成に最適化されるのが一般的である。
自然なアプローチは、セマンティックインデックスを差別化して、レコメンデーショングラデーションが直接SID学習に影響を与えるようにすることだ。
本稿では,ジェネレーティブレコメンデーションのための効果的な識別可能なセマンティックIDに向けた第一歩として,DIGERを提案する。
論文 参考訳(メタデータ) (2026-01-27T15:34:11Z) - DiffGRM: Diffusion-based Generative Recommendation Model [63.35379395455103]
ジェネレーティブレコメンデーション(GR)は、トークン化器を介して各項目をn桁のセマンティックID(SID)として表現する新興パラダイムである。
自己回帰デコーダをマスク付き離散拡散モデル(MDM)に置き換える拡散ベースGRモデルDiffGRMを提案する。
実験では、複数のデータセットに対する強力な生成的および差別的推奨ベースラインよりも一貫した利得を示す。
論文 参考訳(メタデータ) (2025-10-21T03:23:32Z) - Recommender Systems with Generative Retrieval [58.454606442670034]
本稿では,対象候補の識別子を自己回帰的に復号する新たな生成検索手法を提案する。
そのために、各項目のセマンティックIDとして機能するために、意味論的に意味のあるコードワードを作成します。
提案手法を用いて学習した推薦システムは,様々なデータセット上での現在のSOTAモデルよりも大幅に優れていることを示す。
論文 参考訳(メタデータ) (2023-05-08T21:48:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。