論文の概要: Generative Recommendation with Semantic IDs: A Practitioner's Handbook
- arxiv url: http://arxiv.org/abs/2507.22224v1
- Date: Tue, 29 Jul 2025 20:41:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-31 16:14:17.86889
- Title: Generative Recommendation with Semantic IDs: A Practitioner's Handbook
- Title(参考訳): 意味的IDを用いたジェネレーティブレコメンデーション:実践者の手帳
- Authors: Clark Mingxuan Ju, Liam Collins, Leonardo Neves, Bhuvesh Kumar, Louis Yufeng Wang, Tong Zhao, Neil Shah,
- Abstract要約: Generative Recommendation (GR) は、従来のモデルと比較して有望なパフォーマンスで注目を集めている。
GRの成功に寄与する重要な要因はセマンティックID(SID)であり、連続的なセマンティック表現を離散IDシーケンスに変換する。
本研究は,モジュール性に特化して設計されたセマンティックID,すなわちGRIDを用いたジェネレーティブレコメンデーションフレームワークを紹介し,オープンソース化する。
- 参考スコア(独自算出の注目度): 34.25784373770595
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative recommendation (GR) has gained increasing attention for its promising performance compared to traditional models. A key factor contributing to the success of GR is the semantic ID (SID), which converts continuous semantic representations (e.g., from large language models) into discrete ID sequences. This enables GR models with SIDs to both incorporate semantic information and learn collaborative filtering signals, while retaining the benefits of discrete decoding. However, varied modeling techniques, hyper-parameters, and experimental setups in existing literature make direct comparisons between GR proposals challenging. Furthermore, the absence of an open-source, unified framework hinders systematic benchmarking and extension, slowing model iteration. To address this challenge, our work introduces and open-sources a framework for Generative Recommendation with semantic ID, namely GRID, specifically designed for modularity to facilitate easy component swapping and accelerate idea iteration. Using GRID, we systematically experiment with and ablate different components of GR models with SIDs on public benchmarks. Our comprehensive experiments with GRID reveal that many overlooked architectural components in GR models with SIDs substantially impact performance. This offers both novel insights and validates the utility of an open-source platform for robust benchmarking and GR research advancement. GRID is open-sourced at https://github.com/snap-research/GRID.
- Abstract(参考訳): ジェネレーティブレコメンデーション(GR)は、従来のモデルと比較して、期待できるパフォーマンスで注目を集めている。
GRの成功に寄与する重要な要因はセマンティックID(SID)であり、これは連続的なセマンティック表現(例えば、大きな言語モデルから)を離散IDシーケンスに変換するものである。
これにより、SIDを持つGRモデルは、セマンティック情報と協調フィルタリング信号の両方を組み込むことができ、離散復号の利点を保ちながら学習することができる。
しかし、既存文献における様々なモデリング手法、ハイパーパラメータ、実験的な設定は、GR提案間の直接比較を困難にしている。
さらに、オープンソースで統一されたフレームワークがないため、システマティックなベンチマークと拡張が妨げられ、モデルの反復が遅くなる。
この課題に対処するため、我々の研究はセマンティックID(GRID)を使ったジェネレーティブレコメンデーションフレームワークを導入、オープンソース化しました。
GRIDを用いて、公的なベンチマークでSIDを用いてGRモデルの異なるコンポーネントを体系的に実験し、比較した。
GRIDを用いた総合的な実験により、SIDを持つGRモデルの多くの見過ごされたアーキテクチャコンポーネントが性能に大きな影響を与えていることが明らかとなった。
これは、新しい洞察を提供し、堅牢なベンチマークとGR研究の進歩のためのオープンソースのプラットフォームの有用性を検証する。
GRIDはhttps://github.com/snap-research/GRIDでオープンソース化されている。
関連論文リスト
- ImpRAG: Retrieval-Augmented Generation with Implicit Queries [49.510101132093396]
ImpRAGは、検索と生成を統一モデルに統合するクエリフリーなRAGシステムである。
我々は、ImpRAGが、多様な形式を持つ未確認タスクの正確なマッチスコアを3.6-11.5改善したことを示す。
論文 参考訳(メタデータ) (2025-06-02T21:38:21Z) - UniversalRAG: Retrieval-Augmented Generation over Corpora of Diverse Modalities and Granularities [53.76854299076118]
UniversalRAGは異種情報源からの知識を多様さと粒度で検索・統合するための新しいRAGフレームワークである。
本稿では,最も適切なモダリティ固有コーパスを動的に識別し,その内部でターゲット検索を行うモダリティ対応ルーティング機構を提案する。
マルチモーダル性にまたがる8つのベンチマークでUniversalRAGを検証する。
論文 参考訳(メタデータ) (2025-04-29T13:18:58Z) - SemCORE: A Semantic-Enhanced Generative Cross-Modal Retrieval Framework with MLLMs [70.79124435220695]
セマンティック強化型Cross-mOdal Retrievalフレームワーク(SemCORE)を提案する。
まず,自然言語の理解と生成に最適化された生成モデルとターゲット識別子を効果的に整合させる構造化自然言語識別器(SID)を構築した。
次に、粒度の細かいターゲット識別を可能にするジェネレーティブ・セマンティック・検証(GSV)戦略を導入する。
論文 参考訳(メタデータ) (2025-04-17T17:59:27Z) - Beyond Unimodal Boundaries: Generative Recommendation with Multimodal Semantics [46.79459036259515]
実世界のデータのリッチでマルチモーダルな性質を考えると、これは大きな制限であると言えるでしょう。
GRモデルが特に異なるモダリティに敏感であることを明らかにするとともに,有効なGRを実現する上での課題について検討する。
MGR-LF++は、異なるモダリティを表すために、対照的なモダリティアライメントと特別なトークンを利用する拡張レイトフュージョンフレームワークである。
論文 参考訳(メタデータ) (2025-03-30T06:24:43Z) - FlashRAG: A Modular Toolkit for Efficient Retrieval-Augmented Generation Research [70.6584488911715]
検索増強世代(RAG)は、かなりの研究関心を集めている。
既存のRAGツールキットは、しばしば重くて柔軟であり、研究者のカスタマイズのニーズを満たすことができない。
我々のツールキットは16の高度なRAGメソッドを実装し、38のベンチマークデータセットを収集し、整理した。
論文 参考訳(メタデータ) (2024-05-22T12:12:40Z) - CorpusLM: Towards a Unified Language Model on Corpus for Knowledge-Intensive Tasks [20.390672895839757]
Retrieval-augmented Generation (RAG) は、事実精度を高めるための一般的なソリューションとして登場した。
従来の検索モジュールは、大きなドキュメントインデックスと生成タスクとの切り離しに依存していることが多い。
生成検索,クローズドブック生成,RAGを統合した統一言語モデルである textbfCorpusLM を提案する。
論文 参考訳(メタデータ) (2024-02-02T06:44:22Z) - Gait Recognition in the Wild: A Large-scale Benchmark and NAS-based
Baseline [95.88825497452716]
歩行ベンチマークにより、研究コミュニティは高性能歩行認識システムの訓練と評価を行うことができる。
GREWは、野生における歩行認識のための最初の大規模データセットである。
SPOSGaitはNASベースの最初の歩行認識モデルである。
論文 参考訳(メタデータ) (2022-05-05T14:57:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。