論文の概要: A Simple Contrastive Framework Of Item Tokenization For Generative Recommendation
- arxiv url: http://arxiv.org/abs/2506.16683v1
- Date: Fri, 20 Jun 2025 01:54:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-23 19:00:05.306081
- Title: A Simple Contrastive Framework Of Item Tokenization For Generative Recommendation
- Title(参考訳): ジェネレーティブレコメンデーションのためのアイテムトークン化の簡易コントラスト的枠組み
- Authors: Penglong Zhai, Yifang Yuan, Fanyi Di, Jie Li, Yue Liu, Chen Li, Jie Huang, Sicong Wang, Yao Xu, Xin Li,
- Abstract要約: コントラスト学習に基づく新しい教師なし深層量子化手法SimCITを提案する。
SimCITは、相互に有益なコントラスト学習フレームワークにおいて、マルチモーダルな知識アライメントとセマンティックトークン化を組み合わせる。
- 参考スコア(独自算出の注目度): 19.848402658341985
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative retrieval-based recommendation has emerged as a promising paradigm aiming at directly generating the identifiers of the target candidates. However, in large-scale recommendation systems, this approach becomes increasingly cumbersome due to the redundancy and sheer scale of the token space. To overcome these limitations, recent research has explored the use of semantic tokens as an alternative to ID tokens, which typically leveraged reconstruction-based strategies, like RQ-VAE, to quantize content embeddings and significantly reduce the embedding size. However, reconstructive quantization aims for the precise reconstruction of each item embedding independently, which conflicts with the goal of generative retrieval tasks focusing more on differentiating among items. Moreover, multi-modal side information of items, such as descriptive text and images, geographical knowledge in location-based recommendation services, has been shown to be effective in improving recommendations by providing richer contexts for interactions. Nevertheless, effectively integrating such complementary knowledge into existing generative recommendation frameworks remains challenging. To overcome these challenges, we propose a novel unsupervised deep quantization exclusively based on contrastive learning, named SimCIT (a Simple Contrastive Item Tokenization framework). Specifically, different from existing reconstruction-based strategies, SimCIT propose to use a learnable residual quantization module to align with the signals from different modalities of the items, which combines multi-modal knowledge alignment and semantic tokenization in a mutually beneficial contrastive learning framework. Extensive experiments across public datasets and a large-scale industrial dataset from various domains demonstrate SimCIT's effectiveness in LLM-based generative recommendation.
- Abstract(参考訳): 生成検索に基づくレコメンデーションは,対象候補の識別子を直接生成することを目的とした,有望なパラダイムとして浮上している。
しかし、大規模レコメンデーションシステムでは、トークン空間の冗長性と重大さのため、このアプローチはますます困難になる。
これらの制限を克服するため、最近の研究では、RQ-VAEのような再構成ベースの戦略を活用して、コンテンツの埋め込みを定量化し、埋め込みサイズを大幅に削減するIDトークンの代替としてセマンティックトークンの使用について検討している。
しかし, 再構成量子化は, 個別に埋め込まれた各項目を正確に再構成することを目的としており, 項目間の差分に着目した生成検索タスクの目的と矛盾する。
さらに,記述的テキストや画像,位置情報に基づくレコメンデーションサービスにおける地理的知識といった項目のマルチモーダルな側面情報は,よりリッチなインタラクションコンテキストを提供することで,レコメンデーションの改善に有効であることが示されている。
それでも、そのような補完的な知識を既存の生成的推薦フレームワークに効果的に統合することは困難である。
これらの課題を克服するために,SimCIT(Simple Contrastive Item Tokenization framework)という,対照的な学習のみに基づく,教師なしの深層量子化を提案する。
具体的には、既存の再構築戦略と異なり、SimCITは学習可能な残留量子化モジュールを使用して、相互に有益なコントラスト学習フレームワークにおいて、多モードの知識アライメントとセマンティックトークン化を組み合わせた、項目の異なるモダリティからの信号と整合させることを提案する。
パブリックデータセット全体にわたる大規模な実験と、さまざまなドメインからの大規模産業データセットは、LLMベースの生成レコメンデーションにおけるSimCITの有効性を実証している。
関連論文リスト
- Breaking the Clusters: Uniformity-Optimization for Text-Based Sequential Recommendation [17.042627742322427]
従来のシーケンシャルレコメンデーションメソッドは、時間の経過とともにユーザの好みをキャプチャするために明示的なアイテムIDに依存している。
近年,テキストのみの情報をレコメンデーションに活用する研究が進んでいる。
我々は3つのペアワイズアイテムサンプリング戦略を利用するフレームワークUniTを提案する。
論文 参考訳(メタデータ) (2025-02-19T08:35:28Z) - Hierarchical Reinforcement Learning for Temporal Abstraction of Listwise Recommendation [51.06031200728449]
我々はmccHRLと呼ばれる新しいフレームワークを提案し、リストワイドレコメンデーションにおける時間的抽象化のレベルを異なるものにする。
階層的な枠組みの中では、ハイレベルエージェントがユーザ知覚の進化を研究し、低レベルエージェントがアイテム選択ポリシーを作成している。
その結果,本手法による性能改善は,いくつかのよく知られたベースラインと比較して有意な結果が得られた。
論文 参考訳(メタデータ) (2024-09-11T17:01:06Z) - X-Reflect: Cross-Reflection Prompting for Multimodal Recommendation [47.96737683498274]
LMM(Large Language Models)とLMM(Large Multimodal Models)は、アイテム記述を充実させる効果を高めることが示されている。
本稿では,テキストと画像間の支援的・矛盾する情報をLMMに明示的に識別・調整するよう促すことにより,制約に対処する新しいフレームワークであるクロス・リフレクション・プロンプト(Cross-Reflex Prompting)を提案する。
論文 参考訳(メタデータ) (2024-08-27T16:10:21Z) - MMREC: LLM Based Multi-Modal Recommender System [2.3113916776957635]
本稿では,Large Language Models(LLM)とディープラーニング技術を活用して,レコメンデータシステムを強化する新しい手法を提案する。
提案フレームワークは,マルチモーダル情報処理を取り入れたレコメンデーションの精度と妥当性を,統一された潜在空間表現を用いて向上することを目的としている。
論文 参考訳(メタデータ) (2024-08-08T04:31:29Z) - LLM4Rerank: LLM-based Auto-Reranking Framework for Recommendations [51.76373105981212]
リグレードはレコメンデーションシステムにおいて重要な要素であり、レコメンデーションアルゴリズムの出力を精査する上で重要な役割を果たす。
そこで我々は,様々な格付け基準をシームレスに統合する包括的格付けフレームワークを提案する。
カスタマイズ可能な入力機構も統合されており、言語モデルのフォーカスを特定の再配置のニーズに合わせることができる。
論文 参考訳(メタデータ) (2024-06-18T09:29:18Z) - TokenRec: Learning to Tokenize ID for LLM-based Generative Recommendation [16.93374578679005]
TokenRecは、大規模言語モデル(LLM)ベースのRecommender Systems(RecSys)のトークン化と検索のための新しいフレームワークである。
我々の戦略であるMasked Vector-Quantized (MQ) Tokenizerは、協調フィルタリングから学んだマスキングされたユーザ/イテム表現を離散トークンに定量化する。
我々の生成的検索パラダイムは,自動回帰復号処理やビーム検索処理の不要さを解消するために,ユーザに対してKドル以上のアイテムを効率的に推奨するように設計されている。
論文 参考訳(メタデータ) (2024-06-15T00:07:44Z) - Learnable Item Tokenization for Generative Recommendation [78.30417863309061]
LETTER (Larnable Tokenizer for generaTivE Recommendation) を提案する。
LETTERは、セマンティック正規化のためのResidual Quantized VAE、協調正規化のためのコントラストアライメント損失、コードの割り当てバイアスを軽減するための多様性損失を組み込んでいる。
論文 参考訳(メタデータ) (2024-05-12T15:49:38Z) - Active Refinement for Multi-Label Learning: A Pseudo-Label Approach [84.52793080276048]
MLL(Multi-label Learning)は、あるインスタンスと関連するラベルを一連の概念から関連付けることを目的としている。
MLLの以前の研究は、主に概念セットが修正されると思われる設定に焦点を当てていた。
多くの現実世界のアプリケーションは、新しい要求を満たすために新しい概念をセットに導入する必要がある。
論文 参考訳(メタデータ) (2021-09-29T19:17:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。