論文の概要: Universal Item Tokenization for Transferable Generative Recommendation
- arxiv url: http://arxiv.org/abs/2504.04405v1
- Date: Sun, 06 Apr 2025 08:07:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-08 14:13:05.670757
- Title: Universal Item Tokenization for Transferable Generative Recommendation
- Title(参考訳): 転送可能な生成レコメンデーションのためのユニバーサルアイテムのトークン化
- Authors: Bowen Zheng, Hongyu Lu, Yu Chen, Wayne Xin Zhao, Ji-Rong Wen,
- Abstract要約: 本稿では、転送可能な生成レコメンデーションのためのユニバーサルアイテムトークン化手法であるUTGRecを提案する。
木構造コードブックを考案することにより、コンテンツ表現をアイテムトークン化のための対応するコードに識別する。
生のコンテンツ再構成には、アイテムテキストとイメージを離散表現から再構成するために、デュアルライトウェイトデコーダを用いる。
協調的知識統合においては,共起的アイテムが類似していると仮定し,共起的アライメントと再構築を通じて協調的信号を統合する。
- 参考スコア(独自算出の注目度): 89.42584009980676
- License:
- Abstract: Recently, generative recommendation has emerged as a promising paradigm, attracting significant research attention. The basic framework involves an item tokenizer, which represents each item as a sequence of codes serving as its identifier, and a generative recommender that predicts the next item by autoregressively generating the target item identifier. However, in existing methods, both the tokenizer and the recommender are typically domain-specific, limiting their ability for effective transfer or adaptation to new domains. To this end, we propose UTGRec, a Universal item Tokenization approach for transferable Generative Recommendation. Specifically, we design a universal item tokenizer for encoding rich item semantics by adapting a multimodal large language model (MLLM). By devising tree-structured codebooks, we discretize content representations into corresponding codes for item tokenization. To effectively learn the universal item tokenizer on multiple domains, we introduce two key techniques in our approach. For raw content reconstruction, we employ dual lightweight decoders to reconstruct item text and images from discrete representations to capture general knowledge embedded in the content. For collaborative knowledge integration, we assume that co-occurring items are similar and integrate collaborative signals through co-occurrence alignment and reconstruction. Finally, we present a joint learning framework to pre-train and adapt the transferable generative recommender across multiple domains. Extensive experiments on four public datasets demonstrate the superiority of UTGRec compared to both traditional and generative recommendation baselines.
- Abstract(参考訳): 近年、生成的推薦が有望なパラダイムとして登場し、研究の注目が集まっている。
基本的なフレームワークは、各アイテムを識別子として機能するコードのシーケンスとして表現するアイテムトークンライザと、ターゲットのアイテム識別子を自動回帰生成して次のアイテムを予測する生成レコメンデータとを含む。
しかし、既存の手法では、トークン化器とレコメンダの両方がドメイン固有であり、新しいドメインへの効果的な転送や適応の能力を制限する。
この目的のために,転送可能な生成レコメンデーションのためのユニバーサルアイテムトークン化手法であるUTGRecを提案する。
具体的には,多モーダル大言語モデル (MLLM) を適用したリッチアイテム意味論を符号化するためのユニバーサルアイテムトークンを設計する。
木構造コードブックを考案することにより、コンテンツ表現をアイテムトークン化のための対応するコードに識別する。
複数の領域で共通アイテムトークン化器を効果的に学習するために,本手法では2つの重要な手法を導入する。
生のコンテンツ再構成には、コンテンツに埋め込まれた一般的な知識を捉えるために、アイテムテキストと画像の個別表現からの再構成にデュアルライトウェイトデコーダを用いる。
協調的知識統合においては,共起的アイテムが類似していると仮定し,共起的アライメントと再構築を通じて協調的信号を統合する。
最後に,複数の領域にまたがる伝達可能な生成レコメンデータを事前学習し,適応するための共同学習フレームワークを提案する。
4つの公開データセットに対する大規模な実験は、従来の推奨ベースラインと生成推奨ベースラインの両方と比較してUTGRecの優位性を示している。
関連論文リスト
- STORE: Streamlining Semantic Tokenization and Generative Recommendation with A Single LLM [59.08493154172207]
本稿では,意味的トークン化と生成的レコメンデーションプロセスを合理化する統合フレームワークを提案する。
我々は,意味的トークン化をテキスト・ツー・ケントタスクとして定式化し,生成的推薦をトークン・ツー・ケントタスクとして,トークン・ツー・ケント・コンストラクションタスクとテキスト・ツー・ケント補助タスクで補足する。
これらのタスクはすべて生成的な方法でフレーム化され、単一の大規模言語モデル(LLM)バックボーンを使用してトレーニングされる。
論文 参考訳(メタデータ) (2024-09-11T13:49:48Z) - End-to-End Learnable Item Tokenization for Generative Recommendation [51.82768744368208]
本稿では,アイテムのトークン化と生成レコメンデーションをシームレスに統合した,新しいエンドツーエンド生成レコメンダであるETEGRecを提案する。
本フレームワークは、アイテムトークン化器と生成レコメンデータで構成されるデュアルエンコーダデコーダアーキテクチャに基づいて開発されている。
論文 参考訳(メタデータ) (2024-09-09T12:11:53Z) - EAGER: Two-Stream Generative Recommender with Behavior-Semantic Collaboration [63.112790050749695]
本稿では,行動情報と意味情報の両方をシームレスに統合する新しい生成推薦フレームワークであるEAGERを紹介する。
EAGERの有効性を4つの公開ベンチマークで検証し,既存手法と比較して優れた性能を示した。
論文 参考訳(メタデータ) (2024-06-20T06:21:56Z) - MMGRec: Multimodal Generative Recommendation with Transformer Model [81.61896141495144]
MMGRecは、マルチモーダルレコメンデーションに生成パラダイムを導入することを目指している。
まず,階層的な量子化手法であるGraph CF-RQVAEを考案し,各項目にRec-IDを割り当てる。
次に、Transformerベースのレコメンデータをトレーニングし、過去のインタラクションシーケンスに基づいて、ユーザが推奨するアイテムのRec-IDを生成する。
論文 参考訳(メタデータ) (2024-04-25T12:11:27Z) - Learning Vector-Quantized Item Representation for Transferable
Sequential Recommenders [33.406897794088515]
VQ-Recは、転送可能なシーケンシャルリコメンダのためのベクトル量子化アイテム表現を学ぶための新しいアプローチである。
半合成および混合ドメインのコード表現をハードな負として用い、拡張されたコントラスト事前学習手法を提案する。
論文 参考訳(メタデータ) (2022-10-22T00:43:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。