Fugu-MT 論文翻訳(概要): CoST: Contrastive Quantization based Semantic Tokenization for Generative Recommendation

論文の概要: CoST: Contrastive Quantization based Semantic Tokenization for Generative Recommendation

arxiv url: http://arxiv.org/abs/2404.14774v2
Date: Sat, 07 Sep 2024 16:11:36 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-03 14:01:28.256776
Title: CoST: Contrastive Quantization based Semantic Tokenization for Generative Recommendation
Title（参考訳）: CoST:ジェネレーティブレコメンデーションのためのコントラスト量子化に基づく意味的トークン化
Authors: Jieming Zhu, Mengqun Jin, Qijiong Liu, Zexuan Qiu, Zhenhua Dong, Xiu Li,
Abstract要約: 我々は、アイテムの関係と意味情報の両方を利用して意味的トークンを学習する、コントラッシブな量子化に基づく意味的トークン化手法CoSTを提案する。この結果から,意味的トークン化が生成的推薦性能に与える影響が明らかとなった。
参考スコア（独自算出の注目度）: 38.97136297977874
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Embedding-based retrieval serves as a dominant approach to candidate item matching for industrial recommender systems. With the success of generative AI, generative retrieval has recently emerged as a new retrieval paradigm for recommendation, which casts item retrieval as a generation problem. Its model consists of two stages: semantic tokenization and autoregressive generation. The first stage involves item tokenization that constructs discrete semantic tokens to index items, while the second stage autoregressively generates semantic tokens of candidate items. Therefore, semantic tokenization serves as a crucial preliminary step for training generative recommendation models. Existing research usually employs a vector quantizier with reconstruction loss (e.g., RQ-VAE) to obtain semantic tokens of items, but this method fails to capture the essential neighborhood relationships that are vital for effective item modeling in recommender systems. In this paper, we propose a contrastive quantization-based semantic tokenization approach, named CoST, which harnesses both item relationships and semantic information to learn semantic tokens. Our experimental results highlight the significant impact of semantic tokenization on generative recommendation performance, with CoST achieving up to a 43% improvement in Recall@5 and 44% improvement in NDCG@5 on the MIND dataset over previous baselines.
Abstract（参考訳）: 埋め込み型検索は、産業レコメンデーションシステムにおける候補項目マッチングに対する支配的なアプローチとして機能する。生成型AIの成功に伴い、生成型検索はレコメンデーションのための新しい検索パラダイムとして登場し、アイテム検索を生成問題として捉えている。そのモデルはセマンティックトークン化と自己回帰生成という2つの段階から構成される。第1段階は、個別の意味トークンを構成するアイテムトークン化と、第2段階は、候補項目のセマンティックトークンを自動回帰的に生成する。したがって、意味的トークン化は、生成的レコメンデーションモデルをトレーニングするための重要な予備ステップとなる。既存の研究では、復元損失(例えばRQ-VAE)を持つベクトル量子化器を用いてアイテムのセマンティックトークンを取得するが、この手法はレコメンデーターシステムにおいて効果的なアイテムモデリングに不可欠である必須の近傍関係を捉えることに失敗する。本稿では、アイテム関係と意味情報の両方を利用して意味的トークンを学習する、コントラッシブな量子化に基づく意味的トークン化手法であるCoSTを提案する。実験結果から, セマンティックトークン化が生成レコメンデーション性能に与える影響が明らかになり, CoSTはリコール@5が43%, NDCG@5が44%向上した。

関連論文リスト

Unleash the Potential of Long Semantic IDs for Generative Recommendation [5.6264583086973685]
ACERecは、きめ細かいトークン化と効率的なシーケンシャルモデリングのギャップを分離する新しいフレームワークである。 6つの実世界のベンチマークにおいて、最先端のベースラインを一貫して上回る。
論文参考訳（メタデータ） (2026-02-14T03:15:31Z)
GLASS: A Generative Recommender for Long-sequence Modeling via SID-Tier and Semantic Search [51.44490997013772]
GLASSは、SID-TierとSemantic Searchを通じて、長期的なユーザ関心を生成プロセスに統合する新しいフレームワークである。 GLASSは2つの大規模実世界のデータセットの実験において最先端のベースラインを上回っていることを示す。
論文参考訳（メタデータ） (2026-02-05T13:48:33Z)
Rethinking Generative Recommender Tokenizer: Recsys-Native Encoding and Semantic Quantization Beyond LLMs [17.944727019161878]
ReSIDは、情報保存とシーケンシャルな予測可能性の観点から学ぶことを推奨する、原則化されたSIDフレームワークである。高いシーケンシャルおよびSIDベースの生成ベースラインを平均10%以上上回り、トークン化コストを最大122倍削減する。
論文参考訳（メタデータ） (2026-02-02T17:00:04Z)
PRISM: Purified Representation and Integrated Semantic Modeling for Generative Sequential Recommendation [28.629759086187352]
本稿では,PRISMとPureified RepresentationとIntegrated Semantic Modelingを組み合わせた新しい生成レコメンデーションフレームワークを提案する。 PRISMは4つの実世界のデータセットで、最先端のベースラインを一貫して上回る。
論文参考訳（メタデータ） (2026-01-23T08:50:16Z)
Sparse Meets Dense: Unified Generative Recommendations with Cascaded Sparse-Dense Representations [22.48125906976824]
カスケード型組織的ビ表現型ジェネリック検索フレームワークを導入し,カスケード処理を通じてスパース意味IDと高密度ベクトルを統合する。本手法は,これらの表現をまずスパースIDを生成して交互に生成し,高密度ベクトルの生成を支援する条件として機能する。推論の間、COBRAは粗大な戦略を採用し、スパースID生成から始まり、生成モデルを介してそれらを密度の高いベクトルに精製する。
論文参考訳（メタデータ） (2025-03-04T10:00:05Z)
Unifying Generative and Dense Retrieval for Sequential Recommendation [37.402860622707244]
逐次密度検索と生成検索の強みを組み合わせたハイブリッドモデルであるLIGERを提案する。 LIGERは、シーケンシャルな高密度検索を生成検索に統合し、性能差を緩和し、コールドスタートアイテムレコメンデーションを強化する。このハイブリッドアプローチは、これらのアプローチ間のトレードオフに関する洞察を与え、小規模ベンチマークにおけるレコメンデーションシステムの効率と効率性の向上を示す。
論文参考訳（メタデータ） (2024-11-27T23:36:59Z)
Unleash LLMs Potential for Recommendation by Coordinating Twin-Tower Dynamic Semantic Token Generator [60.07198935747619]
動的セマンティック・インデックス・パラダイムを採用した最初の生成型RSであるTTDS(Twin-Tower Dynamic Semantic Recommender)を提案する。より具体的には、ツイン・トワー・セマンティック・トークン・ジェネレータをLLMベースのレコメンデータに統合する動的知識融合フレームワークを初めて提案する。提案したTTDSレコメンデータは,平均19.41%のヒットレート,20.84%のNDCG測定値を実現している。
論文参考訳（メタデータ） (2024-09-14T01:45:04Z)
STORE: Streamlining Semantic Tokenization and Generative Recommendation with A Single LLM [59.08493154172207]
本稿では,意味的トークン化と生成的レコメンデーションプロセスを合理化する統合フレームワークを提案する。我々は,意味的トークン化をテキスト・ツー・ケントタスクとして定式化し,生成的推薦をトークン・ツー・ケントタスクとして,トークン・ツー・ケント・コンストラクションタスクとテキスト・ツー・ケント補助タスクで補足する。これらのタスクはすべて生成的な方法でフレーム化され、単一の大規模言語モデル(LLM)バックボーンを使用してトレーニングされる。
論文参考訳（メタデータ） (2024-09-11T13:49:48Z)
Diffusion-based Contrastive Learning for Sequential Recommendation [6.3482831836623355]
本稿では,CaDiRecという,文脈対応拡散に基づく逐次推薦のためのコントラスト学習を提案する。 CaDiRecは、コンテキスト対応拡散モデルを使用して、シーケンス内の所定の位置に対する代替アイテムを生成する。フレームワーク全体をエンドツーエンドでトレーニングし、拡散モデルとレコメンデーションモデルの間でアイテムの埋め込みを共有します。
論文参考訳（メタデータ） (2024-05-15T14:20:37Z)
Learnable Item Tokenization for Generative Recommendation [78.30417863309061]
LETTER (Larnable Tokenizer for generaTivE Recommendation) を提案する。 LETTERは、セマンティック正規化のためのResidual Quantized VAE、協調正規化のためのコントラストアライメント損失、コードの割り当てバイアスを軽減するための多様性損失を組み込んでいる。
論文参考訳（メタデータ） (2024-05-12T15:49:38Z)
Recommender Systems with Generative Retrieval [58.454606442670034]
本稿では,対象候補の識別子を自己回帰的に復号する新たな生成検索手法を提案する。そのために、各項目のセマンティックIDとして機能するために、意味論的に意味のあるコードワードを作成します。提案手法を用いて学習した推薦システムは,様々なデータセット上での現在のSOTAモデルよりも大幅に優れていることを示す。
論文参考訳（メタデータ） (2023-05-08T21:48:17Z)
Contrastive Self-supervised Sequential Recommendation with Robust Augmentation [101.25762166231904]
Sequential Recommendation Describes a set of technique to model dynamic user behavior to order to predict future interaction in sequence user data。データスパーシリティやノイズの多いデータなど、古くて新しい問題はまだ残っている。逐次レコメンデーション(CoSeRec)のためのコントラスト型自己監督学習を提案する。
論文参考訳（メタデータ） (2021-08-14T07:15:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。