論文の概要: Drift-Aware Continual Tokenization for Generative Recommendation
- arxiv url: http://arxiv.org/abs/2603.29705v1
- Date: Tue, 31 Mar 2026 13:02:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-01 15:25:03.671638
- Title: Drift-Aware Continual Tokenization for Generative Recommendation
- Title(参考訳): ジェネレーションレコメンデーションのためのドリフトアウェア連続トークン化
- Authors: Yuebo Feng, Jiahao Liu, Mingzhe Han, Dongsheng Li, Hansu Gu, Peng Zhang, Tun Lu, Ning Gu,
- Abstract要約: 生成レコメンデーションは通常、2段階のパイプラインを採用し、学習可能なトークンエーザがアイテムを個別のトークンシーケンスにマップする。
最近のトークン化器は、類似のユーザビヘイビアパターンを持つアイテムが同様のコードを受け取るように、協調的な信号も取り入れている。
新しいアイテムは衝突やシフトを引き起こし、新しいインタラクションは既存のアイテムの協調的なドリフトを引き起こす。
DACT, Drift-Aware Continual Tokenization framework with two stage: tokenizer fine-tuning and item-level drift confidence。
- 参考スコア(独自算出の注目度): 44.13013639783267
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative recommendation commonly adopts a two-stage pipeline in which a learnable tokenizer maps items to discrete token sequences (i.e. identifiers) and an autoregressive generative recommender model (GRM) performs prediction based on these identifiers. Recent tokenizers further incorporate collaborative signals so that items with similar user-behavior patterns receive similar codes, substantially improving recommendation quality. However, real-world environments evolve continuously: new items cause identifier collision and shifts, while new interactions induce collaborative drift in existing items (e.g., changing co-occurrence patterns and popularity). Fully retraining both tokenizer and GRM is often prohibitively expensive, yet naively fine-tuning the tokenizer can alter token sequences for the majority of existing items, undermining the GRM's learned token-embedding alignment. To balance plasticity and stability for collaborative tokenizers, we propose DACT, a Drift-Aware Continual Tokenization framework with two stages: (i) tokenizer fine-tuning, augmented with a jointly trained Collaborative Drift Identification Module (CDIM) that outputs item-level drift confidence and enables differentiated optimization for drifting and stationary items; and (ii) hierarchical code reassignment using a relaxed-to-strict strategy to update token sequences while limiting unnecessary changes. Experiments on three real-world datasets with two representative GRMs show that DACT consistently achieves better performance than baselines, demonstrating effective adaptation to collaborative evolution with reduced disruption to prior knowledge. Our implementation is publicly available at https://github.com/HomesAmaranta/DACT for reproducibility.
- Abstract(参考訳): 生成レコメンデーションは一般的に2段階のパイプラインを採用しており、学習可能なトークンエーザはアイテムを個別のトークンシーケンス(識別子)にマッピングし、自動回帰生成レコメンデーションモデル(GRM)はこれらの識別子に基づいて予測を行う。
近年のトークン化ツールでは、類似のユーザビヘイビアパターンを持つアイテムが類似のコードを受け取り、推奨品質を大幅に向上するように、協調的なシグナルが組み込まれている。
新しいアイテムは識別子の衝突やシフトを引き起こし、新しいインタラクションは既存のアイテム(例えば、共起パターンや人気の変化)の協調的なドリフトを引き起こす。
トークンライザとGRMの両方を完全に再トレーニングすることは、しばしば違法にコストがかかるが、トークンライザを微調整することで、既存のほとんどのアイテムのトークンシーケンスを変更でき、GRMの学習されたトークン埋め込みアライメントを損なう。
DACT(Drift-Aware Continual Tokenization framework)を2段階に分けて提案する。
一 トークン化装置の微調整、共同で訓練された協調ドリフト識別モジュール(CDIM)により、アイテムレベルのドリフト信頼性を出力し、ドリフト及び静止アイテムの差別化最適化を可能にする。
(II)不必要な変更を制限しながらトークンシーケンスを更新するための緩和された制限付き戦略を用いた階層的コード再割り当て。
2つのGAMを用いた実世界の3つのデータセットの実験により、DACTはベースラインよりも一貫して優れた性能を達成し、協調進化への効果的な適応を実証し、事前知識の破壊を減らした。
私たちの実装は再現性のためにhttps://github.com/HomesAmaranta/DACTで公開されています。
関連論文リスト
- PIT: A Dynamic Personalized Item Tokenizer for End-to-End Generative Recommendation [10.959841655014387]
PITは動的パーソナライズされたアイテムトークン作成フレームワークで、エンドツーエンドのジェネレーティブレコメンデーションを提供する。
協調的な信号アライメントを通じて協調的なパターンを調和させる、共同生成アーキテクチャを採用している。
実世界のデータセットの実験は、PITが一貫して競争ベースラインを上回っていることを示している。
論文 参考訳(メタデータ) (2026-02-09T11:28:56Z) - UniGRec: Unified Generative Recommendation with Soft Identifiers for End-to-End Optimization [20.538589808672963]
我々は、UniGRecという統合された生成レコメンデーションフレームワークを提案する。
UniGRecは、トレーニングと推論の相違、コードワードの使用によるアイテム識別子の崩壊、協調的な信号不足に対処する。
実世界のデータセットの実験では、UniGRecは最先端のベースラインメソッドを一貫して上回っている。
論文 参考訳(メタデータ) (2026-01-24T12:20:29Z) - DiffGRM: Diffusion-based Generative Recommendation Model [63.35379395455103]
ジェネレーティブレコメンデーション(GR)は、トークン化器を介して各項目をn桁のセマンティックID(SID)として表現する新興パラダイムである。
自己回帰デコーダをマスク付き離散拡散モデル(MDM)に置き換える拡散ベースGRモデルDiffGRMを提案する。
実験では、複数のデータセットに対する強力な生成的および差別的推奨ベースラインよりも一貫した利得を示す。
論文 参考訳(メタデータ) (2025-10-21T03:23:32Z) - Closing the Performance Gap in Generative Recommenders with Collaborative Tokenization and Efficient Modeling [10.757287948514604]
本稿では,協調情報を学習項目表現に直接統合するコントラストトークン化手法を提案する。
また、アイテムデコーディングからタイムラインモデリングを分離する軽量な音声インスパイアされた生成モデルであるMARIUSを提案する。
論文 参考訳(メタデータ) (2025-08-12T17:06:55Z) - MISSRec: Pre-training and Transferring Multi-modal Interest-aware
Sequence Representation for Recommendation [61.45986275328629]
逐次レコメンデーションのためのマルチモーダル事前学習・転送学習フレームワークであるMISSRecを提案する。
ユーザ側ではトランスフォーマーベースのエンコーダデコーダモデルを設計し、コンテキストエンコーダがシーケンスレベルのマルチモーダルユーザ興味を捉えることを学習する。
候補項目側では,ユーザ適応項目表現を生成するために動的融合モジュールを採用する。
論文 参考訳(メタデータ) (2023-08-22T04:06:56Z) - Enhancing Few-shot NER with Prompt Ordering based Data Augmentation [59.69108119752584]
本稿では,PODA(Prompt Ordering Based Data Augmentation)手法を提案する。
3つのパブリックNERデータセットの実験結果とさらなる分析により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2023-05-19T16:25:43Z) - Continuous-Time Sequential Recommendation with Temporal Graph
Collaborative Transformer [69.0621959845251]
本稿では,定義した連続時間二部グラフ上での時間グラフシーケンスレコメンダ(TGSRec)を提案する。
TCTレイヤは、ユーザとアイテムの両方からの協調的な信号を同時にキャプチャすると同時に、シーケンシャルパターン内の時間的ダイナミクスも考慮する。
5つのデータセットの実証結果は、TGSRecが他のベースラインを大幅に上回っていることを示している。
論文 参考訳(メタデータ) (2021-08-14T22:50:53Z) - Contrastive Self-supervised Sequential Recommendation with Robust
Augmentation [101.25762166231904]
Sequential Recommendation Describes a set of technique to model dynamic user behavior to order to predict future interaction in sequence user data。
データスパーシリティやノイズの多いデータなど、古くて新しい問題はまだ残っている。
逐次レコメンデーション(CoSeRec)のためのコントラスト型自己監督学習を提案する。
論文 参考訳(メタデータ) (2021-08-14T07:15:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。