論文の概要: The Best of the Two Worlds: Harmonizing Semantic and Hash IDs for Sequential Recommendation
- arxiv url: http://arxiv.org/abs/2512.10388v1
- Date: Thu, 11 Dec 2025 07:50:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-12 16:15:42.260662
- Title: The Best of the Two Worlds: Harmonizing Semantic and Hash IDs for Sequential Recommendation
- Title(参考訳): The Best of the Two Worlds: Harmonizing Semantic and Hash IDs for Sequential Recommendation
- Authors: Ziwei Liu, Yejing Wang, Qidong Liu, Zijian Zhang, Chong Chen, Wei Huang, Xiangyu Zhao,
- Abstract要約: 我々は,SIDとHIDを調和させる新しいフレームワークであるtextbfnameを提案する。具体的には,HIDのユニークなコラボレーティブアイデンティティを保ちながら,SID内のマルチグラニュラーセマンティクスの両方をキャプチャ可能な,デュアルブランチモデリングアーキテクチャを考案する。
実世界の3つのデータセットの実験では、名前は、既存のベースラインを越えながら、頭と尾の両方の推奨品質のバランスをとる。
- 参考スコア(独自算出の注目度): 51.62815306481903
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Conventional Sequential Recommender Systems (SRS) typically assign unique Hash IDs (HID) to construct item embeddings. These HID embeddings effectively learn collaborative information from historical user-item interactions, making them vulnerable to situations where most items are rarely consumed (the long-tail problem). Recent methods that incorporate auxiliary information often suffer from noisy collaborative sharing caused by co-occurrence signals or semantic homogeneity caused by flat dense embeddings. Semantic IDs (SIDs), with their capability of code sharing and multi-granular semantic modeling, provide a promising alternative. However, the collaborative overwhelming phenomenon hinders the further development of SID-based methods. The quantization mechanisms commonly compromise the uniqueness of identifiers required for modeling head items, creating a performance seesaw between head and tail items. To address this dilemma, we propose \textbf{\name}, a novel framework that harmonizes the SID and HID. Specifically, we devise a dual-branch modeling architecture that enables the model to capture both the multi-granular semantics within SID while preserving the unique collaborative identity of HID. Furthermore, we introduce a dual-level alignment strategy that bridges the two representations, facilitating knowledge transfer and supporting robust preference modeling. Extensive experiments on three real-world datasets show that \name~ effectively balances recommendation quality for both head and tail items while surpassing the existing baselines. The implementation code can be found online\footnote{https://github.com/ziwliu8/H2Rec}.
- Abstract(参考訳): 従来のシーケンスレコメンダシステム(SRS)は、アイテムの埋め込みを構築するために独自のハッシュID(HID)を割り当てるのが一般的である。
これらのHID埋め込みは、歴史的ユーザとイテムのインタラクションから協調的な情報を効果的に学習し、ほとんどのアイテムがほとんど消費されない状況(ロングテール問題)に脆弱になる。
補助情報を組み込んだ最近の手法は、共起信号や平らな密接な埋め込みによって引き起こされる意味的均質性によるノイズの多い協調的共有に悩まされることが多い。
セマンティックID(SID)は、コード共有とマルチグラニュラセマンティックモデリングの能力を持ち、有望な代替手段を提供する。
しかし、協調的な圧倒的な現象は、SIDベースの手法のさらなる発展を妨げる。
量子化機構は、一般的にヘッドアイテムのモデリングに必要な識別子の特異性を妥協し、ヘッドアイテムとテールアイテムのパフォーマンスシーソーを作成する。
このジレンマに対処するために、SIDとHIDを調和させる新しいフレームワークである‘textbf{\name}を提案する。
具体的には、HIDのユニークなコラボレーティブなアイデンティティを保ちながら、SID内の複数の粒状セマンティクスの両方をキャプチャできるデュアルブランチモデリングアーキテクチャを考案する。
さらに,2つの表現をブリッジし,知識伝達を容易にし,ロバストな嗜好モデリングをサポートする二重レベルアライメント戦略を導入する。
3つの実世界のデータセットに対する大規模な実験により、‘name〜’は、既存のベースラインを越えながら、頭と尾の両方の推奨品質を効果的にバランスさせることが示されている。
実装コードは Online\footnote{https://github.com/ziwliu8/H2Rec} で見ることができる。
関連論文リスト
- DiffGRM: Diffusion-based Generative Recommendation Model [63.35379395455103]
ジェネレーティブレコメンデーション(GR)は、トークン化器を介して各項目をn桁のセマンティックID(SID)として表現する新興パラダイムである。
自己回帰デコーダをマスク付き離散拡散モデル(MDM)に置き換える拡散ベースGRモデルDiffGRMを提案する。
実験では、複数のデータセットに対する強力な生成的および差別的推奨ベースラインよりも一貫した利得を示す。
論文 参考訳(メタデータ) (2025-10-21T03:23:32Z) - MMQ: Multimodal Mixture-of-Quantization Tokenization for Semantic ID Generation and User Behavioral Adaptation [16.81485354427923]
本稿では,新しいマルチモーダルトークンをトレーニングする2段階フレームワークであるMMQを提案する。
MMQは多モードのシナジー、特異性、行動適応を統一し、生成的検索と識別的ランキングタスクの両方にスケーラブルで汎用的なソリューションを提供する。
論文 参考訳(メタデータ) (2025-08-21T06:15:49Z) - Semantic IDs for Joint Generative Search and Recommendation [39.49814138519702]
ジェネレーティブモデルは、レコメンデーションと検索の両方をパワーアップするための統一されたソリューションとして登場しつつある。
統一モデルを用いた場合,検索とレコメンデーションの両方でよく機能するセマンティックIDを構築する方法を示す。
論文 参考訳(メタデータ) (2025-08-14T09:28:49Z) - HiD-VAE: Interpretable Generative Recommendation via Hierarchical and Disentangled Semantic IDs [29.735089231891305]
HiD-VAEは、2つのコアイノベーションを通じて階層的に切り離されたアイテム表現を学ぶ新しいフレームワークである。
第一に、HiD-VAEは階層的に制御された量子化プロセスの先駆者であり、離散コードとマルチレベルアイテムタグを整列する。
第二に、HiD-VAEは表現の絡み合いと戦うために、遅延空間の重なりを直接罰する新しい特異性損失を取り入れている。
論文 参考訳(メタデータ) (2025-08-06T16:45:05Z) - Order-agnostic Identifier for Large Language Model-based Generative Recommendation [94.37662915542603]
アイテムは、ユーザ履歴をエンコードし、次のアイテムを生成するために、LLM(Large Language Models)の識別子に割り当てられる。
既存のアプローチでは、トークンシーケンス識別子を使用して、アイテムを個別のトークンシーケンスとして表現するか、IDまたはセマンティック埋め込みを使用して単一トークン識別子を使用する。
本稿では,セマンティック・トークンライザを利用するSETRecを提案する。
論文 参考訳(メタデータ) (2025-02-15T15:25:38Z) - Generative Retrieval Meets Multi-Graded Relevance [104.75244721442756]
GRADed Generative Retrieval (GR$2$)というフレームワークを紹介します。
GR$2$は2つの重要なコンポーネントに焦点を当てている。
マルチグレードとバイナリの関連性を持つデータセットの実験は,GR$2$の有効性を示した。
論文 参考訳(メタデータ) (2024-09-27T02:55:53Z) - CART: A Generative Cross-Modal Retrieval Framework with Coarse-To-Fine Semantic Modeling [53.97609687516371]
クロスモーダル検索は、異なるモーダルデータの相互作用を通じて、クエリと意味的に関連するインスタンスを検索することを目的としている。
従来のソリューションでは、クエリと候補の間のスコアを明示的に計算するために、シングルトウワーまたはデュアルトウワーのフレームワークを使用している。
粗大なセマンティックモデリングに基づく生成的クロスモーダル検索フレームワーク(CART)を提案する。
論文 参考訳(メタデータ) (2024-06-25T12:47:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。