論文の概要: HiD-VAE: Interpretable Generative Recommendation via Hierarchical and Disentangled Semantic IDs
- arxiv url: http://arxiv.org/abs/2508.04618v1
- Date: Wed, 06 Aug 2025 16:45:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-07 20:09:22.828043
- Title: HiD-VAE: Interpretable Generative Recommendation via Hierarchical and Disentangled Semantic IDs
- Title(参考訳): HiD-VAE:階層型およびアンタングル型セマンティックIDによる解釈可能な生成レコメンデーション
- Authors: Dengzhao Fang, Jingtong Gao, Chengcheng Zhu, Yu Li, Xiangyu Zhao, Yi Chang,
- Abstract要約: HiD-VAEは、2つのコアイノベーションを通じて階層的に切り離されたアイテム表現を学ぶ新しいフレームワークである。
第一に、HiD-VAEは階層的に制御された量子化プロセスの先駆者であり、離散コードとマルチレベルアイテムタグを整列する。
第二に、HiD-VAEは表現の絡み合いと戦うために、遅延空間の重なりを直接罰する新しい特異性損失を取り入れている。
- 参考スコア(独自算出の注目度): 33.51075655987504
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recommender systems are indispensable for helping users navigate the immense item catalogs of modern online platforms. Recently, generative recommendation has emerged as a promising paradigm, unifying the conventional retrieve-and-rank pipeline into an end-to-end model capable of dynamic generation. However, existing generative methods are fundamentally constrained by their unsupervised tokenization, which generates semantic IDs suffering from two critical flaws: (1) they are semantically flat and uninterpretable, lacking a coherent hierarchy, and (2) they are prone to representation entanglement (i.e., ``ID collisions''), which harms recommendation accuracy and diversity. To overcome these limitations, we propose HiD-VAE, a novel framework that learns hierarchically disentangled item representations through two core innovations. First, HiD-VAE pioneers a hierarchically-supervised quantization process that aligns discrete codes with multi-level item tags, yielding more uniform and disentangled IDs. Crucially, the trained codebooks can predict hierarchical tags, providing a traceable and interpretable semantic path for each recommendation. Second, to combat representation entanglement, HiD-VAE incorporates a novel uniqueness loss that directly penalizes latent space overlap. This mechanism not only resolves the critical ID collision problem but also promotes recommendation diversity by ensuring a more comprehensive utilization of the item representation space. These high-quality, disentangled IDs provide a powerful foundation for downstream generative models. Extensive experiments on three public benchmarks validate HiD-VAE's superior performance against state-of-the-art methods. The code is available at https://anonymous.4open.science/r/HiD-VAE-84B2.
- Abstract(参考訳): 現代のオンラインプラットフォームの巨大なカタログをユーザがナビゲートするのには、レコメンダシステムは不可欠である。
近年,ジェネレーティブレコメンデーションは,従来の検索・ランクパイプラインを動的生成が可能なエンドツーエンドモデルに統一する,有望なパラダイムとして浮上している。
しかし、既存の生成法は、基本的には教師なしのトークン化によって制約され、(1) 意味的に平坦で理解不能で、一貫性のない階層が欠如しており、(2) 表現の絡み合い(すなわち、`IDの衝突')が難しく、レコメンデーションの正確さと多様性を損なう。
これらの制限を克服するために,2つのコアイノベーションを通じて階層的に切り離されたアイテム表現を学習する新しいフレームワークであるHiD-VAEを提案する。
第一に、HiD-VAEは階層的に制御された量子化プロセスの先駆者であり、離散コードとマルチレベルなアイテムタグを整列させ、より均一で不整合なIDを生成する。
重要なのは、トレーニングされたコードブックは階層的なタグを予測でき、レコメンデーション毎にトレース可能で解釈可能なセマンティックパスを提供する。
第二に、HiD-VAEは表現の絡み合いと戦うために、遅延空間の重なりを直接罰する新しい特異性損失を取り入れている。
このメカニズムは、重要なID衝突問題を解決するだけでなく、アイテム表現空間をより包括的に活用することで、推薦の多様性を促進する。
これらの高品質で不整合なIDは下流生成モデルに強力な基盤を提供する。
3つの公開ベンチマークに関する大規模な実験は、HiD-VAEの最先端の手法に対する優れた性能を検証する。
コードはhttps://anonymous.4open.science/r/HiD-VAE-84B2で公開されている。
関連論文リスト
- SIDE: Semantic ID Embedding for effective learning from sequences [1.2145532233226686]
シーケンスベースのレコメンデーションシステムは、産業用アドレコメンデーションシステムの最先端を推し進めている。
本稿では,ベクトル量子化(VQ)を利用して,コンパクトなセマンティックID(SID)をレコメンデーションモデルに注入する手法を提案する。
大規模産業広告推薦システムに適用した場合, 正規化エントロピー(NE)ゲインの2.4倍改善とデータフットプリントの3倍削減を実現する。
論文 参考訳(メタデータ) (2025-06-20T02:40:38Z) - Benchmarking Unified Face Attack Detection via Hierarchical Prompt Tuning [58.16354555208417]
PADとFFDはそれぞれ物理メディアベースのプレゼンテーションアタックとデジタル編集ベースのDeepFakeから顔データを保護するために提案されている。
これら2つのカテゴリの攻撃を同時に処理する統一顔攻撃検出モデルがないことは、主に2つの要因に起因する。
本稿では,異なる意味空間から複数の分類基準を適応的に探索する,視覚言語モデルに基づく階層型プロンプトチューニングフレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-19T16:35:45Z) - Sparse Meets Dense: Unified Generative Recommendations with Cascaded Sparse-Dense Representations [22.48125906976824]
カスケード型組織的ビ表現型ジェネリック検索フレームワークを導入し,カスケード処理を通じてスパース意味IDと高密度ベクトルを統合する。
本手法は,これらの表現をまずスパースIDを生成して交互に生成し,高密度ベクトルの生成を支援する条件として機能する。
推論の間、COBRAは粗大な戦略を採用し、スパースID生成から始まり、生成モデルを介してそれらを密度の高いベクトルに精製する。
論文 参考訳(メタデータ) (2025-03-04T10:00:05Z) - EAGER: Two-Stream Generative Recommender with Behavior-Semantic Collaboration [63.112790050749695]
本稿では,行動情報と意味情報の両方をシームレスに統合する新しい生成推薦フレームワークであるEAGERを紹介する。
EAGERの有効性を4つの公開ベンチマークで検証し,既存手法と比較して優れた性能を示した。
論文 参考訳(メタデータ) (2024-06-20T06:21:56Z) - Learnable Item Tokenization for Generative Recommendation [78.30417863309061]
LETTER (Larnable Tokenizer for generaTivE Recommendation) を提案する。
LETTERは、セマンティック正規化のためのResidual Quantized VAE、協調正規化のためのコントラストアライメント損失、コードの割り当てバイアスを軽減するための多様性損失を組み込んでいる。
論文 参考訳(メタデータ) (2024-05-12T15:49:38Z) - Towards General Visual-Linguistic Face Forgery Detection [95.73987327101143]
ディープフェイクは現実的な顔操作であり、セキュリティ、プライバシー、信頼に深刻な脅威をもたらす可能性がある。
既存の方法は、このタスクを、デジタルラベルまたはマスク信号を使用して検出モデルをトレーニングするバイナリ分類として扱う。
本稿では, 微粒な文レベルのプロンプトをアノテーションとして用いた, VLFFD (Visual-Linguistic Face Forgery Detection) という新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2023-07-31T10:22:33Z) - Dynamic Prototype Mask for Occluded Person Re-Identification [88.7782299372656]
既存の手法では、目に見える部分を識別するために、余分なネットワークによって提供される身体の手がかりを利用することで、この問題に対処している。
2つの自己明快な事前知識に基づく新しい動的プロトタイプマスク(DPM)を提案する。
この条件下では、隠蔽された表現は、選択された部分空間において自然にうまく整列することができる。
論文 参考訳(メタデータ) (2022-07-19T03:31:13Z) - Dual-Stream Reciprocal Disentanglement Learning for Domain Adaption
Person Re-Identification [44.80508095481811]
本稿では,Dual-stream Reciprocal Disentanglement Learning (DRDL) という新しい手法を提案する。
DRDLでは、まず2つのエンコーダがID関連およびID非関連の特徴抽出のために構築され、それぞれ関連する分類器によって測定される。
提案手法は,計算複雑性を著しく低減するだけでなく,ID関連の特徴から冗長な情報を除去する。
論文 参考訳(メタデータ) (2021-06-26T03:05:23Z) - Dual-Refinement: Joint Label and Feature Refinement for Unsupervised
Domain Adaptive Person Re-Identification [51.98150752331922]
Unsupervised Domain Adaptive (UDA) Person Re-identification (再ID) は、ターゲットドメインデータのラベルが欠落しているため、難しい作業です。
オフラインクラスタリングフェーズにおける擬似ラベルとオンライントレーニングフェーズにおける特徴を共同で改良する,デュアルリファインメントと呼ばれる新しいアプローチを提案する。
本手法は最先端手法を大きなマージンで上回っている。
論文 参考訳(メタデータ) (2020-12-26T07:35:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。