論文の概要: Decoupled Residual Quantization for Robust Semantic IDs in Recommendation
- arxiv url: http://arxiv.org/abs/2606.01844v1
- Date: Mon, 01 Jun 2026 07:55:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:31.582503
- Title: Decoupled Residual Quantization for Robust Semantic IDs in Recommendation
- Title(参考訳): レコメンデーションにおけるロバストなセマンティックIDのデカップリング残差量子化
- Authors: Xuesi Wang, Junjie Wang, Ziliang Wang, Weijie Bian, Guanxing Zhang,
- Abstract要約: 低い品質のトークンライザは、コードブックの未使用、不安定な決定境界、または埋め込み空間の幾何学的歪みから得られる。
本稿では,期待されるコードワード重複と効果的なコードブック能力を通じて,これらの故障を定量的に診断する枠組みを開発する。
概念実証として,連続的幾何再構成と離散分布マッチングを分離する疎結合残留量子化(DRQ)を提案する。
- 参考スコア(独自算出の注目度): 6.85237130729423
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic IDs represent items as shared discrete token sequences and have become a practical tool for recommendation and retrieval. Yet it remains difficult to tell why a tokenizer fails: poor quality may come from codebook underutilization, unstable decision boundaries, or geometric distortion of the embedding space. This paper develops a quantitative framework for diagnosing these failures through expected codeword overlap and effective codebook capacity. The former measures expected codeword confusion under retrieval-time perturbation, while the latter converts that confusion into an effective number of usable, well-separated codes. The framework links semantic boundary confusion to both code usage imbalance and Euclidean geometric constraints. As a proof of concept, we present Decoupled Residual Quantization (DRQ), which separates continuous geometry reconstruction from discrete distribution matching. Experiments on a large-scale industrial dataset show that Semantic ID quality is multi-objective: symbolic robustness, reconstruction fidelity, and behavior-aware soft matching each stress different aspects of a tokenizer. These downstream observations are based on one proprietary industrial dataset, so they should be read as a case study rather than a universal benchmark claim.
- Abstract(参考訳): セマンティックIDは、アイテムを共有された離散トークンシーケンスとして表現し、リコメンデーションと検索の実用的なツールとなった。
貧弱な品質は、コードブックの不使用、不安定な決定境界、または埋め込み空間の幾何学的歪みから生まれる可能性がある。
本稿では,期待されるコードワード重複と効果的なコードブック能力を通じて,これらの故障を定量的に診断する枠組みを開発する。
前者は検索時間の摂動下でのコードワードの混乱を予測し、後者は、その混乱を有効数でよく区切られたコードに変換する。
このフレームワークは、セマンティック境界の混乱を、コード使用の不均衡とユークリッド幾何学的制約の両方に結びつけている。
概念実証として,連続的幾何再構成と離散分布マッチングを分離する疎結合残留量子化(DRQ)を提案する。
大規模産業データセットの実験では、セマンティックIDの品質が多目的であることが示されている。
これらの下流の観測は1つのプロプライエタリな産業データセットに基づいており、普遍的なベンチマーククレームではなくケーススタディとして読むべきである。
関連論文リスト
- Asymmetric Generative Recommendation via Multi-Expert Projection and Multi-Faceted Hierarchical Quantization [39.92412918837748]
AsymRecは、入力と出力の表現を分離する非対称な連続離散フレームワークである。
常に最先端のジェネレーティブ・レコメンデーターを平均15.8%上回っている。
論文 参考訳(メタデータ) (2026-05-14T07:55:43Z) - Efficient Test-Time Inference via Deterministic Exploration of Truncated Decoding Trees [68.04613115686509]
自己整合性は、複数の推論トレースを並列にサンプリングし、投票することで、推論時間のパフォーマンスを向上させる。
そこで本研究では,切り落された標本を伐採木として扱う決定論的復号法であるDLE(Distinct Leafion)を提案する。
DLEは高品質な推論トレースを調査し、数学、コーディング、一般的な推論タスクのパフォーマンスを向上させる。
論文 参考訳(メタデータ) (2026-04-22T12:42:03Z) - Bi-Lipschitz Autoencoder With Injectivity Guarantee [14.99578789813769]
Bi-Lipschitz Autoencoder (BLAE) は、病的局所性ミニマを除去するための分離基準に基づくインジェクティブ正規化スキームである。
BLAEは、空間と分布のシフトをサンプリングするために弾力性を維持しながら、多様体構造を保存する既存の方法よりも一貫して優れている。
論文 参考訳(メタデータ) (2026-04-08T05:40:00Z) - Overcoming Joint Intractability with Lossless Hierarchical Speculative Decoding [58.92526489742584]
我々は無益な無益な提案をする。
承認されたトークンの数を大幅に増加させる検証方法。
HSDは様々なモデルファミリやベンチマークの受け入れ率に一貫した改善をもたらすことを示す。
論文 参考訳(メタデータ) (2026-01-09T11:10:29Z) - Accelerate Speculative Decoding with Sparse Computation in Verification [49.74839681322316]
投機的復号化は、複数のドラフトトークンを並列に検証することにより、自動回帰言語モデル推論を加速する。
既存のスペーシフィケーション方式は主にトークン・バイ・トーケンの自己回帰復号化のために設計されている。
そこで本研究では,注目度,FFN,MoEを両立させるスパース検証フレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-26T07:53:41Z) - Taming Imperfect Process Verifiers: A Sampling Perspective on Backtracking [54.43083499412643]
言語モデルの生成能力をプロセス検証器と組み合わせたテストタイムアルゴリズムは、新しい推論能力を引き出すための有望なレバーを提供する。
提案手法は, 理論的に根拠付きバックトラックを用いて, 検証誤差に対して, 確実な堅牢性を実現するための新しいプロセス誘導型テスト時間サンプリングアルゴリズムであるVGBを導入する。
論文 参考訳(メタデータ) (2025-10-03T16:21:14Z) - Exploiting Discriminative Codebook Prior for Autoregressive Image Generation [54.14166700058777]
トークンベースの自己回帰画像生成システムは、まずトークンインデックスのシーケンスをコードブックでトークン化し、次にこれらのシーケンスを自己回帰パラダイムでモデル化する。
自己回帰生成モデルはインデックス値のみに基づいて訓練されるが、豊富なトークン類似性情報を含むコードブックにエンコードされた前者は利用されない。
近年の研究では、トークン上に単純なk平均クラスタリングを行い、コードブックを減らした生成モデルのトレーニングを容易にすることで、これを先に組み込もうとしている。
k-meansの代替として、差別的コードブック先駆者(DCPE)を提案する。
論文 参考訳(メタデータ) (2025-08-14T15:00:00Z) - SaraCoder: Orchestrating Semantic and Structural Cues for Resource-Optimized Repository-Level Code Completion [34.41683042851225]
そこで本研究では,リソース最適化検索拡張手法であるSaraCoderを提案する。
限られたコンテキストウィンドウにおいて、情報の多様性と代表性を最大化する。
我々の研究は、複数の次元にわたる検索結果を体系的に洗練することは、より正確でリソース最適化されたリポジトリレベルのコード補完システムを構築するための新しいパラダイムを提供することを証明している。
論文 参考訳(メタデータ) (2025-08-13T11:56:05Z) - SparseCL: Sparse Contrastive Learning for Contradiction Retrieval [87.02936971689817]
コントラディション検索(Contradiction Search)とは、クエリの内容に明示的に異を唱える文書を識別し、抽出することである。
類似性探索やクロスエンコーダモデルといった既存の手法には、大きな制限がある。
文間の微妙で矛盾したニュアンスを保存するために特別に訓練された文埋め込みを利用するSparseCLを導入する。
論文 参考訳(メタデータ) (2024-06-15T21:57:03Z) - Advanced Detection of Source Code Clones via an Ensemble of Unsupervised Similarity Measures [0.0]
本研究では,コード類似度評価のための新しいアンサンブル学習手法を提案する。
鍵となる考え方は、様々な類似度尺度の強みが互いに補完し、個々の弱点を軽減することである。
論文 参考訳(メタデータ) (2024-05-03T13:42:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。