論文の概要: Beyond Static Collision Handling: Adaptive Semantic ID Learning for Multimodal Recommendation at Industrial Scale
- arxiv url: http://arxiv.org/abs/2604.23522v1
- Date: Sun, 26 Apr 2026 03:59:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.409618
- Title: Beyond Static Collision Handling: Adaptive Semantic ID Learning for Multimodal Recommendation at Industrial Scale
- Title(参考訳): 静的衝突処理を超えて:産業規模でのマルチモーダルレコメンデーションのための適応的セマンティックID学習
- Authors: Yongsen Pan, Yuxin Chen, Zheng Hu, Xu Yuan, Daoyuan Wang, Yuting Yin, Songhao Ni, Hongyang Wang, Jun Wang, Fuji Ren, Wenwu Ou,
- Abstract要約: AdaSIDは2段階のプロセスを通じてSIDオーバーラップを制御する。
関連する項目が意味的に互換性がある場合、観察された重複に対する反発を緩和する。
局所的な衝突負荷と訓練の進捗に応じて、残りの規制圧力を割り当てる。
- 参考スコア(独自算出の注目度): 20.066503602593958
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern recommendation systems involve massive catalogs of multimodal items, where scalable item identification must balance compactness, semantic fidelity, and downstream effectiveness. Semantic IDs (SIDs) address this need by representing items as short discrete token sequences derived from multimodal signals, providing a compact interface for retrieval, ranking, and generative recommendation. However, effective SID learning is hindered by collisions, where different items are assigned identical or highly confusable codes. Existing methods mainly rely on improved quantization or fixed overlap regularization, but they do not adaptively distinguish whether an overlap should be suppressed or preserved. We propose AdaSID, an adaptive semantic ID learning framework for recommendation. AdaSID regulates SID overlaps through a two-stage process. First, it relaxes repulsion for observed overlaps when the involved items are semantically compatible, preserving admissible sharing rather than uniformly separating all collisions. Second, it allocates the remaining regulation pressure according to local collision load and training progress, strengthening control in congested regions while gradually rebalancing optimization toward recommendation alignment. This design adaptively decides which overlaps to penalize, how strongly to regulate them, and when to shift the learning focus. Extensive offline and online experiments validate AdaSID. On two public benchmarks, AdaSID improves Recall and NDCG by about 4.5% on average over strong baselines, while improving codebook utilization and SID diversity. In Kuaishou e-commerce, an online A/B test on short-video retrieval covering tens of millions of users achieves statistically significant gains, including a 0.98% GMV improvement, and industrial ranking evaluation shows consistent AUC improvements.
- Abstract(参考訳): 現代のレコメンデーションシステムには、スケーラブルなアイテム識別には、コンパクトさ、セマンティックな忠実さ、下流の有効性のバランスをとる必要がある。
セマンティックID(SID)は、アイテムをマルチモーダル信号から派生した短い離散トークンシーケンスとして表現し、検索、ランキング、生成レコメンデーションのためのコンパクトなインターフェースを提供する。
しかし、効果的なSID学習は、異なる項目が同一または非常に不確実なコードに割り当てられる衝突によって妨げられる。
既存の手法は主に改良された量子化や固定された重なり正則化に依存しているが、重複を抑えるか保存するかを適応的に区別するものではない。
適応型セマンティックID学習フレームワークであるAdaSIDを提案する。
AdaSIDは2段階のプロセスを通じてSIDオーバーラップを制御する。
第一に、関係する項目が意味的に互換性があるときに観察される重複に対する反発を緩和し、すべての衝突を均一に分離するのではなく、許容される共有を維持する。
第2に、局所的な衝突荷重と訓練の進捗に応じて残りの規制圧力を割り当て、密集領域の制御を強化しつつ、徐々にレコメンデーションアライメントに向けて最適化を再バランスさせる。
この設計は、どの重なり合いを罰し、どれを厳しく規制するか、いつ学習焦点をシフトするかを適応的に決定する。
大規模なオフラインおよびオンライン実験は、AdaSIDを検証する。
2つの公開ベンチマークでは、AdaSIDはリコールとNDCGを、強いベースラインよりも平均4.5%改善し、コードブックの利用率とSIDの多様性を改善した。
Kuaishou e-Commerceでは、何千万人ものユーザーを対象とした短いビデオ検索に関するオンラインA/Bテストが、0.98%のGMV改善を含む統計的に有意な改善を達成し、産業ランキング評価は、一貫したAUCの改善を示している。
関連論文リスト
- Semantic Trimming and Auxiliary Multi-step Prediction for Generative Recommendation [22.025559532445012]
両端最適化戦略を利用したSTAMP(Semantic Trimming and Auxiliary Multi-step Prediction)を提案する。
パブリックなAmazonおよび大規模産業データセットの実験では、STAMPは1.23--1.38$times$ speedupと17.2%--54.7%のVRAM削減を達成した。
論文 参考訳(メタデータ) (2026-04-07T02:00:23Z) - Stop Treating Collisions Equally: Qualification-Aware Semantic ID Learning for Recommendation at Industrial Scale [24.395492499196063]
QuaSIDは、選択的に修飾された競合ペアによって衝突修飾されたSIDを学習し、衝突重大度による反発強度をスケールするエンドツーエンドフレームワークである。
公開ベンチマークと産業データの実験は、QuaSIDを検証する。
論文 参考訳(メタデータ) (2026-02-28T12:55:49Z) - End-to-End Semantic ID Generation for Generative Advertisement Recommendation [33.453121305193434]
生成広告推薦のための統一SID生成フレームワークを提案する。
具体的には、生の広告データからエンドツーエンドで埋め込みとSIDを協調的に最適化する。
実験により、UniSIDは最先端のSID生成方法よりも一貫して優れていることが示された。
論文 参考訳(メタデータ) (2026-02-11T02:38:26Z) - Rethinking Generative Recommender Tokenizer: Recsys-Native Encoding and Semantic Quantization Beyond LLMs [17.944727019161878]
ReSIDは、情報保存とシーケンシャルな予測可能性の観点から学ぶことを推奨する、原則化されたSIDフレームワークである。
高いシーケンシャルおよびSIDベースの生成ベースラインを平均10%以上上回り、トークン化コストを最大122倍削減する。
論文 参考訳(メタデータ) (2026-02-02T17:00:04Z) - Differentiable Semantic ID for Generative Recommendation [65.83703273297492]
生成的推薦は、各項目がリッチコンテンツから学習された個別意味ID(SID)によって表現される新しいパラダイムを提供する。
実際には、SIDはレコメンデーションの正確さよりもコンテンツ再構成に最適化されるのが一般的である。
自然なアプローチは、セマンティックインデックスを差別化して、レコメンデーショングラデーションが直接SID学習に影響を与えるようにすることだ。
本稿では,ジェネレーティブレコメンデーションのための効果的な識別可能なセマンティックIDに向けた第一歩として,DIGERを提案する。
論文 参考訳(メタデータ) (2026-01-27T15:34:11Z) - DiffGRM: Diffusion-based Generative Recommendation Model [63.35379395455103]
ジェネレーティブレコメンデーション(GR)は、トークン化器を介して各項目をn桁のセマンティックID(SID)として表現する新興パラダイムである。
自己回帰デコーダをマスク付き離散拡散モデル(MDM)に置き換える拡散ベースGRモデルDiffGRMを提案する。
実験では、複数のデータセットに対する強力な生成的および差別的推奨ベースラインよりも一貫した利得を示す。
論文 参考訳(メタデータ) (2025-10-21T03:23:32Z) - FORGE: Forming Semantic Identifiers for Generative Retrieval in Industrial Datasets [64.51403245281547]
FORGEは、産業データセットを使ったジェネレーティブrEtrievalにおけるFOrmingセマンティック識別のベンチマークである。
現実世界のアプリケーションでは、オンラインコンバージェンスを半減するオフライン事前トレーニングスキーマが導入されている。
論文 参考訳(メタデータ) (2025-09-25T08:44:22Z) - Learnable Item Tokenization for Generative Recommendation [113.80559032128065]
LETTER (Larnable Tokenizer for generaTivE Recommendation) を提案する。
LETTERは、セマンティック正規化のためのResidual Quantized VAE、協調正規化のためのコントラストアライメント損失、コードの割り当てバイアスを軽減するための多様性損失を組み込んでいる。
論文 参考訳(メタデータ) (2024-05-12T15:49:38Z) - Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。
SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T06:11:16Z) - Uncertainty-aware Clustering for Unsupervised Domain Adaptive Object
Re-identification [123.75412386783904]
最先端のオブジェクトRe-IDアプローチでは、クラスタリングアルゴリズムを採用して、ラベルのないターゲットドメインの擬似ラベルを生成する。
UDAタスクのための不確実性対応クラスタリングフレームワーク(UCF)を提案する。
我々のUCF法は、オブジェクトRe-IDのための複数のUDAタスクにおける最先端のパフォーマンスを一貫して達成する。
論文 参考訳(メタデータ) (2021-08-22T09:57:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。