論文の概要: DAS: Dual-Aligned Semantic IDs Empowered Industrial Recommender System
- arxiv url: http://arxiv.org/abs/2508.10584v1
- Date: Thu, 14 Aug 2025 12:22:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-15 22:24:48.306933
- Title: DAS: Dual-Aligned Semantic IDs Empowered Industrial Recommender System
- Title(参考訳): DAS:Dual-Aligned Semantic IDs Empowered Industrial Recommender System
- Authors: Wencai Ye, Mingjie Sun, Shaoyun Shi, Peng Wang, Wenjin Wu, Peng Jiang,
- Abstract要約: 量子化とアライメントを同時に最適化する1段階のDual-Aligned Semantic ID(DAS)手法を提案する。
DASは、セマンティックIDと協調信号のより効率的なアライメントを実現しており、以下の2つの革新的なアプローチがある。
DASはKuaishou Appのさまざまな広告シナリオで成功し、毎日4億人のユーザーが利用している。
- 参考スコア(独自算出の注目度): 15.648601380538413
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic IDs are discrete identifiers generated by quantizing the Multi-modal Large Language Models (MLLMs) embeddings, enabling efficient multi-modal content integration in recommendation systems. However, their lack of collaborative signals results in a misalignment with downstream discriminative and generative recommendation objectives. Recent studies have introduced various alignment mechanisms to address this problem, but their two-stage framework design still leads to two main limitations: (1) inevitable information loss during alignment, and (2) inflexibility in applying adaptive alignment strategies, consequently constraining the mutual information maximization during the alignment process. To address these limitations, we propose a novel and flexible one-stage Dual-Aligned Semantic IDs (DAS) method that simultaneously optimizes quantization and alignment, preserving semantic integrity and alignment quality while avoiding the information loss typically associated with two-stage methods. Meanwhile, DAS achieves more efficient alignment between the semantic IDs and collaborative signals, with the following two innovative and effective approaches: (1) Multi-view Constrative Alignment: To maximize mutual information between semantic IDs and collaborative signals, we first incorporate an ID-based CF debias module, and then design three effective contrastive alignment methods: dual user-to-item (u2i), dual item-to-item/user-to-user (i2i/u2u), and dual co-occurrence item-to-item/user-to-user (i2i/u2u). (2) Dual Learning: By aligning the dual quantizations of users and ads, the constructed semantic IDs for users and ads achieve stronger alignment. Finally, we conduct extensive offline experiments and online A/B tests to evaluate DAS's effectiveness, which is now successfully deployed across various advertising scenarios at Kuaishou App, serving over 400 million users daily.
- Abstract(参考訳): セマンティックIDは、MLLM(Multi-modal Large Language Models)埋め込みの量子化によって生成された離散識別子であり、レコメンデーションシステムにおける効率的なマルチモーダルコンテンツ統合を可能にする。
しかし, 協調信号の欠如は, 下流の差別的, 生成的推薦目的との相違をもたらす。
近年,この問題を解決するためのアライメント機構が提案されているが,その2段階のフレームワーク設計は,(1)アライメント時に避けられない情報損失,(2)適応アライメント戦略の適用における柔軟性の2つの主な制限を導いてきた。
これらの制約に対処するために,2段階の手法に共通する情報損失を回避しつつ,量子化とアライメントを同時に最適化し,セマンティックな整合性とアライメント品質を保ちながら,新しい一段階のDual-Aligned Semantic ID(DAS)手法を提案する。
一方、DASは、セマンティックIDとコラボレーティブ信号のより効率的なアライメントを実現し、次の2つの革新的かつ効果的なアプローチを実現している。(1) マルチビュー コンストラクティブアライメント: セマンティックIDとコラボレーティブ信号の相互情報を最大化するために、まず、IDベースのCFデバイアスモジュールを組み込んで、3つの効果的なコントラストアライメント手法を設計する: 2つのユーザ・ツー・テム(u2i/u2u)、2つのアイテム・ツー・テム/ユーザ・ツー・ユーザ(i2i/u2u)、そして2つの共起アイテム・ツー・テム/ユーザ・ツー・ユーザ(i2i/u2u)。
2)デュアルラーニング: ユーザと広告の二重量子化を調整することで, ユーザと広告のための構築されたセマンティックIDがより強力なアライメントを実現する。
最後に、大規模なオフライン実験とオンラインA/Bテストを実施して、DASの有効性を評価しました。
関連論文リスト
- HiD-VAE: Interpretable Generative Recommendation via Hierarchical and Disentangled Semantic IDs [33.51075655987504]
HiD-VAEは、2つのコアイノベーションを通じて階層的に切り離されたアイテム表現を学ぶ新しいフレームワークである。
第一に、HiD-VAEは階層的に制御された量子化プロセスの先駆者であり、離散コードとマルチレベルアイテムタグを整列する。
第二に、HiD-VAEは表現の絡み合いと戦うために、遅延空間の重なりを直接罰する新しい特異性損失を取り入れている。
論文 参考訳(メタデータ) (2025-08-06T16:45:05Z) - BiXFormer: A Robust Framework for Maximizing Modality Effectiveness in Multi-Modal Semantic Segmentation [55.486872677160015]
マスクレベルの分類タスクとしてマルチモーダルなセマンティックセグメンテーションを再構成する。
統一モダリティマッチング(UMM)とクロスモダリティアライメント(CMA)を統合したBiXFormerを提案する。
合成および実世界のマルチモーダルベンチマーク実験により,本手法の有効性を実証した。
論文 参考訳(メタデータ) (2025-06-04T08:04:58Z) - MisoDICE: Multi-Agent Imitation from Unlabeled Mixed-Quality Demonstrations [5.4482836906033585]
実演が混在する多エージェント環境下でのオフライン模倣学習(IL)について検討した。
提案手法は,軌道ラベリングとマルチエージェント模倣学習の2段階からなる。
我々はこれらのラベルを利用してロバストなポリシーを学習する新しいマルチエージェントILアルゴリズムであるMisoDICEを紹介する。
論文 参考訳(メタデータ) (2025-05-24T08:43:42Z) - InfoMAE: Pair-Efficient Cross-Modal Alignment for Multimodal Time-Series Sensing Signals [9.648001493025204]
InfoMAEは、SSL設定下でのマルチモーダルペア効率の課題に取り組む、クロスモーダルアライメントフレームワークである。
下流のマルチモーダルタスクを60%以上向上させ、マルチモーダルペアリング効率を大幅に改善した。
また、単一タスクの精度を平均22%向上させる。
論文 参考訳(メタデータ) (2025-04-13T20:03:29Z) - BBQRec: Behavior-Bind Quantization for Multi-Modal Sequential Recommendation [15.818669767036592]
本稿では,2列列の量子化とセマンティックス・アウェア・シーケンス・モデリングを備えたBBQRec(Behavior-Bind Multi-modal Quantization for Sequential Recommendation)を提案する。
BBQRecは、コントラストのあるコードブック学習を通じて、ノイズの多いモダリティ特有の特徴からモダリティに依存しない行動パターンを分離する。
我々は、量子化された意味関係を用いて自己注意スコアを動的に調整する離散化類似度再重み付け機構を設計する。
論文 参考訳(メタデータ) (2025-04-09T07:19:48Z) - A-FedPD: Aligning Dual-Drift is All Federated Primal-Dual Learning Needs [57.35402286842029]
本稿では,グローバルクライアントとローカルクライアントの仮想二重配向を構成する新しいアラインドデュアルデュアル(A-FedPD)手法を提案する。
本稿では,A-FedPD方式の非集中型セキュリティコンセンサスに対する効率を包括的に分析する。
論文 参考訳(メタデータ) (2024-09-27T17:00:32Z) - EAGER: Two-Stream Generative Recommender with Behavior-Semantic Collaboration [63.112790050749695]
本稿では,行動情報と意味情報の両方をシームレスに統合する新しい生成推薦フレームワークであるEAGERを紹介する。
EAGERの有効性を4つの公開ベンチマークで検証し,既存手法と比較して優れた性能を示した。
論文 参考訳(メタデータ) (2024-06-20T06:21:56Z) - NoteLLM-2: Multimodal Large Representation Models for Recommendation [71.87790090964734]
大規模言語モデル(LLM)は、テキスト理解や埋め込みタスクにおいて、例外的な習熟度を示している。
マルチモーダル表現のポテンシャル、特にアイテムツーイテム(I2I)レコメンデーションについては、未解明のままである。
本稿では,既存のLLMと視覚エンコーダの統合をカスタマイズし,効率的なマルチモーダル表現を実現するエンド・ツー・エンドのファインチューニング手法を提案する。
論文 参考訳(メタデータ) (2024-05-27T03:24:01Z) - Learnable Item Tokenization for Generative Recommendation [78.30417863309061]
LETTER (Larnable Tokenizer for generaTivE Recommendation) を提案する。
LETTERは、セマンティック正規化のためのResidual Quantized VAE、協調正規化のためのコントラストアライメント損失、コードの割り当てバイアスを軽減するための多様性損失を組み込んでいる。
論文 参考訳(メタデータ) (2024-05-12T15:49:38Z) - Disentangling ID and Modality Effects for Session-based Recommendation [46.09367252640389]
タスクにおけるIDとモダリティの影響を解消する新しいフレームワークDIMOを提案する。
DIMOは因果推論を通じてレコメンデーションを提供し、さらに説明を生成するための2つのテンプレートを作成する。
論文 参考訳(メタデータ) (2024-04-19T15:54:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。