論文の概要: From Head to Tail: Asymmetric Knowledge Transfer in Long-tail Recommendation with Generative Semantic IDs
- arxiv url: http://arxiv.org/abs/2605.23310v1
- Date: Fri, 22 May 2026 07:29:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 17:29:20.237601
- Title: From Head to Tail: Asymmetric Knowledge Transfer in Long-tail Recommendation with Generative Semantic IDs
- Title(参考訳): 頭部から爪への非対称な知識伝達 : 生成的セマンティックIDを用いたロングテール勧告
- Authors: Chenyi Yan, Ruocong Tang, Xing Fang, Yang Huang, He Guo, Jing Wang,
- Abstract要約: 本稿では,AKT-Recについて述べる。AKT-Recは長尾勧告における非対称な知識伝達のためのフレームワークである。
AKT-Recは、教師付き微調整を備えたマルチモーダルLCMを使用して、コンテンツ表現をアイテムとユーザの両方の協調情報と整合させる。
その後、これらの表現をResidual-Quantized VAE (RQ-VAE) でセマンティックIDに識別し、類似したエンティティのセマンティッククラスタを生成する。
- 参考スコア(独自算出の注目度): 5.492507968066637
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Long-tail recommendation in real-world e-commerce platforms remains challenging due to severe data imbalance. Existing methods often struggle to combine content-based multimodal features with collaborative signals. Many of these methods also ignore an important asymmetry in knowledge transfer between head and tail IDs: noisy signals from tail IDs can hurt representation learning for head IDs. This paper presents AKT-Rec, a framework for Asymmetric Knowledge Transfer in long-tail Recommendation that uses LLM-generated semantic IDs. AKT-Rec uses Multimodal LLMs (MLLMs) with supervised fine-tuning to align content representations with collaborative information for both items and users, producing semantic representations. It then discretizes these representations into semantic IDs with a Residual-Quantized VAE (RQ-VAE), which yields semantic clusters of similar entities. AKT-Rec has two main components: (1) Cluster-Guided Adaptive Embedding, which decomposes each ID representation into a cluster-level embedding that captures shared semantics and an individual embedding. Through an asymmetric contrastive objective and an activity-aware gating mechanism, this module directs knowledge transfer from head to tail IDs. (2) Hierarchical Feature Aggregation, which builds parallel feature views and adaptively fuses them to optimize predictions for samples with varying activity levels. Extensive experiments on a large-scale industrial dataset and online A/B testing on the Alibaba Tmall platform demonstrate the effectiveness of AKT-Rec. AKT-Rec improves offline performance by 0.35% in AUC and 1.53% in GAUC, outperforming several competitive baselines. In online A/B testing, AKT-Rec achieves a 2.76% increase in CTR and a 3.47% increase in GMV, validating its utility in real-world production environments.
- Abstract(参考訳): 現実世界のEコマースプラットフォームのロングテールレコメンデーションは、深刻なデータ不均衡のため、依然として困難なままだ。
既存の方法は、コンテンツベースのマルチモーダル機能と協調的な信号を組み合わせるのに苦労することが多い。
これらの手法の多くは、頭と尾のID間の知識伝達における重要な非対称性を無視している。
本稿では,LLM生成セマンティックIDを用いた長尾勧告における非対称な知識伝達のためのフレームワークであるAKT-Recを提案する。
AKT-Recは、Multimodal LLM(MLLM)を使用して、コンテンツ表現をアイテムとユーザの両方の協調情報と整合させ、セマンティック表現を生成する。
その後、これらの表現をResidual-Quantized VAE (RQ-VAE) でセマンティックIDに識別し、類似したエンティティのセマンティッククラスタを生成する。
AKT-Recには2つの主要なコンポーネントがある。(1) クラスタガイド 適応埋め込みは、各ID表現をクラスタレベルの埋め込みに分解し、共有セマンティクスと個別の埋め込みをキャプチャする。
非対称のコントラスト目的とアクティビティ対応ゲーティング機構を通じて、このモジュールは頭から尾のIDへの知識伝達を指示する。
2) 並列的な特徴ビューを構築する階層的特徴集約(Hierarchical Feature Aggregation)は、様々なアクティビティレベルを持つサンプルの予測を最適化するために、それらを適応的に融合させる。
Alibaba Tmallプラットフォーム上の大規模産業データセットとオンラインA/Bテストに関する大規模な実験は、AKT-Recの有効性を実証している。
AKT-Recは、AUCで0.35%、GAUCで1.53%のオフラインパフォーマンスを改善し、いくつかの競争上のベースラインを上回っている。
オンラインA/Bテストでは、AKT-RecはCTRが2.76%増加し、GMVが3.47%増加した。
関連論文リスト
- EST: Towards Efficient Scaling Laws in Click-Through Rate Prediction via Unified Modeling [13.693397814262681]
近年,産業用クリックスルーレート(CTR)予測の効率化が注目されている。
そこで本研究では,すべての生入力を単一シーケンスで処理して完全に統一されたモデリングを実現する,効率よくスケーラブルな変換器 (EST) を提案する。
ESTは生産ベースラインを大幅に上回り、3.27%のRPM(Revenue Per Mile)と1.22%のCTRリフトを提供する。
論文 参考訳(メタデータ) (2026-02-11T12:51:54Z) - CSMCIR: CoT-Enhanced Symmetric Alignment with Memory Bank for Composed Image Retrieval [54.15776146365823]
Composed Image Retrieval (CIR)では、ユーザーは参照画像と操作テキストの両方を使用してターゲットイメージを検索できる。
CSMCIRは3つの相乗的コンポーネントを通して効率的なクエリターゲットアライメントを実現する統一表現フレームワークである。
論文 参考訳(メタデータ) (2026-01-07T09:21:38Z) - The Best of the Two Worlds: Harmonizing Semantic and Hash IDs for Sequential Recommendation [51.62815306481903]
我々は,SIDとHIDを調和させる新しいフレームワークであるtextbfnameを提案する。具体的には,HIDのユニークなコラボレーティブアイデンティティを保ちながら,SID内のマルチグラニュラーセマンティクスの両方をキャプチャ可能な,デュアルブランチモデリングアーキテクチャを考案する。
実世界の3つのデータセットの実験では、名前は、既存のベースラインを越えながら、頭と尾の両方の推奨品質のバランスをとる。
論文 参考訳(メタデータ) (2025-12-11T07:50:53Z) - FORGE: Forming Semantic Identifiers for Generative Retrieval in Industrial Datasets [64.51403245281547]
FORGEは、産業データセットを使ったジェネレーティブrEtrievalにおけるFOrmingセマンティック識別のベンチマークである。
現実世界のアプリケーションでは、オンラインコンバージェンスを半減するオフライン事前トレーニングスキーマが導入されている。
論文 参考訳(メタデータ) (2025-09-25T08:44:22Z) - Unified Semantic and ID Representation Learning for Deep Recommenders [28.709935854073535]
統一意味・ID表現学習フレームワークを提案する。
我々のフレームワークでは、IDトークンはユニークなアイテム属性をキャプチャし、セマンティックトークンは共有可能な、転送可能な特性を表す。
本フレームワークは,先行層におけるコサイン類似性と最終層におけるユークリッド距離を統合し,表現学習を最適化する。
論文 参考訳(メタデータ) (2025-02-23T07:17:28Z) - Order-agnostic Identifier for Large Language Model-based Generative Recommendation [94.37662915542603]
アイテムは、ユーザ履歴をエンコードし、次のアイテムを生成するために、LLM(Large Language Models)の識別子に割り当てられる。
既存のアプローチでは、トークンシーケンス識別子を使用して、アイテムを個別のトークンシーケンスとして表現するか、IDまたはセマンティック埋め込みを使用して単一トークン識別子を使用する。
本稿では,セマンティック・トークンライザを利用するSETRecを提案する。
論文 参考訳(メタデータ) (2025-02-15T15:25:38Z) - RA-Rec: An Efficient ID Representation Alignment Framework for LLM-based Recommendation [9.606111709136675]
LLMに基づくレコメンデーションのための効率的なID表現フレームワークであるRA-Recを提案する。
RA-Recは最先端のメソッドを大幅に上回り、最大3.0%のHitRate@100の改善を実現している。
論文 参考訳(メタデータ) (2024-02-07T02:14:58Z) - Entity-Graph Enhanced Cross-Modal Pretraining for Instance-level Product
Retrieval [152.3504607706575]
本研究の目的は, 細粒度製品カテゴリを対象とした, 弱制御型マルチモーダル・インスタンスレベルの製品検索である。
まず、Product1Mデータセットをコントリビュートし、2つの実際のインスタンスレベルの検索タスクを定義します。
我々は、マルチモーダルデータから重要な概念情報を組み込むことができるより効果的なクロスモーダルモデルを訓練するために活用する。
論文 参考訳(メタデータ) (2022-06-17T15:40:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。