Fugu-MT 論文翻訳(概要): Efficient Personalized Reranking with Semi-Autoregressive Generation and Online Knowledge Distillation

論文の概要: Efficient Personalized Reranking with Semi-Autoregressive Generation and Online Knowledge Distillation

arxiv url: http://arxiv.org/abs/2603.07107v1
Date: Sat, 07 Mar 2026 08:37:13 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-10 15:13:13.811606
Title: Efficient Personalized Reranking with Semi-Autoregressive Generation and Online Knowledge Distillation
Title（参考訳）: 半自己回帰生成とオンライン知識蒸留を併用した効率の良いパーソナライズ
Authors: Kai Cheng, Hao Wang, Wei Guo, Weiwen Liu, Yong Liu, Yawen Li, Enhong Chen,
Abstract要約: 本稿では,オンライン知識蒸留(PSAD)フレームワークを改訂するための新しいパーソナライズド・セミ・オートレグレッシブを提案する。このフレームワークでは、教師モデルは、生成品質と効率のバランスをとるために半自己回帰ジェネレータを採用し、そのランキング知識はオンラインで軽量のスコアリングネットワークに抽出される。 3つの大規模な公開データセットで実施された実験により、PSADはランク付け性能と推論効率の両方において最先端のベースラインを大幅に上回っていることが示された。
参考スコア（独自算出の注目度）: 67.09494009022471
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Generative models offer a promising paradigm for the final stage reranking in multi-stage recommender systems, with the ability to capture inter-item dependencies within reranked lists. However, their practical deployment still faces two key challenges: (1) an inherent conflict between achieving high generation quality and ensuring low-latency inference, making it difficult to balance the two, and (2) insufficient interaction between user and item features in existing methods. To address these challenges, we propose a novel Personalized Semi-Autoregressive with online knowledge Distillation (PSAD) framework for reranking. In this framework, the teacher model adopts a semi-autoregressive generator to balance generation quality and efficiency, while its ranking knowledge is distilled online into a lightweight scoring network during joint training, enabling real-time and efficient inference. Furthermore, we propose a User Profile Network (UPN) that injects user intent and models interest dynamics, enabling deeper interactions between users and items. Extensive experiments conducted on three large-scale public datasets demonstrate that PSAD significantly outperforms state-of-the-art baselines in both ranking performance and inference efficiency.
Abstract（参考訳）: 生成モデルは、マルチステージレコメンデータシステムにおいて最終段階のリランクのための有望なパラダイムを提供する。しかし,その実践的展開には,(1)高次品質の実現と低レイテンシ推論の確保,(2)既存手法におけるユーザとアイテムの特徴の相互関係の整合性の両立が困難である,という2つの課題がある。これらの課題に対処するため、我々は、オンライン知識蒸留(PSAD)フレームワークを改訂するための新しいパーソナライズされた半自己回帰(Personalized Semi-Autoregressive)を提案する。このフレームワークでは、教師モデルは、生成品質と効率のバランスをとるために半自己回帰ジェネレータを採用し、そのランキング知識は、共同トレーニング中に軽量スコアリングネットワークにオンラインで蒸留され、リアルタイムかつ効率的な推論を可能にする。さらに,ユーザ意図を注入し,ユーザとアイテム間のより深いインタラクションを可能にするユーザプロファイルネットワーク(UPN)を提案する。 3つの大規模な公開データセットで実施された大規模な実験により、PSADはランク付け性能と推論効率の両方において最先端のベースラインを大幅に上回っていることが示された。

関連論文リスト

Multi-Agent Model-Based Reinforcement Learning with Joint State-Action Learned Embeddings [10.36125908359289]
モデルに基づくマルチエージェント強化学習フレームワークを提案する。我々は変分自動エンコーダで訓練された世界モデルを設計し、状態-作用学習埋め込みを用いてモデルを増強する。想像された軌道とSALEに基づく行動値とを結合することにより、エージェントは彼らの選択が集団的な結果にどのように影響するかをより深く理解する。
論文参考訳（メタデータ） (2026-02-13T01:57:21Z)
Bagging-Based Model Merging for Robust General Text Embeddings [73.51674133699196]
汎用テキスト埋め込みモデルは、幅広いNLPおよび情報検索アプリケーションを支える。本稿では,データスケジューリングとモデルマージという2つの観点から,テキスト埋め込みのためのマルチタスク学習の体系的研究を行う。本稿では,Baging ベースの rObust mOdel Merging (BOOM) を提案する。
論文参考訳（メタデータ） (2026-02-05T15:45:08Z)
Interact2Vec -- An efficient neural network-based model for simultaneously learning users and items embeddings in recommender systems [1.0819408603463425]
本稿では,ユーザとアイテムの分散埋め込みを同時に学習するニューラルネットワークモデルを提案する。このモデルは、自然言語処理モデルがトレーニングフェーズを最適化し、最終的な埋め込みを強化するために一般的に使用する最先端の戦略を採用している。
論文参考訳（メタデータ） (2025-06-27T21:30:03Z)
Reinforced Interactive Continual Learning via Real-time Noisy Human Feedback [59.768119380109084]
本稿では,AIモデルがリアルタイムフィードバックから新たなスキルを動的に学習する対話型連続学習パラダイムを提案する。大規模言語モデル(LLM)を活用した強化型対話型連続学習フレームワークRiCLを提案する。我々のRiCLアプローチは、最先端のオンライン連続学習とノイズラベル学習の既存の組み合わせを大幅に上回っている。
論文参考訳（メタデータ） (2025-05-15T03:22:03Z)
A-FedPD: Aligning Dual-Drift is All Federated Primal-Dual Learning Needs [57.35402286842029]
本稿では,グローバルクライアントとローカルクライアントの仮想二重配向を構成する新しいアラインドデュアルデュアル(A-FedPD)手法を提案する。本稿では,A-FedPD方式の非集中型セキュリティコンセンサスに対する効率を包括的に分析する。
論文参考訳（メタデータ） (2024-09-27T17:00:32Z)
RankTower: A Synergistic Framework for Enhancing Two-Tower Pre-Ranking Model [0.0]
大規模ランキングシステムでは、効率性と効率性のバランスをとるためにカスケードアーキテクチャが広く採用されている。オンラインレイテンシの制約に従うために、効率性と精度のバランスを維持することは、プレグレードモデルにとって不可欠である。そこで我々は,ユーザとイテムのインタラクションを効率的に捉えるために,RangeTowerという新しいニューラルネットワークアーキテクチャを提案する。
論文参考訳（メタデータ） (2024-07-17T08:07:37Z)
Non-autoregressive Generative Models for Reranking Recommendation [9.854541524740549]
推薦システムでは、項目間のリスト内相関をモデル化することで、リランクが重要な役割を果たす。本研究では, 効率と効率性を高めるために, 提案するレコメンデーション(NAR4Rec)の再評価のための非自己回帰生成モデルを提案する。 NAR4Recは、毎日3億人のアクティブユーザーがいる人気ビデオアプリKuaishouに完全にデプロイされている。
論文参考訳（メタデータ） (2024-02-10T03:21:13Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。