論文の概要: Generative Pseudo-Labeling for Pre-Ranking with LLMs
- arxiv url: http://arxiv.org/abs/2602.20995v1
- Date: Tue, 24 Feb 2026 15:14:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-25 17:34:53.809882
- Title: Generative Pseudo-Labeling for Pre-Ranking with LLMs
- Title(参考訳): LLMによるプレランキングのための擬似ラベル生成
- Authors: Junyu Bi, Xinting Niu, Daixuan Cheng, Kun Yuan, Tao Wang, Binbin Cao, Jian Wu, Yuning Jiang,
- Abstract要約: 提案するジェネレーティブ・擬似ラベル(GPL)は,未公開アイテムに対して,バイアスのないコンテンツ対応の擬似ラベルを生成する。
GPLはクリックスルー率を3.07%改善し、レコメンデーションの多様性とロングテールアイテムの発見を大幅に強化した。
- 参考スコア(独自算出の注目度): 14.88083417837956
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pre-ranking is a critical stage in industrial recommendation systems, tasked with efficiently scoring thousands of recalled items for downstream ranking. A key challenge is the train-serving discrepancy: pre-ranking models are trained only on exposed interactions, yet must score all recalled candidates -- including unexposed items -- during online serving. This mismatch not only induces severe sample selection bias but also degrades generalization, especially for long-tail content. Existing debiasing approaches typically rely on heuristics (e.g., negative sampling) or distillation from biased rankers, which either mislabel plausible unexposed items as negatives or propagate exposure bias into pseudo-labels. In this work, we propose Generative Pseudo-Labeling (GPL), a framework that leverages large language models (LLMs) to generate unbiased, content-aware pseudo-labels for unexposed items, explicitly aligning the training distribution with the online serving space. By offline generating user-specific interest anchors and matching them with candidates in a frozen semantic space, GPL provides high-quality supervision without adding online latency. Deployed in a large-scale production system, GPL improves click-through rate by 3.07%, while significantly enhancing recommendation diversity and long-tail item discovery.
- Abstract(参考訳): プレランクは産業レコメンデーションシステムにおいて重要な段階であり、下流のランク付けのために何千ものリコールアイテムを効率的に評価するタスクである。
先行モデルのトレーニングは、露出したインタラクションに基づいて行われるが、オンラインサービスの間は、未公開アイテムを含むすべてのリコール候補をスコア付けする必要がある。
このミスマッチは、厳密なサンプル選択バイアスを引き起こすだけでなく、特にロングテールコンテンツに対する一般化を低下させる。
既存のデバイアスのアプローチは、通常、偏りのあるランク付け者からのヒューリスティック(例えば、負のサンプリング)や蒸留に依存しており、これは偽のラベルへの露出バイアスを伝播させる。
本研究では,大規模言語モデル(LLM)を活用して,未公開アイテムに対する非バイアス付きコンテンツ対応の擬似ラベルを生成するフレームワークであるGenerative Pseudo-Labeling (GPL)を提案する。
ユーザ固有の関心アンカーをオフラインで生成し、凍結したセマンティックスペースの候補とマッチングすることで、GPLはオンラインのレイテンシを追加することなく高品質な監視を提供する。
大規模なプロダクションシステムにデプロイされたGPLは、クリックスルー率を3.07%改善し、推奨の多様性とロングテールアイテムの発見を大幅に強化する。
関連論文リスト
- Statistical Learning from Attribution Sets [38.149441146737615]
プライバシ制約下での広告ドメインにおける変換予測モデルのトレーニングの問題に対処する。
プライバシ保護ブラウザAPIとサードパーティクッキーの非推奨化を動機として,学習者が一連のクリックと一連の変換を観察する環境について検討する。
我々はこれを、候補者に対する事前分布を備えた不愉快な敵が生成した帰属集合からの学習として定式化する。
論文 参考訳(メタデータ) (2026-02-06T00:27:28Z) - Variational Bayesian Personalized Ranking [39.24591060825056]
変分的BPRは、確率最適化、ノイズ低減、人気低下を統合する、新しく実装が容易な学習目標である。
本稿では,問題サンプルからの雑音を効果的に低減するために,注目に基づく競合学習手法を提案する。
実験により、人気のあるバックボーンレコメンデーションモデルにおける変分BPRの有効性を実証する。
論文 参考訳(メタデータ) (2025-03-14T04:22:01Z) - Enhancing Zero-Shot Vision Models by Label-Free Prompt Distribution Learning and Bias Correcting [55.361337202198925]
CLIPのようなヴィジュアル言語モデルは、適切なテキスト記述を使用する際に、顕著な一般化能力を示している。
本稿では,ラベル付きデータを必要としないゼロショット性能を向上する,**Frolic**と呼ばれるラベルフリーな分布学習とバイアス補正フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-25T04:00:45Z) - A Debiased Nearest Neighbors Framework for Multi-Label Text Classification [13.30576550077694]
マルチラベルテキスト分類(MLTC)のためのDebiased Nearest Neighbors(DENN)フレームワークについて紹介する。
組込みアライメントバイアスに対処するために,ラベル共起における近傍の一貫性を向上する,非バイアス付きコントラスト学習戦略を提案する。
信頼度推定バイアスには,$k$NNの予測と帰納的二分分類の適応的組み合わせを改善し,偏りのある信頼度推定戦略を提案する。
論文 参考訳(メタデータ) (2024-08-06T14:00:23Z) - RankMatch: A Novel Approach to Semi-Supervised Label Distribution
Learning Leveraging Inter-label Correlations [52.549807652527306]
本稿では,SSLDL (Semi-Supervised Label Distribution Learning) の革新的なアプローチである RankMatch を紹介する。
RankMatchは、ラベルのない大量のデータとともに、少数のラベル付き例を効果的に活用する。
我々はRandMatchに縛られる理論的な一般化を確立し、広範な実験を通じて既存のSSLDL法に対する性能上の優位性を実証した。
論文 参考訳(メタデータ) (2023-12-11T12:47:29Z) - Optimal Unbiased Randomizers for Regression with Label Differential
Privacy [61.63619647307816]
ラベル差分プライバシ(DP)の制約の下で回帰モデルをトレーニングするためのラベルランダム化器の新たなファミリーを提案する。
これらのランダム化器は、いくつかのデータセット上で最先端のプライバシユーティリティトレードオフを実現することを実証する。
論文 参考訳(メタデータ) (2023-12-09T19:58:34Z) - Unbiased Learning to Rank with Biased Continuous Feedback [5.561943356123711]
雑音フィードバックに基づいて相対関係を正確にモデル化するために,非バイアス学習 to ランク(LTR)アルゴリズムを検証した。
パーソナライズされた高品質なレコメンデーション結果を提供するために、レコメンダシステムはカテゴリと継続的なバイアスフィードバックの両方をモデルにする必要があります。
位置バイアス、信頼バイアス、ユーザ関係を明確に区別するために、ペアワイズ信頼バイアスを導入します。
Tencent Newsの公開ベンチマークデータセットと大規模レコメンデータシステムの内部ライブトラフィックの実験結果は、連続ラベルに対して優れた結果を示している。
論文 参考訳(メタデータ) (2023-03-08T02:14:08Z) - Dist-PU: Positive-Unlabeled Learning from a Label Distribution
Perspective [89.5370481649529]
本稿では,PU学習のためのラベル分布視点を提案する。
そこで本研究では,予測型と基底型のラベル分布間のラベル分布の整合性を追求する。
提案手法の有効性を3つのベンチマークデータセットで検証した。
論文 参考訳(メタデータ) (2022-12-06T07:38:29Z) - Self-supervised debiasing using low rank regularization [59.84695042540525]
純粋な相関は、ディープニューラルネットワークの強いバイアスを引き起こし、一般化能力を損なう可能性がある。
ラベルのないサンプルと互換性のある自己監督型脱バイアスフレームワークを提案する。
注目すべきは,提案フレームワークが自己教師付き学習ベースラインの一般化性能を著しく向上させることである。
論文 参考訳(メタデータ) (2022-10-11T08:26:19Z) - Sequential Recommendation via Stochastic Self-Attention [68.52192964559829]
Transformerベースのアプローチでは、アイテムをベクトルとして埋め込んで、ドット積の自己アテンションを使用してアイテム間の関係を測定する。
本稿では,これらの問題を克服するための新しいtextbfStochastic textbfSelf-textbfAttention (STOSA) を提案する。
我々は、アイテムと項目の位置関係を列で特徴づける新しいワッサースタイン自己保持モジュールを考案した。
論文 参考訳(メタデータ) (2022-01-16T12:38:45Z) - OpinionRank: Extracting Ground Truth Labels from Unreliable Expert
Opinions with Graph-Based Spectral Ranking [2.1930130356902207]
クラウドソーシングは、分散ラベルコレクションを実行するための、ポピュラーで安価で効率的なデータマイニングソリューションとして登場した。
我々は、クラウドソースアノテーションを信頼できるラベルに統合するための、モデルフリーで解釈可能なグラフベースのスペクトルアルゴリズムであるOpinionRankを提案する。
実験の結果,より高パラメータ化アルゴリズムと比較した場合,OpinionRankが好適に動作することがわかった。
論文 参考訳(メタデータ) (2021-02-11T08:12:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。