論文の概要: Towards Large-scale Generative Ranking
- arxiv url: http://arxiv.org/abs/2505.04180v1
- Date: Wed, 07 May 2025 07:25:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-08 19:07:35.996845
- Title: Towards Large-scale Generative Ranking
- Title(参考訳): 大規模世代ランク付けに向けて
- Authors: Yanhua Huang, Yuqi Chen, Xiong Cao, Rui Yang, Mingliang Qi, Yinghao Zhu, Qingchang Han, Yaowei Liu, Zhaoyu Liu, Xuefeng Yao, Yuting Jia, Leilei Ma, Yinqi Zhang, Taoyu Zhu, Liujie Zhang, Lei Chen, Weihang Chen, Min Zhu, Ruiwen Xu, Lei Zhang,
- Abstract要約: 本稿では,現在の産業推薦者に対して,生成的ランキングがいかに優れているかを考察する。
ランク付けのための新しい生成アーキテクチャである RankGPT を紹介する。
その結果,RangeGPTは,ほぼ同等の計算資源でユーザ満足度を大幅に向上することがわかった。
- 参考スコア(独自算出の注目度): 14.32876734092535
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Generative recommendation has recently emerged as a promising paradigm in information retrieval. However, generative ranking systems are still understudied, particularly with respect to their effectiveness and feasibility in large-scale industrial settings. This paper investigates this topic at the ranking stage of Xiaohongshu's Explore Feed, a recommender system that serves hundreds of millions of users. Specifically, we first examine how generative ranking outperforms current industrial recommenders. Through theoretical and empirical analyses, we find that the primary improvement in effectiveness stems from the generative architecture, rather than the training paradigm. To facilitate efficient deployment of generative ranking, we introduce RankGPT, a novel generative architecture for ranking. We validate the effectiveness and efficiency of our solution through online A/B experiments. The results show that RankGPT achieves significant improvements in user satisfaction with nearly equivalent computational resources compared to the existing production system.
- Abstract(参考訳): 近年,情報検索のパラダイムとしてジェネレーティブレコメンデーションが登場している。
しかし、生成的ランキングシステムは、特に大規模産業環境での有効性と実現可能性に関して、いまだに検討されている。
本稿では,このトピックを,数億人のユーザを対象とした推薦システムであるXiaohongshu's Explore Feedのランキング段階で検討する。
具体的には、まず、生成的ランキングが現在の産業レコメンデーションよりも優れているかを検討する。
理論的および経験的分析により、有効性の主な改善は、学習パラダイムではなく、生成的アーキテクチャに由来することが判明した。
生成的ランキングの効率的な展開を容易にするために,新しい生成的ランキングアーキテクチャである RankGPT を導入する。
オンラインA/B実験を通じて,ソリューションの有効性と有効性を検証する。
その結果,RangeGPTは既存の生産システムと比較して,ほぼ同等の計算資源でユーザ満足度を大幅に向上することがわかった。
関連論文リスト
- Killing Two Birds with One Stone: Unifying Retrieval and Ranking with a Single Generative Recommendation Model [71.45491434257106]
Unified Generative Recommendation Framework (UniGRF)は、検索とランキングを単一の生成モデルに統合する新しいアプローチである。
ステージ間コラボレーションを強化するため、UniGRFはランキング駆動エンハンサーモジュールを導入した。
UniGRFは、ベンチマークデータセット上で既存のモデルよりも大幅に優れています。
論文 参考訳(メタデータ) (2025-04-23T06:43:54Z) - PinRec: Outcome-Conditioned, Multi-Token Generative Retrieval for Industry-Scale Recommendation Systems [6.738040775297612]
本稿ではPinterestのアプリケーション向けに開発された新しい生成検索モデルであるPinRecを紹介する。
我々の実験は、PinRecがパフォーマンス、多様性、効率のバランスをとれることを実証しています。
論文 参考訳(メタデータ) (2025-04-09T17:46:12Z) - Generative Large Recommendation Models: Emerging Trends in LLMs for Recommendation [85.52251362906418]
このチュートリアルでは、大規模言語モデル(LLM)を統合するための2つの主要なアプローチを探求する。
これは、最近の進歩、課題、潜在的研究の方向性を含む、生成的な大規模なレコメンデーションモデルの包括的な概要を提供する。
主なトピックは、データ品質、スケーリング法則、ユーザの行動マイニング、トレーニングと推論の効率性である。
論文 参考訳(メタデータ) (2025-02-19T14:48:25Z) - ChainRank-DPO: Chain Rank Direct Preference Optimization for LLM Rankers [22.51924253176532]
大規模言語モデル(LLM)は、RangeGPTのような作品を通してテキストのランク付けにおいて顕著な効果を示している。
ランク付けのための微調整の監督は、これらのモデルの汎用能力を低下させる。
そこで本稿では,SFT-DPOパイプラインを用いたChain-of-Thoughtの導入により,これらの機能を維持しつつ,ランキング性能を向上する手法を提案する。
論文 参考訳(メタデータ) (2024-12-18T23:24:15Z) - Scaling New Frontiers: Insights into Large Recommendation Models [74.77410470984168]
MetaのジェネレーティブレコメンデーションモデルHSTUは、パラメータを数千億に拡張することでレコメンデーションシステムのスケーリング法則を説明している。
我々は、これらのスケーリング法則の起源を探るため、包括的なアブレーション研究を行っている。
大規模なレコメンデーションモデルの今後の方向性に関する洞察を提供する。
論文 参考訳(メタデータ) (2024-12-01T07:27:20Z) - RankTower: A Synergistic Framework for Enhancing Two-Tower Pre-Ranking Model [0.0]
大規模ランキングシステムでは、効率性と効率性のバランスをとるためにカスケードアーキテクチャが広く採用されている。
オンラインレイテンシの制約に従うために、効率性と精度のバランスを維持することは、プレグレードモデルにとって不可欠である。
そこで我々は,ユーザとイテムのインタラクションを効率的に捉えるために,RangeTowerという新しいニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-07-17T08:07:37Z) - DNS-Rec: Data-aware Neural Architecture Search for Recommender Systems [79.76519917171261]
本稿では,SRS(Sequential Recommender Systems)における計算オーバーヘッドと資源非効率性について述べる。
本稿では, プルーニング法と高度なモデル設計を組み合わせた革新的な手法を提案する。
我々の主な貢献は、リコメンダシステム(DNS-Rec)のためのデータ対応ニューラルアーキテクチャ検索の開発である。
論文 参考訳(メタデータ) (2024-02-01T07:22:52Z) - Guiding Generative Language Models for Data Augmentation in Few-Shot
Text Classification [59.698811329287174]
我々は、GPT-2を用いて、分類性能を向上させるために、人工訓練インスタンスを生成する。
実験の結果,少数のラベルインスタンスでGPT-2を微調整すると,一貫した分類精度が向上することがわかった。
論文 参考訳(メタデータ) (2021-11-17T12:10:03Z) - Towards a Better Tradeoff between Effectiveness and Efficiency in
Pre-Ranking: A Learnable Feature Selection based Approach [12.468550800027808]
現実世界の検索、レコメンデーション、広告システムでは、多段階ランキングアーキテクチャが一般的である。
本論文では,対話型アーキテクチャを備えた複雑なモデルをサポートする新しい事前ランク付け手法を提案する。
本手法は,学習可能な特徴選択手法を用いることで,有効性と効率のトレードオフを向上する。
論文 参考訳(メタデータ) (2021-05-17T09:48:15Z) - Few-Shot Named Entity Recognition: A Comprehensive Study [92.40991050806544]
マルチショット設定のモデル一般化能力を向上させるための3つの手法を検討する。
ラベル付きデータの比率の異なる10の公開nerデータセットについて経験的比較を行う。
マルチショットとトレーニングフリーの両方の設定で最新の結果を作成します。
論文 参考訳(メタデータ) (2020-12-29T23:43:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。