論文の概要: Generative Early Stage Ranking
- arxiv url: http://arxiv.org/abs/2511.21095v1
- Date: Wed, 26 Nov 2025 06:29:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-27 18:37:58.988255
- Title: Generative Early Stage Ranking
- Title(参考訳): 創世初期のランク付け
- Authors: Juhee Hong, Meng Liu, Shengzhi Wang, Xiaoheng Mao, Huihui Cheng, Leon Gao, Christopher Leung, Jin Zhou, Chandra Mouli Sekar, Zhao Zhu, Ruochen Liu, Tuan Trieu, Dawei Sun, Jeet Kanjani, Rui Li, Jing Qian, Xuan Cao, Minjie Fan, Mingze Gao,
- Abstract要約: 本稿では,有効性と効率のバランスをとるために,GESR(Generative Early Stage Ranking)パラダイムを提案する。
GESRパラダイムは、トポラインメトリクス、エンゲージメント、消費タスクを大幅に改善した。
我々の知る限りでは、このような規模でESRステージにおける完全なターゲット対応アテンションシーケンスモデリングを成功させたのはこれが初めてである。
- 参考スコア(独自算出の注目度): 14.15517442047903
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Large-scale recommendations commonly adopt a multi-stage cascading ranking system paradigm to balance effectiveness and efficiency. Early Stage Ranking (ESR) systems utilize the "user-item decoupling" approach, where independently learned user and item representations are only combined at the final layer. While efficient, this design is limited in effectiveness, as it struggles to capture fine-grained user-item affinities and cross-signals. To address these, we propose the Generative Early Stage Ranking (GESR) paradigm, introducing the Mixture of Attention (MoA) module which leverages diverse attention mechanisms to bridge the effectiveness gap: the Hard Matching Attention (HMA) module encodes explicit cross-signals by computing raw match counts between user and item features; the Target-Aware Self Attention module generates target-aware user representations conditioned on the item, enabling more personalized learning; and the Cross Attention modules facilitate early and more enriched interactions between user-item features. MoA's specialized attention encodings are further refined in the final layer through a Multi-Logit Parameterized Gating (MLPG) module, which integrates the newly learned embeddings via gating and produces secondary logits that are fused with the primary logit. To address the efficiency and latency challenges, we have introduced a comprehensive suite of optimization techniques. These span from custom kernels that maximize the capabilities of the latest hardware to efficient serving solutions powered by caching mechanisms. The proposed GESR paradigm has shown substantial improvements in topline metrics, engagement, and consumption tasks, as validated by both offline and online experiments. To the best of our knowledge, this marks the first successful deployment of full target-aware attention sequence modeling within an ESR stage at such a scale.
- Abstract(参考訳): 大規模レコメンデーションでは、効率性と効率性のバランスをとるために、多段階のカスケードランキングシステムパラダイムが一般的である。
アーリーステージランキング(ESR)システムでは,ユーザとアイテムの個別表現が最終層でのみ結合される"ユーザ-イット・デカップリング(user-item decoupling)"アプローチを採用している。
効率は良いが、このデザインは、微妙なユーザ・イテム親和性とクロスシグナーを捉えるのに苦労するため、有効性は限られている。
そこで本研究では,ユーザとアイテムの特徴間の生のマッチング数を計算することで,明示的なクロスシグナルを符号化するHMAモジュールと,よりパーソナライズされた学習を可能にするターゲット・アウェアなユーザ表現を生成するTarget-Aware Self Attentionモジュールと,ユーザ・イテムの特徴間の早期かつよりリッチなインタラクションを支援するCross Attentionモジュールを提案する。
MoAの特別なアテンションエンコーディングは、マルチロジットパラメータゲーティング(MLPG)モジュールを通じて最終層でさらに洗練され、ゲーティングを通じて新しく学習された埋め込みを統合し、プライマリロジットと融合したセカンダリロジットを生成する。
効率性とレイテンシの課題に対処するため、我々は最適化手法の包括的なスイートを導入しました。
これらは、最新のハードウェアの能力を最大化するカスタムカーネルから、キャッシュ機構を利用した効率的なサービスソリューションまで、多岐にわたる。
提案したGESRパラダイムは、オフラインとオンラインの両方の実験によって検証されるように、トポラインメトリクス、エンゲージメント、消費タスクを大幅に改善した。
我々の知る限りでは、このような規模でESRステージにおける完全なターゲット対応アテンションシーケンスモデリングを成功させたのはこれが初めてである。
関連論文リスト
- A Learnable Fully Interacted Two-Tower Model for Pre-Ranking System [15.03225449071182]
2-towerモデルは、効率と有効性のバランスが良いため、プレグレードシステムで広く使われている。
FIT(Learningable Fully Interacted Two-tower Model)と呼ばれる新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-09-16T10:52:03Z) - Multimodal Fusion And Sparse Attention-based Alignment Model for Long Sequential Recommendation [9.086257183699418]
マルチモーダルアイテムシーケンスとマイニング マルチモーダルユーザ興味は、コンテンツ理解とレコメンデーションのギャップを埋めることができます。
本稿では,ムルティモダル核融合とスパースアテンションに基づくアライメントモデルであるMUFASAを提案する。
実世界のベンチマーク実験では、MUFASAが最先端のベースラインを一貫して超越していることが示されている。
論文 参考訳(メタデータ) (2025-08-13T09:50:44Z) - Semi-supervised Semantic Segmentation with Multi-Constraint Consistency Learning [81.02648336552421]
本稿では,エンコーダとデコーダの段階的拡張を容易にするためのマルチ制約一貫性学習手法を提案する。
自己適応型特徴マスキングとノイズ注入は、デコーダの堅牢な学習のための特徴を摂動させるために、インスタンス固有の方法で設計されている。
Pascal VOC2012およびCityscapesデータセットの実験結果から,提案したMCCLが新たな最先端性能を実現することを示す。
論文 参考訳(メタデータ) (2025-03-23T03:21:33Z) - DOEI: Dual Optimization of Embedding Information for Attention-Enhanced Class Activation Maps [30.53564087005569]
弱教師付きセマンティックセグメンテーション(WSSS)は、典型的には限定的なセマンティックアノテーションを使用して、初期クラスアクティベーションマップ(CAM)を取得する。
クラスアクティベーション応答と高次元空間のセマンティック情報との結合が不十分なため、CAMはオブジェクト共起や不活性化の傾向にある。
本稿では,意味認識重み行列を用いて埋め込み表現を再構成する新しい手法である,埋め込み情報のデュアル最適化であるDOEIを提案する。
論文 参考訳(メタデータ) (2025-02-21T19:06:01Z) - Read-ME: Refactorizing LLMs as Router-Decoupled Mixture of Experts with System Co-Design [59.00758127310582]
本稿では、事前学習された高密度LCMをより小さなMoEモデルに変換する新しいフレームワークRead-MEを提案する。
当社のアプローチでは,専門家の抽出にアクティベーション空間を用いる。
Read-MEは、同様のスケールの他の人気のあるオープンソース高密度モデルよりも優れています。
論文 参考訳(メタデータ) (2024-10-24T19:48:51Z) - Collaborative Filtering Based on Diffusion Models: Unveiling the Potential of High-Order Connectivity [10.683635786183894]
CF-Diffは新しい拡散モデルに基づく協調フィルタリング手法である。
マルチホップの隣人と一緒に、協調的な信号を完全に活用することができる。
最高の競争相手に比べて7.29%も上昇している。
論文 参考訳(メタデータ) (2024-04-22T14:49:46Z) - AMMUNet: Multi-Scale Attention Map Merging for Remote Sensing Image Segmentation [4.618389486337933]
マルチスケールアテンションマップをマージするUNetベースのフレームワークであるAMMUNetを提案する。
提案するAMMMは,マルチスケールアテンションマップを固定マスクテンプレートを用いた統一表現に効果的に結合する。
提案手法は,Vayhingenデータセットでは75.48%,Potsdamデータセットでは77.90%という顕著な平均交叉(mIoU)を達成した。
論文 参考訳(メタデータ) (2024-04-20T15:23:15Z) - Can SAM Boost Video Super-Resolution? [78.29033914169025]
単純な有効モジュールであるSAM-guidEd refinEment Module (SEEM)を提案する。
この軽量プラグインモジュールは、セマンティック・アウェア機能の生成にアテンションメカニズムを活用するように設計されている。
我々はSEEMをEDVRとBasicVSRの2つの代表的手法に適用し、最小限の実装労力で継続的に性能を向上する。
論文 参考訳(メタデータ) (2023-05-11T02:02:53Z) - USER: Unified Semantic Enhancement with Momentum Contrast for Image-Text
Retrieval [115.28586222748478]
Image-Text Retrieval (ITR) は、与えられたクエリに意味のあるターゲットインスタンスを、他のモダリティから検索することを目的としている。
既存のアプローチは通常、2つの大きな制限に悩まされる。
論文 参考訳(メタデータ) (2023-01-17T12:42:58Z) - Learning towards Synchronous Network Memorizability and Generalizability
for Continual Segmentation across Multiple Sites [52.84959869494459]
臨床実践では、複数のサイトから連続的なデータストリームを継続的に学習するために、セグメンテーションネットワークが必要であることが多い。
既存の方法は、通常、以前のサイトのネットワーク記憶可能性や、目に見えないサイトの一般化可能性に制限される。
本稿では,SMG学習フレームワークの提案により,同期記憶可能性と一般化可能性の問題に取り組むことを目的とする。
論文 参考訳(メタデータ) (2022-06-14T13:04:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。