論文の概要: Beyond Existing Retrievals: Cross-Scenario Incremental Sample Learning Framework
- arxiv url: http://arxiv.org/abs/2512.06381v1
- Date: Sat, 06 Dec 2025 10:26:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-09 22:03:54.334085
- Title: Beyond Existing Retrievals: Cross-Scenario Incremental Sample Learning Framework
- Title(参考訳): 既存の検索を超えて - クロスシナリオインクリメンタルサンプル学習フレームワーク
- Authors: Tao Wang, Xun Luo, Jinlong Guo, Yuliang Yan, Jian Wu, Yuning Jiang, Bo Zheng,
- Abstract要約: 本稿では,クロスシナリオインクリメンタルサンプル学習のための新しい検索フレームワークIncRecを提案する。
特に,TaobaoのホームページレコメンデーションにIncRecを配置し,オンライン取引回数の1%増加を実現した。
- 参考スコア(独自算出の注目度): 14.269153599045152
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The parallelized multi-retrieval architecture has been widely adopted in large-scale recommender systems for its computational efficiency and comprehensive coverage of user interests. Many retrieval methods typically integrate additional cross-scenario samples to enhance the overall performance ceiling. However, those model designs neglect the fact that a part of the cross-scenario samples have already been retrieved by existing models within a system, leading to diminishing marginal utility in delivering incremental performance gains. In this paper, we propose a novel retrieval framework IncRec, specifically for cross-scenario incremental sample learning. The innovations of IncRec can be highlighted as two aspects. Firstly, we construct extreme cross-scenario incremental samples that are not retrieved by any existing model. And we design an incremental sample learning framework which focuses on capturing incremental representation to improve the overall retrieval performance. Secondly, we introduce a consistency-aware alignment module to further make the model prefer incremental samples with high exposure probability. Extensive offline and online A/B tests validate the superiority of our framework over state-of-the-art retrieval methods. In particular, we deploy IncRec in the Taobao homepage recommendation, achieving a 1% increase in online transaction count, demonstrating its practical applicability.
- Abstract(参考訳): 並列化されたマルチ検索アーキテクチャは、計算効率とユーザ関心の包括的カバレッジのために、大規模レコメンデータシステムで広く採用されている。
多くの検索方法は、通常、全体的なパフォーマンス天井を強化するために、追加のクロスシナリオサンプルを統合する。
しかしながら、これらのモデル設計は、クロスシナリオサンプルの一部がシステム内の既存のモデルによって既に回収されているという事実を無視しており、漸進的なパフォーマンス向上を実現するための限界効用を減らしている。
本稿では,新たな検索フレームワークIncRecを提案する。
IncRecのイノベーションは2つの側面として強調できる。
まず,既存のモデルでは検索できない極端にクロスシナリオなインクリメンタルなサンプルを構築する。
また、インクリメンタルなサンプル学習フレームワークを設計し、インクリメンタルな表現をキャプチャして全体の検索性能を向上させる。
第2に,高露光確率のインクリメンタルサンプルをモデルに優先させるために,整合性を考慮したアライメントモジュールを導入する。
大規模なオフラインおよびオンラインA/Bテストは、最先端の検索方法よりも、我々のフレームワークの優位性を検証する。
特に,IncRec を Taobao ホームページレコメンデーションにデプロイし,オンライントランザクション数 1% の増加を実現し,その実用性を示す。
関連論文リスト
- SPARE: Single-Pass Annotation with Reference-Guided Evaluation for Automatic Process Supervision and Reward Modelling [58.05959902776133]
私たちはSingle-Passを紹介します。
Reference-Guided Evaluation (SPARE)は、効率的なステップごとのアノテーションを可能にする新しい構造化フレームワークである。
数学的推論(GSM8K, MATH)、マルチホップ質問応答(MuSiQue-Ans)、空間推論(SpaRP)にまたがる4つの多様なデータセットにおけるSPAREの有効性を実証する。
ProcessBenchでは、SPAREがデータ効率のよいアウト・オブ・ディストリビューションの一般化を実証し、トレーニングサンプルの$sim$16%しか使用していない。
論文 参考訳(メタデータ) (2025-06-18T14:37:59Z) - Exploring Training and Inference Scaling Laws in Generative Retrieval [50.82554729023865]
生成検索は、検索を自己回帰生成タスクとして再構成し、大きな言語モデルがクエリから直接ターゲット文書を生成する。
生成的検索におけるトレーニングと推論のスケーリング法則を体系的に検討し,モデルのサイズ,トレーニングデータスケール,推論時間計算が協調的に性能に与える影響について検討した。
論文 参考訳(メタデータ) (2025-03-24T17:59:03Z) - OneRec: Unifying Retrieve and Rank with Generative Recommender and Iterative Preference Alignment [9.99840965933561]
ケースドラーニングフレームワークを統一的な生成モデルで置き換えるOneRecを提案する。
1) ユーザの履歴行動シーケンスをエンコードし、ユーザが興味を持っているかもしれない動画を徐々にデコードするエンコーダ・デコーダ構造。
論文 参考訳(メタデータ) (2025-02-26T09:25:10Z) - Scenario-Wise Rec: A Multi-Scenario Recommendation Benchmark [65.13288661320364]
6つの公開データセットと12のベンチマークモデルと、トレーニングと評価パイプラインで構成されるベンチマークである textbfScenario-Wise Rec を紹介します。
このベンチマークは、研究者に先行研究から貴重な洞察を提供することを目的としており、新しいモデルの開発を可能にしている。
論文 参考訳(メタデータ) (2024-12-23T08:15:34Z) - Simple but Efficient: A Multi-Scenario Nearline Retrieval Framework for Recommendation on Taobao [21.01879010592532]
本稿では,革新的なマルチシナリオニアライン検索フレームワークを提案する。
さまざまなシナリオからのランキングログをFlinkを通じて活用して動作する。
当社の手法では,製品取引における5%のアップタイク,特に顕著な改善が見られた。
論文 参考訳(メタデータ) (2024-08-01T02:54:23Z) - Sample-Efficient "Clustering and Conquer" Procedures for Parallel Large-Scale Ranking and Selection [3.913403111891027]
並列コンピューティングにおいてよく使われる「分割と征服」フレームワークを,相関に基づくクラスタリングのステップを追加して修正する。
この一見単純な修正は、広く使われているサンプル最適化R&Sプロシージャのクラスに対して、$mathcalO(p)$のサンプル複雑性の減少をもたらす。
ニューラルネットワーク探索のような大規模AIアプリケーションでは,本手法は優れた性能を示す。
論文 参考訳(メタデータ) (2024-02-03T15:56:03Z) - Metric Compatible Training for Online Backfilling in Large-Scale Retrieval [67.72644952719791]
バックフィルは、画像検索システムにおいて、アップグレードされたモデルからすべてのギャラリー埋め込みを再抽出するプロセスである。
本稿では,オンラインのバックフィルアルゴリズムを提案し,バックフィル処理の進行的な性能向上を実現する。
我々は、逆変換モジュールをより効果的で効率的なマージに組み込み、メトリック互換のコントラスト学習アプローチを採用することでさらに強化する。
論文 参考訳(メタデータ) (2023-01-10T03:10:32Z) - Building an Efficient and Effective Retrieval-based Dialogue System via
Mutual Learning [27.04857039060308]
検索システムを構築するために,両世界の長所を組み合わせることを提案する。
従来の機能ベースの事前検索モデルを置き換えるために、高速なバイエンコーダを使用します。
我々は、相互学習を通じて、事前検索モデルと再評価モデルとを同時に訓練する。
論文 参考訳(メタデータ) (2021-10-01T01:32:33Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。