論文の概要: UniSearch: Rethinking Search System with a Unified Generative Architecture
- arxiv url: http://arxiv.org/abs/2509.06887v1
- Date: Mon, 08 Sep 2025 17:08:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-09 14:07:04.27492
- Title: UniSearch: Rethinking Search System with a Unified Generative Architecture
- Title(参考訳): UniSearch: 統一生成アーキテクチャによる検索システムの再考
- Authors: Jiahui Chen, Xiaoze Jiang, Zhibo Wang, Quanzhi Zhu, Junyao Zhao, Feng Hu, Kang Pan, Ao Xie, Maohua Pei, Zhiheng Qin, Hongjing Zhang, Zhixin Zhai, Xiaobo Guo, Runbin Zhou, Kefeng Wang, Mingyang Geng, Cheng Chen, Jingshan Lv, Yupeng Huang, Xiao Liang, Han Li,
- Abstract要約: UniSearchはKuaishou Searchのための統合された生成検索フレームワークである。
UniSearchは、カスケードパイプラインを、検索ジェネレータとビデオジェネレータを統合するエンドツーエンドアーキテクチャに置き換える。
産業規模のデータセットに関する大規模な実験と、短いビデオとライブ検索のシナリオにおけるオンラインA/Bテストは、UniSearchの強力な有効性とデプロイメントの可能性を示している。
- 参考スコア(独自算出の注目度): 20.448690421956023
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modern search systems play a crucial role in facilitating information acquisition. Traditional search engines typically rely on a cascaded architecture, where results are retrieved through recall, pre-ranking, and ranking stages. The complexity of designing and maintaining multiple modules makes it difficult to achieve holistic performance gains. Recent advances in generative recommendation have motivated the exploration of unified generative search as an alternative. However, existing approaches are not genuinely end-to-end: they typically train an item encoder to tokenize candidates first and then optimize a generator separately, leading to objective inconsistency and limited generalization. To address these limitations, we propose UniSearch, a unified generative search framework for Kuaishou Search. UniSearch replaces the cascaded pipeline with an end-to-end architecture that integrates a Search Generator and a Video Encoder. The Generator produces semantic identifiers of relevant items given a user query, while the Video Encoder learns latent item embeddings and provides their tokenized representations. A unified training framework jointly optimizes both components, enabling mutual enhancement and improving representation quality and generation accuracy. Furthermore, we introduce Search Preference Optimization (SPO), which leverages a reward model and real user feedback to better align generation with user preferences. Extensive experiments on industrial-scale datasets, together with online A/B testing in both short-video and live search scenarios, demonstrate the strong effectiveness and deployment potential of UniSearch. Notably, its deployment in live search yields the largest single-experiment improvement in recent years of our product's history, highlighting its practical value for real-world applications.
- Abstract(参考訳): 現代の検索システムは情報取得を促進する上で重要な役割を担っている。
従来の検索エンジンは典型的にはカスケードアーキテクチャに依存しており、その結果はリコール、事前ランク付け、ランキングの段階を通じて検索される。
複数のモジュールの設計とメンテナンスの複雑さは、全体的なパフォーマンス向上を達成するのを難しくします。
ジェネレーティブ・リコメンデーションの最近の進歩は、代替として統合ジェネレーティブ・サーチの探索を動機付けている。
通常はアイテムエンコーダを訓練して、まず候補をトークン化し、次に別々にジェネレータを最適化し、客観的な矛盾と限定的な一般化をもたらす。
これらの制約に対処するため,Kuaishou Search用の統合生成検索フレームワークであるUniSearchを提案する。
UniSearchは、カスケードパイプラインを、検索ジェネレータとビデオエンコーダを統合するエンドツーエンドアーキテクチャに置き換える。
ジェネレータは、ユーザクエリが与えられた関連するアイテムのセマンティック識別子を生成し、ビデオエンコーダは遅延アイテムの埋め込みを学習し、トークン化された表現を提供する。
統合トレーニングフレームワークは、両コンポーネントを共同で最適化し、相互強化と表現品質と生成精度の向上を可能にする。
さらに、報酬モデルと実際のユーザフィードバックを活用して、生成とユーザの嗜好の整合性を向上する検索選好最適化(SPO)を導入する。
産業規模のデータセットに関する大規模な実験と、短いビデオとライブ検索のシナリオにおけるオンラインA/Bテストは、UniSearchの強力な有効性とデプロイメントの可能性を示している。
特に、ライブ検索への展開は、我々の製品の歴史において、近年最大の単一体験改善をもたらし、実世界のアプリケーションにとっての実用的価値を強調している。
関連論文リスト
- Xinyu AI Search: Enhanced Relevance and Comprehensive Results with Rich Answer Presentations [15.89383689179436]
Xinyu AI Searchは、クエリ分解グラフを組み込んだ新しいシステムで、複雑なクエリを動的にサブクエリに分割する。
検索パイプラインは多ソースアグリゲーションとクエリ拡張によって多様性を高め、フィルタと再ランク戦略は通過妥当性を最適化する。
Xinyu AI Searchは、人間の評価において8つの既存の技術を上回っている。
論文 参考訳(メタデータ) (2025-05-28T00:30:22Z) - NExT-Search: Rebuilding User Feedback Ecosystem for Generative AI Search [108.42163676745085]
NExT-Searchは、きめ細かいプロセスレベルのフィードバックを生成AI検索に再導入するために設計された次世代パラダイムである。
NExT-Searchは2つの補完モードを統合している。
論文 参考訳(メタデータ) (2025-05-20T17:59:13Z) - Generative Retrieval with Preference Optimization for E-commerce Search [16.78829577915103]
我々は、好みを最適化した生成検索という、Eコマース検索のための革新的なフレームワークを開発する。
生の項目のタイトルを表すためにマルチスパン識別子を使用し、クエリからタイトルを生成するタスクを、クエリからマルチスパン識別子を生成するタスクに変換する。
実験の結果,本フレームワークは実世界のデータセット上での競合性能を実現し,オンラインA/Bテストはコンバージョンゲインの改善における優位性と有効性を示した。
論文 参考訳(メタデータ) (2024-07-29T09:31:19Z) - CART: A Generative Cross-Modal Retrieval Framework with Coarse-To-Fine Semantic Modeling [53.97609687516371]
クロスモーダル検索は、異なるモーダルデータの相互作用を通じて、クエリと意味的に関連するインスタンスを検索することを目的としている。
従来のソリューションでは、クエリと候補の間のスコアを明示的に計算するために、シングルトウワーまたはデュアルトウワーのフレームワークを使用している。
粗大なセマンティックモデリングに基づく生成的クロスモーダル検索フレームワーク(CART)を提案する。
論文 参考訳(メタデータ) (2024-06-25T12:47:04Z) - Large Search Model: Redefining Search Stack in the Era of LLMs [63.503320030117145]
我々は,1つの大言語モデル(LLM)で検索タスクを統一することにより,従来の検索スタックを再定義する,大規模検索モデルと呼ばれる新しい概念的フレームワークを導入する。
全てのタスクは自動回帰テキスト生成問題として定式化され、自然言語のプロンプトを使ってタスクをカスタマイズできる。
提案フレームワークは,LLMの強力な言語理解と推論能力を活用し,既存の検索スタックを簡素化しつつ,検索結果の質を向上させる能力を提供する。
論文 参考訳(メタデータ) (2023-10-23T05:52:09Z) - Recommender Systems with Generative Retrieval [58.454606442670034]
本稿では,対象候補の識別子を自己回帰的に復号する新たな生成検索手法を提案する。
そのために、各項目のセマンティックIDとして機能するために、意味論的に意味のあるコードワードを作成します。
提案手法を用いて学習した推薦システムは,様々なデータセット上での現在のSOTAモデルよりも大幅に優れていることを示す。
論文 参考訳(メタデータ) (2023-05-08T21:48:17Z) - CorpusBrain: Pre-train a Generative Retrieval Model for
Knowledge-Intensive Language Tasks [62.22920673080208]
単一ステップ生成モデルは、検索プロセスを劇的に単純化し、エンドツーエンドで最適化することができる。
我々は、事前学習された生成検索モデルをCorpsBrainと名付け、コーパスに関する全ての情報が、追加のインデックスを構築することなく、そのパラメータにエンコードされる。
論文 参考訳(メタデータ) (2022-08-16T10:22:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。