論文の概要: OneSearch-V2: The Latent Reasoning Enhanced Self-distillation Generative Search Framework
- arxiv url: http://arxiv.org/abs/2603.24422v1
- Date: Wed, 25 Mar 2026 15:33:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-26 21:06:11.36277
- Title: OneSearch-V2: The Latent Reasoning Enhanced Self-distillation Generative Search Framework
- Title(参考訳): OneSearch-V2: 自己蒸留生成検索フレームワークの拡張
- Authors: Ben Chen, Siyuan Wang, Yufei Ma, Zihan Liang, Xuxin Zhang, Yue Lv, Ying Yang, Huangyu Dai, Lingtao Mao, Tong Zhao, Zhipeng Qian, Xinyu Sun, Zhixin Zhai, Yang Zhao, Bochao Liu, Jingshan Lv, Xiao Liang, Hui Kong, Jing Chen, Han Li, Chenyi Lei, Wenwu Ou, Kun Gai,
- Abstract要約: Generative Retrieval (GR) は現代の検索システムにとって有望なパラダイムである。
OneSearchは、産業規模で展開されたジェネレーティブ検索フレームワークとして、商業的および運用上の大きなメリットをもたらしている。
自己蒸留型生成検索フレームワークである textbfOneSearch-V2 を提案する。
- 参考スコア(独自算出の注目度): 41.83974943844478
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative Retrieval (GR) has emerged as a promising paradigm for modern search systems. Compared to multi-stage cascaded architecture, it offers advantages such as end-to-end joint optimization and high computational efficiency. OneSearch, as a representative industrial-scale deployed generative search framework, has brought significant commercial and operational benefits. However, its inadequate understanding of complex queries, inefficient exploitation of latent user intents, and overfitting to narrow historical preferences have limited its further performance improvement. To address these challenges, we propose \textbf{OneSearch-V2}, a latent reasoning enhanced self-distillation generative search framework. It contains three key innovations: (1) a thought-augmented complex query understanding module, which enables deep query understanding and overcomes the shallow semantic matching limitations of direct inference; (2) a reasoning-internalized self-distillation training pipeline, which uncovers users' potential yet precise e-commerce intentions beyond log-fitting through implicit in-context learning; (3) a behavior preference alignment optimization system, which mitigates reward hacking arising from the single conversion metric, and addresses personal preference via direct user feedback. Extensive offline evaluations demonstrate OneSearch-V2's strong query recognition and user profiling capabilities. Online A/B tests further validate its business effectiveness, yielding +3.98\% item CTR, +3.05\% buyer conversion rate, and +2.11\% order volume. Manual evaluation further confirms gains in search experience quality, with +1.65\% in page good rate and +1.37\% in query-item relevance. More importantly, OneSearch-V2 effectively mitigates common search system issues such as information bubbles and long-tail sparsity, without incurring additional inference costs or serving latency.
- Abstract(参考訳): Generative Retrieval (GR) は現代の検索システムにとって有望なパラダイムである。
多段階のカスケードアーキテクチャと比較して、エンドツーエンドのジョイント最適化や高い計算効率といった利点がある。
OneSearchは、産業規模で展開されたジェネレーティブ検索フレームワークとして、商業的および運用上の大きなメリットをもたらしている。
しかし、複雑なクエリの理解が不十分で、潜伏したユーザ意図の非効率な利用や、狭義の履歴的嗜好への過度な適合は、そのさらなるパフォーマンス向上を妨げている。
これらの課題に対処するため,本研究では,自己蒸留型生成検索フレームワークである「textbf{OneSearch-V2}」を提案する。
1)深いクエリ理解を可能にし,直接推論の浅いセマンティックマッチング制限を克服する,複雑なクエリ理解モジュール,(2)暗黙のインコンテキスト学習によるログ適合以外の,ユーザの潜在的かつ正確なEコマース意図を明らかにする推論内部の自己蒸留訓練パイプライン,(3)単一変換基準から生じる報酬ハッキングを軽減し,直接的なユーザフィードバックを通じて個人的嗜好に対処する行動嗜好調整システム,の3つの重要なイノベーションが含まれている。
大規模なオフライン評価は、OneSearch-V2の強力なクエリ認識とユーザプロファイリング機能を示している。
オンラインA/Bテストは、そのビジネス効果をさらに検証し、+3.98\%アイテムCTR、+3.05\%バイヤー変換率、+2.11\%オーダーボリュームを得る。
手動による評価により、検索エクスペリエンスの質がさらに向上し、ページのクオリティは+1.65\%、クエリとイテムの関連性は+1.37\%となる。
さらに重要なことは、OneSearch-V2は、追加の推論コストやレイテンシーを発生させることなく、情報バブルや長いテール間隔などの一般的な検索システムの問題を効果的に軽減する。
関連論文リスト
- SmartSearch: Process Reward-Guided Query Refinement for Search Agents [63.46067892354375]
大言語モデル(LLM)に基づく検索エージェントは、知識集約的な問題に対処するために有望であることが証明されている。
既存の研究は主に、検索エージェントの推論パラダイムの最適化に重点を置いているが、推論中の中間的な検索クエリの品質は見過ごされ続けている。
この問題を緩和する2つの主要なメカニズムの上に構築されたフレームワークであるSmartSearchを紹介します。
論文 参考訳(メタデータ) (2026-01-08T12:39:05Z) - AdaSearch: Balancing Parametric Knowledge and Search in Large Language Models via Reinforcement Learning [61.974530499621274]
検索への過度な依存は、ノイズや悪意のあるコンテンツに対する不必要なコストとリスクをもたらす。
本稿では,探索を起動するか否かの判断から問題を解き放つ2段階の結果駆動型RLフレームワークを提案する。
AdaSearchは知識境界認識を大幅に改善し、不要な検索コールを削減し、タスクパフォーマンスを強く保ち、透明性と解釈可能な意思決定行動を提供する。
論文 参考訳(メタデータ) (2025-12-18T18:50:01Z) - OneSearch: A Preliminary Exploration of the Unified End-to-End Generative Framework for E-commerce Search [43.94443394870866]
OneSearchは、eコマース検索のための最初の産業向けエンドツーエンド生成フレームワークである。
OneSearchは運用費を75.40%削減し、Model FLOPsの利用を3.26%から27.32%に改善した。
このシステムはKuaishouの複数の検索シナリオにまたがって展開され、数百万のユーザーにサービスを提供している。
論文 参考訳(メタデータ) (2025-09-03T11:50:04Z) - Fast or Better? Balancing Accuracy and Cost in Retrieval-Augmented Generation with Flexible User Control [52.405085773954596]
Retrieval-Augmented Generationは、大規模な言語モデル幻覚を緩和するための強力なアプローチとして登場した。
既存のRAGフレームワークは、しばしば無差別に検索を適用し、非効率な再検索につながる。
本稿では,精度・コストのトレードオフを動的に調整できる新しいユーザ制御可能なRAGフレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-17T18:56:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。