論文の概要: Optimizing Retrieval Components for a Shared Backbone via Component-Wise Multi-Stage Training
- arxiv url: http://arxiv.org/abs/2602.00805v1
- Date: Sat, 31 Jan 2026 16:29:32 GMT
- ステータス: 情報取得中
- システム内更新日: 2026-02-03 13:37:22.218989
- Title: Optimizing Retrieval Components for a Shared Backbone via Component-Wise Multi-Stage Training
- Title(参考訳): コンポーネントワイズ多段階学習による共有バックボーンの検索成分の最適化
- Authors: Yunhan Li, Mingjie Xie, Zihan Gong, Zeyang Shi, Gengshen Wu, Min Yang,
- Abstract要約: 本稿では,生産法定検索システムにおいて,共有バックボーンとしてデプロイされた検索コンポーネントを最適化するシステムレベルのソリューションを提案する。
我々は、高密度検索と再ランカのための多段階最適化フレームワークを採用し、異なる検索コンポーネントがステージ依存のトレードオフを示すことを示す。
得られたバックボーンはエンドツーエンドの評価を通じて検証され、複数の産業アプリケーションをサポートする共有検索サービスとしてデプロイされる。
- 参考スコア(独自算出の注目度): 10.792358515176106
- License:
- Abstract: Recent advances in embedding-based retrieval have enabled dense retrievers to serve as core infrastructure in many industrial systems, where a single retrieval backbone is often shared across multiple downstream applications. In such settings, retrieval quality directly constrains system performance and extensibility, while coupling model selection, deployment, and rollback decisions across applications. In this paper, we present empirical findings and a system-level solution for optimizing retrieval components deployed as a shared backbone in production legal retrieval systems. We adopt a multi-stage optimization framework for dense retrievers and rerankers, and show that different retrieval components exhibit stage-dependent trade-offs. These observations motivate a component-wise, mixed-stage configuration rather than relying on a single uniformly optimal checkpoint. The resulting backbone is validated through end-to-end evaluation and deployed as a shared retrieval service supporting multiple industrial applications.
- Abstract(参考訳): 組込み型検索の最近の進歩は、複数の下流アプリケーション間で単一の検索バックボーンが共有される多くの産業システムにおいて、高密度検索がコアインフラストラクチャとして機能することを可能にしている。
このような設定では、検索品質はシステムの性能と拡張性を直接的に制限し、一方で、アプリケーション間でのモデル選択、デプロイ、ロールバックの決定を結合する。
本稿では,プロダクション法定検索システムにおいて,共有バックボーンとしてデプロイされた検索コンポーネントを最適化するための経験的発見とシステムレベルのソリューションを提案する。
我々は、高密度検索と再ランカのための多段階最適化フレームワークを採用し、異なる検索コンポーネントがステージ依存のトレードオフを示すことを示す。
これらの観察は、単一の一様最適チェックポイントに頼るのではなく、コンポーネント単位で混合ステージの構成を動機付けている。
得られたバックボーンはエンドツーエンドの評価を通じて検証され、複数の産業アプリケーションをサポートする共有検索サービスとしてデプロイされる。
関連論文リスト
- UniSearch: Rethinking Search System with a Unified Generative Architecture [20.448690421956023]
UniSearchはKuaishou Searchのための統合された生成検索フレームワークである。
UniSearchは、カスケードパイプラインを、検索ジェネレータとビデオジェネレータを統合するエンドツーエンドアーキテクチャに置き換える。
産業規模のデータセットに関する大規模な実験と、短いビデオとライブ検索のシナリオにおけるオンラインA/Bテストは、UniSearchの強力な有効性とデプロイメントの可能性を示している。
論文 参考訳(メタデータ) (2025-09-08T17:08:26Z) - MSRS: Evaluating Multi-Source Retrieval-Augmented Generation [51.717139132190574]
多くの現実世界のアプリケーションは、複数のソースにまたがる情報を統合して要約する能力を必要としている。
本稿では、RAGシステムに対して異なるソース間で情報を統合するための評価ベンチマークを構築するためのスケーラブルなフレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-28T14:59:55Z) - Test-time Corpus Feedback: From Retrieval to RAG [21.517949407443453]
Retrieval-Augmented Generation (RAG) は知識集約型NLPタスクの標準フレームワークとして登場した。
ほとんどのRAGパイプラインは、検索と推論を独立したコンポーネントとして扱い、ドキュメントを一度取り出し、さらに相互作用することなく回答を生成する。
情報検索(IR)とNLPのコミュニティにおける最近の研究は、フィードバックを取り入れた適応的検索とランキング手法を導入して、このギャップを埋め始めている。
論文 参考訳(メタデータ) (2025-08-21T10:57:38Z) - Reinforcing Compositional Retrieval: Retrieving Step-by-Step for Composing Informative Contexts [67.67746334493302]
大規模言語モデル(LLM)は、多くのタスクにまたがる顕著な機能を示してきたが、複雑なタスクを扱うために外部のコンテキストに依存していることが多い。
我々は、このプロセスをマルコフ決定プロセス(MDP)としてモデル化するトリエンコーダシーケンシャルレトリバーを提案する。
提案手法は,サンプル間の依存関係を明示的にモデル化することの重要性を強調し,ベースラインを一貫して大幅に上回ることを示す。
論文 参考訳(メタデータ) (2025-04-15T17:35:56Z) - MultiConIR: Towards multi-condition Information Retrieval [38.864056667809095]
MultiConIRは、複雑なマルチ条件クエリシナリオ下での検索および再ランクモデルの評価のために設計されたベンチマークである。
ほとんどのレトリバーとリランカは、クエリの複雑さが増大するにつれて、パフォーマンスが大幅に低下する。
この研究は、リランカの性能劣化の原因を解明し、クエリ内の条件位置が類似性評価にどのように影響するかを検討する。
論文 参考訳(メタデータ) (2025-03-11T05:02:03Z) - Improving Retrieval-Augmented Generation through Multi-Agent Reinforcement Learning [88.55095746156428]
Retrieval-augmented Generation (RAG) は、外部知識を大規模言語モデルに組み込むために広く利用されている。
標準的なRAGパイプラインは、クエリ書き換え、文書検索、文書フィルタリング、回答生成など、いくつかのコンポーネントで構成されている。
本稿では,複数コンポーネントからなる複雑なRAGパイプラインを多エージェント協調作業として扱うことを提案する。
論文 参考訳(メタデータ) (2025-01-25T14:24:50Z) - Ada-Retrieval: An Adaptive Multi-Round Retrieval Paradigm for Sequential
Recommendations [50.03560306423678]
本稿では,レコメンダシステムのための適応型マルチラウンド検索パラダイムであるAda-Retrievalを提案する。
Ada-Retrievalは、ユーザー表現を反復的に洗練し、全項目領域の潜在的な候補をよりよく捉えます。
論文 参考訳(メタデータ) (2024-01-12T15:26:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。