論文の概要: RoutIR: Fast Serving of Retrieval Pipelines for Retrieval-Augmented Generation
- arxiv url: http://arxiv.org/abs/2601.10644v1
- Date: Thu, 15 Jan 2026 18:04:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-16 19:43:19.255497
- Title: RoutIR: Fast Serving of Retrieval Pipelines for Retrieval-Augmented Generation
- Title(参考訳): RoutIR:Retrieval-Augmented GenerationのためのRetrieval Pipelinesの高速実行
- Authors: Eugene Yang, Andrew Yates, Dawn Lawrie, James Mayfield, Trevor Adriaanse,
- Abstract要約: Retrieval-Augmented Generation(RAG)システムの主要なコンポーネントはRetrieval Modelである。
RAGシステムは、しばしば動的であり、複数ラウンドの検索を含む。
RoutIRは任意の検索メソッドをラップするPythonパッケージである。
- 参考スコア(独自算出の注目度): 24.079284500008754
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Retrieval models are key components of Retrieval-Augmented Generation (RAG) systems, which generate search queries, process the documents returned, and generate a response. RAG systems are often dynamic and may involve multiple rounds of retrieval. While many state-of-the-art retrieval methods are available through academic IR platforms, these platforms are typically designed for the Cranfield paradigm in which all queries are known up front and can be batch processed offline. This simplification accelerates research but leaves state-of-the-art retrieval models unable to support downstream applications that require online services, such as arbitrary dynamic RAG pipelines that involve looping, feedback, or even self-organizing agents. In this work, we introduce RoutIR, a Python package that provides a simple and efficient HTTP API that wraps arbitrary retrieval methods, including first stage retrieval, reranking, query expansion, and result fusion. By providing a minimal JSON configuration file specifying the retrieval models to serve, RoutIR can be used to construct and query retrieval pipelines on-the-fly using any permutation of available models (e.g., fusing the results of several first-stage retrieval methods followed by reranking). The API automatically performs asynchronous query batching and caches results by default. While many state-of-the-art retrieval methods are already supported by the package, RoutIR is also easily expandable by implementing the Engine abstract class. The package is open-sourced and publicly available on GitHub: http://github.com/hltcoe/routir.
- Abstract(参考訳): Retrieval-Augmented Generation (RAG) システムは、検索クエリを生成し、返却されたドキュメントを処理し、応答を生成する。
RAGシステムは、しばしば動的であり、複数ラウンドの検索を含む。
多くの最先端の検索手法は学術的なIRプラットフォームを通じて利用可能であるが、これらのプラットフォームは通常、すべてのクエリが事前に知られ、オフラインでバッチ処理できるクランフィールドパラダイムのために設計されている。
この単純化は研究を加速させるが、ループやフィードバック、さらには自己組織化エージェントを含む任意の動的RAGパイプラインなど、オンラインサービスを必要とするダウンストリームアプリケーションをサポートできない最先端の検索モデルを残している。
本稿では,第1段階検索,再ランク付け,クエリ拡張,結果融合を含む任意の検索方法をラップした,シンプルで効率的なHTTP APIを提供するPythonパッケージであるRoutIRを紹介する。
検索モデルを指定した最小限のJSON設定ファイルを提供することで、RoutIRは利用可能なモデルの置換を使用して、検索パイプラインをオンザフライで構築およびクエリするために使用することができる。
APIは非同期クエリのバッチ処理を自動的に実行し、結果をデフォルトでキャッシュする。
多くの最先端の検索メソッドが既にパッケージでサポートされているが、RoutIRはエンジン抽象クラスを実装することで容易に拡張できる。
パッケージはオープンソースで、GitHubで公開されている。
関連論文リスト
- Chain of Retrieval: Multi-Aspect Iterative Search Expansion and Post-Order Search Aggregation for Full Paper Retrieval [68.71038700559195]
The Chain of Retrieval (COR) is a novel repeaterative framework for full-paper search。
SCIBENCH(SCIBENCH)は、クエリと候補のための全論文の完全なコンテキストとセグメント化されたコンテキストを提供するベンチマークである。
論文 参考訳(メタデータ) (2025-07-14T08:41:53Z) - TreeHop: Generate and Filter Next Query Embeddings Efficiently for Multi-hop Question Answering [27.37434534716611]
TreeHopはマルチホップ質問応答のための埋め込みレベルのフレームワークである。
TreeHopはクエリの埋め込みを動的に更新する。
TreeHopは、知識集約型アプリケーションにデプロイするための、より速く、よりコスト効率の良いソリューションです。
論文 参考訳(メタデータ) (2025-04-28T01:56:31Z) - Large Language Model Can Be a Foundation for Hidden Rationale-Based Retrieval [12.83513794686623]
本稿では,隠れ合理性検索という,より困難なタイプの検索タスクを提案し,検討する。
このような問題に対処するためには、命令調整付き大規模言語モデル(LLM)とクロスエンコーダアーキテクチャが妥当な選択である可能性がある。
我々は、RaHoReによってこの検索フレームワークを命名し、感情支援会話(ESC)におけるゼロショットおよび微調整性能上の優位性を検証した。
論文 参考訳(メタデータ) (2024-12-21T13:19:15Z) - Less is More: Making Smaller Language Models Competent Subgraph Retrievers for Multi-hop KGQA [51.3033125256716]
本研究では,小言語モデルで処理される条件生成タスクとして,サブグラフ検索タスクをモデル化する。
2億2千万のパラメータからなる基本生成部分グラフ検索モデルでは,最先端モデルと比較して競合検索性能が向上した。
LLMリーダを接続した最大の3Bモデルは、WebQSPとCWQベンチマークの両方で、SOTAのエンドツーエンドパフォーマンスを新たに設定します。
論文 参考訳(メタデータ) (2024-10-08T15:22:36Z) - REAPER: Reasoning based Retrieval Planning for Complex RAG Systems [3.160580413086215]
複雑なクエリは複数ステップの検索も必要です。
ほとんどのRAGエージェントは、推論と検索のステップをインターリーブすることで、このようなChain-of-Thoughtタスクを処理する。
エージェントベースのシステムよりもレイテンシが大幅に向上し、新規で目に見えないユースケースに容易にスケールできるようになりました。
論文 参考訳(メタデータ) (2024-07-26T07:05:54Z) - Database-Augmented Query Representation for Information Retrieval [71.41745087624528]
データベース拡張クエリ表現(DAQu)と呼ばれる新しい検索フレームワークを提案する。
DAQuは、元のクエリを複数のテーブルにまたがるさまざまな(クエリ関連の)メタデータで拡張する。
我々はDAQuを多様な検索シナリオで検証し、全体の検索性能を大幅に向上させることを示した。
論文 参考訳(メタデータ) (2024-06-23T05:02:21Z) - SPRINT: A Unified Toolkit for Evaluating and Demystifying Zero-shot
Neural Sparse Retrieval [92.27387459751309]
ニューラルスパース検索を評価するための統一PythonツールキットであるSPRINTを提供する。
我々は、よく認識されているベンチマークBEIRにおいて、強く再現可能なゼロショットスパース検索ベースラインを確立する。
SPLADEv2は、元のクエリとドキュメントの外で、ほとんどのトークンでスパース表現を生成する。
論文 参考訳(メタデータ) (2023-07-19T22:48:02Z) - Query Rewriting for Retrieval-Augmented Large Language Models [139.242907155883]
大規模言語モデル(LLM)は、検索対象のパイプラインで強力なブラックボックスリーダーを動作させる。
この作業では、検索拡張LDMに対する以前の検索テーマ読み込みの代わりに、新しいフレームワークであるRewrite-Retrieve-Readを導入する。
論文 参考訳(メタデータ) (2023-05-23T17:27:50Z) - Autoregressive Search Engines: Generating Substrings as Document
Identifiers [53.0729058170278]
自動回帰言語モデルは、回答を生成するデファクト標準として現れています。
これまでの研究は、探索空間を階層構造に分割する方法を探究してきた。
本研究では,検索空間の任意の構造を強制しない代替として,経路内のすべてのngramを識別子として使用することを提案する。
論文 参考訳(メタデータ) (2022-04-22T10:45:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。