論文の概要: Keyword search is all you need: Achieving RAG-Level Performance without vector databases using agentic tool use
- arxiv url: http://arxiv.org/abs/2602.23368v1
- Date: Fri, 19 Dec 2025 20:15:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-09 01:20:07.92631
- Title: Keyword search is all you need: Achieving RAG-Level Performance without vector databases using agentic tool use
- Title(参考訳): キーワード検索は必要なすべてである:エージェントツールの使用を使用してベクトルデータベースなしでRAGレベルパフォーマンスを達成する
- Authors: Shreyas Subramanian, Adewale Akinfaderin, Yanyan Zhang, Ishan Singh, Mani Khanuja, Sandeep Singh, Maira Ladeira Tanke,
- Abstract要約: Retrieval-Augmented Generation (RAG) は、既存の知識ベースに基づいて、正確なコンテキストベースの応答を生成するのに有効であることが証明されている。
近年のエージェントRAGとツール拡張LDMアーキテクチャは,情報検索と処理に新たなアプローチを導入している。
- 参考スコア(独自算出の注目度): 9.40327907592148
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While Retrieval-Augmented Generation (RAG) has proven effective for generating accurate, context-based responses based on existing knowledge bases, it presents several challenges including retrieval quality dependencies, integration complexity and cost. Recent advances in agentic-RAG and tool-augmented LLM architectures have introduced alternative approaches to information retrieval and processing. We question how much additional value vector databases and semantic search bring to RAG over simple, agentic keyword search in documents for question-answering. In this study, we conducted a systematic comparison between RAG-based systems and tool-augmented LLM agents, specifically evaluating their retrieval mechanisms and response quality when the agent only has access to basic keyword search tools. Our empirical analysis demonstrates that tool-based keyword search implementations within an agentic framework can attain over $90\%$ of the performance metrics compared to traditional RAG systems without using a standing vector database. Our approach is simple to implement, cost effective, and is particularly useful in scenarios requiring frequent updates to knowledge bases.
- Abstract(参考訳): Retrieval-Augmented Generation (RAG) は、既存の知識ベースに基づく正確なコンテキストベースの応答を生成するのに有効であることが証明されているが、検索品質の依存性、統合の複雑さ、コストなど、いくつかの課題が提示されている。
近年のエージェントRAGとツール拡張LDMアーキテクチャは,情報検索と処理に新たなアプローチを導入している。
我々は,問合せのための文書内の単純でエージェント的なキーワード検索よりも,ベクトルデータベースや意味検索がRAGにどの程度の付加価値をもたらすのかを問う。
本研究では,RAG ベースシステムとツール拡張 LLM エージェントの体系的比較を行い,基本キーワード検索ツールにのみアクセス可能なエージェントの検索機構と応答品質を具体的に評価した。
我々の実証分析は,エージェントフレームワーク内のツールベースのキーワード検索実装が,従来のRAGシステムと比較して,定常ベクトルデータベースを使わずに90 %以上のパフォーマンス指標を達成できることを実証している。
当社のアプローチは実装が簡単で費用対効果があり、特に知識ベースへの頻繁な更新を必要とするシナリオで有用です。
関連論文リスト
- TURA: Tool-Augmented Unified Retrieval Agent for AI Search [18.427511565701394]
従来のRAGアプローチは、リアルタイムのニーズと構造化クエリに苦労する。
本稿では,静的コンテンツと動的リアルタイム情報の両方にアクセスするために,RAGとエージェントツールを併用した新しい3段階フレームワークTURAを紹介する。
論文 参考訳(メタデータ) (2025-08-06T16:24:17Z) - Tree-Based Text Retrieval via Hierarchical Clustering in RAGFrameworks: Application on Taiwanese Regulations [0.0]
階層的なクラスタリングに基づく検索手法を提案する。
本手法は,意味的関連コンテンツを適応的に選択しながら,システム応答の精度と関連性を維持する。
我々のフレームワークは実装が簡単で、既存のRAGパイプラインと簡単に統合できます。
論文 参考訳(メタデータ) (2025-06-16T15:34:29Z) - QuIM-RAG: Advancing Retrieval-Augmented Generation with Inverted Question Matching for Enhanced QA Performance [1.433758865948252]
本研究では,RAG(Retrieval-Augmented Generation)システム構築のための新しいアーキテクチャを提案する。
RAGアーキテクチャは、ターゲット文書から応答を生成するために構築される。
本稿では,本システムにおける検索機構の新しいアプローチQuIM-RAGを紹介する。
論文 参考訳(メタデータ) (2025-01-06T01:07:59Z) - SRSA: A Cost-Efficient Strategy-Router Search Agent for Real-world Human-Machine Interactions [3.5725872564627785]
現実の状況では、ユーザーはしばしばコンテキストと高度にパーソナライズされたクエリをチャットボットに入力する。
これまでの研究は、人間と機械の対話のシナリオに特に焦点を絞ってはいなかった。
これらのギャップに対処するために、戦略ベース検索エージェント(SRSA)を提案する。
SRSAは、異なるクエリを適切な検索戦略にルーティングし、よりきめ細かいシリアル検索により、比較的低コストで高品質な結果を得ることができる。
論文 参考訳(メタデータ) (2024-11-21T20:41:55Z) - MemoRAG: Boosting Long Context Processing with Global Memory-Enhanced Retrieval Augmentation [60.04380907045708]
Retrieval-Augmented Generation (RAG)は、この問題に対処するための有望な戦略と考えられている。
我々は,グローバルメモリ拡張検索による新しいRAGフレームワークであるMemoRAGを提案する。
MemoRAGは、様々な長期コンテキスト評価タスクにおいて優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-09-09T13:20:31Z) - FlashRAG: A Modular Toolkit for Efficient Retrieval-Augmented Generation Research [70.6584488911715]
検索増強世代(RAG)は、かなりの研究関心を集めている。
既存のRAGツールキットは、しばしば重くて柔軟であり、研究者のカスタマイズのニーズを満たすことができない。
我々のツールキットは16の高度なRAGメソッドを実装し、38のベンチマークデータセットを収集し、整理した。
論文 参考訳(メタデータ) (2024-05-22T12:12:40Z) - STaRK: Benchmarking LLM Retrieval on Textual and Relational Knowledge Bases [93.96463520716759]
テキストと知識ベースを用いた大規模半構造検索ベンチマークSTARKを開発した。
本ベンチマークでは, 製品検索, 学術論文検索, 精密医療におけるクエリの3分野について検討した。
多様なリレーショナル情報と複雑なテキスト特性を統合した,現実的なユーザクエリを合成する,新しいパイプラインを設計する。
論文 参考訳(メタデータ) (2024-04-19T22:54:54Z) - Synergistic Interplay between Search and Large Language Models for
Information Retrieval [141.18083677333848]
InteRにより、RMはLLM生成した知識コレクションを使用してクエリの知識を拡張することができる。
InteRは、最先端手法と比較して総合的に優れたゼロショット検索性能を実現する。
論文 参考訳(メタデータ) (2023-05-12T11:58:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。