論文の概要: Efficient RAG with Intent-Aware Retrieval and Semantics-Preserving Chunking
- arxiv url: http://arxiv.org/abs/2606.01240v1
- Date: Sun, 31 May 2026 13:42:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:29.466083
- Title: Efficient RAG with Intent-Aware Retrieval and Semantics-Preserving Chunking
- Title(参考訳): インテント認識検索とセマンティックス保存を併用した効率的なRAG
- Authors: Fachrina Dewi Puspitasari, Chaoning Zhang, Jiaquan Zhang, Zhicheng Wang, Hafiz Shakeel Ahmad Awan, Rizwan Qureshi, Jewon Lee, Tae-Ho Kim, Yang Yang,
- Abstract要約: InSemRAGは、検索拡張世代(RAG)システムのためのフレームワークである。
IARは、クエリインテントに基づいて、検索チャネルを適応的に重み付けする動的ハイブリッド検索手法を実装している。
SPCは、意味的整合性を維持するために破損した証拠チャンクの検出と修復を行う。
提案手法は,HotPotQAではF1が2.65ポイント,FEVERでは1.5ポイントの精度向上を実現した。
- 参考スコア(独自算出の注目度): 18.698122955613584
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The demand for powerful instruction following and reasoning capability of large language models (LLMs) has promoted rapid development of retrieval-augmented generation (RAG). The RAG system assists LLM generation by retrieving chunks of query-fit supplementary knowledge from an external database. Conventional RAG systems, however, suffer from information insufficiency due to two factors, which are intent-agnostic retrieval and information fragmentation. Our work proposes a RAG framework, termed InSemRAG, that addresses these challenges via an iterative retrieve-and-check mechanism with two supporting modules, an intention-aware retriever (IAR) and semantics-preserving chunking (SPC). IAR implements a dynamic hybrid retrieval method that adaptively weights the retrieval channels based on the query intent, while SPC performs detection and reparation to the damaged evidence chunks to preserve the semantic integrity. To alleviate the computational latency brought by our iterative mechanism, we leverage small language models (SLMs). Extensive experiments across several benchmark datasets consistently demonstrate the competitiveness of our method against recent state-of-the-art RAG mechanisms. Particularly, our method achieves significant gains on multi-hop and evidence-sensitive tasks, with a 2.65-point improvement in F1 on HotPotQA and a 1.5-point increase in accuracy on FEVER. Our method also achieves competitive performance to Multi-Hop RAG with 4.32$\times$ lower latency with the utilization of SLM.
- Abstract(参考訳): 大規模言語モデル(LLM)の強力な命令追従と推論能力の要求は,検索強化世代(RAG)の急速な発展を促している。
RAGシステムは、外部データベースからクエリに適した補助知識の塊を取得することにより、LCM生成を支援する。
しかし、従来のRAGシステムは、意図に依存しない検索と情報の断片化という2つの要因により、情報不足に悩まされている。
InSemRAGと呼ばれるRAGフレームワークは,2つのモジュール(IAR)とセマンティックス保存チャンキング(SPC)を備えた反復的検索・チェック機構を通じて,これらの課題に対処する。
IARは、クエリインテントに基づいて検索チャネルを適応的に重み付けする動的ハイブリッド検索手法を実装し、SPCは損傷したエビデンスチャンクの検出と修復を行い、セマンティックな整合性を維持する。
反復的なメカニズムによってもたらされる計算遅延を軽減するために,我々は小型言語モデル(SLM)を活用している。
いくつかのベンチマークデータセットにわたる大規模な実験は、最近の最先端のRAGメカニズムに対する我々の手法の競争力を一貫して実証している。
特に,HotPotQAではF1の2.65ポイント,FEVERでは1.5ポイントの精度向上が達成された。
また,SLMを用いたMulti-Hop RAGに対して4.32$\times$低レイテンシで競合性能を実現する。
関連論文リスト
- Search-R2: Enhancing Search-Integrated Reasoning via Actor-Refiner Collaboration [49.9937230730202]
本稿では,新たなアクター・リファイナ・コラボレーション・フレームワークであるSearch-R2を提案する。
提案手法は,生成過程をアクターに分解し,最初の推論軌道を生成する。
本稿では,検索-R2がモデルスケール全体にわたって強力なRAGとRLベースのベースラインを一貫して上回ることを示す。
論文 参考訳(メタデータ) (2026-02-03T15:32:09Z) - MARAG-R1: Beyond Single Retriever via Reinforcement-Learned Multi-Tool Agentic Retrieval [50.30107119622642]
大規模言語モデル(LLM)は推論と生成において優れているが、本質的には静的事前学習データによって制限されている。
Retrieval-Augmented Generation (RAG)は、LLMを外部知識に基盤を置くことでこの問題に対処する。
MarAG-R1は、LLMが複数の検索機構を動的に調整できる強化学習型マルチツールRAGフレームワークである。
論文 参考訳(メタデータ) (2025-10-31T15:51:39Z) - REFRAG: Rethinking RAG based Decoding [67.4862300145604]
REFRAGは効率的なデコードフレームワークで、RAGアプリケーションの遅延を圧縮し、感知し、拡張し、改善する。
本稿では,RAG,マルチターン会話,長期文書要約など,多種多様な長文タスクを対象としたREFRAGの厳密な検証を行う。
論文 参考訳(メタデータ) (2025-09-01T03:31:44Z) - Process vs. Outcome Reward: Which is Better for Agentic RAG Reinforcement Learning [45.10424242207931]
Retrieval-augmented Generation (RAG)は大規模言語モデル(LLM)のテキスト生成能力を向上する
RAG-ProGuideは,クエリ生成,エビデンス抽出,回答生成のためのプロセスレベルの報酬を提供する高品質なデータセットである。
プロセスレベルのポリシー最適化により、提案フレームワークはLLMに対して、検索を自律的に実行し、クエリを生成し、関連する証拠を抽出し、最終的な回答を生成する権限を与える。
論文 参考訳(メタデータ) (2025-05-20T08:21:00Z) - Accelerating Adaptive Retrieval Augmented Generation via Instruction-Driven Representation Reduction of Retrieval Overlaps [16.84310001807895]
本稿では,A-RAG法に適用可能なモデルに依存しないアプローチを提案する。
具体的には、キャッシュアクセスと並列生成を使用して、それぞれプリフィルとデコードステージを高速化する。
論文 参考訳(メタデータ) (2025-05-19T05:39:38Z) - Chain-of-Retrieval Augmented Generation [91.02950964802454]
本稿では,o1-like RAGモデルを学習し,最終回答を生成する前に段階的に関連情報を抽出・推論する手法を提案する。
提案手法であるCoRAGは,進化状態に基づいて動的にクエリを再構成する。
論文 参考訳(メタデータ) (2025-01-24T09:12:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。