論文の概要: TeaRAG: A Token-Efficient Agentic Retrieval-Augmented Generation Framework
- arxiv url: http://arxiv.org/abs/2511.05385v1
- Date: Fri, 07 Nov 2025 16:08:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-10 21:00:44.831007
- Title: TeaRAG: A Token-Efficient Agentic Retrieval-Augmented Generation Framework
- Title(参考訳): TeaRAG:Token-Effic Agentic Retrieval-Augmented Generation Framework
- Authors: Chao Zhang, Yuhao Wang, Derong Xu, Haoxin Zhang, Yuanjie Lyu, Yuhao Chen, Shuochen Liu, Tong Xu, Xiangyu Zhao, Yan Gao, Yao Hu, Enhong Chen,
- Abstract要約: TeaRAGは、検索内容と推論ステップの両方を圧縮できるトークン効率のエージェントRAGフレームワークである。
報奨関数は,過剰な推論ステップをペナルティ化しながら,知識マッチング機構によって知識満足度を評価する。
- 参考スコア(独自算出の注目度): 62.66056331998838
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Retrieval-Augmented Generation (RAG) utilizes external knowledge to augment Large Language Models' (LLMs) reliability. For flexibility, agentic RAG employs autonomous, multi-round retrieval and reasoning to resolve queries. Although recent agentic RAG has improved via reinforcement learning, they often incur substantial token overhead from search and reasoning processes. This trade-off prioritizes accuracy over efficiency. To address this issue, this work proposes TeaRAG, a token-efficient agentic RAG framework capable of compressing both retrieval content and reasoning steps. 1) First, the retrieved content is compressed by augmenting chunk-based semantic retrieval with a graph retrieval using concise triplets. A knowledge association graph is then built from semantic similarity and co-occurrence. Finally, Personalized PageRank is leveraged to highlight key knowledge within this graph, reducing the number of tokens per retrieval. 2) Besides, to reduce reasoning steps, Iterative Process-aware Direct Preference Optimization (IP-DPO) is proposed. Specifically, our reward function evaluates the knowledge sufficiency by a knowledge matching mechanism, while penalizing excessive reasoning steps. This design can produce high-quality preference-pair datasets, supporting iterative DPO to improve reasoning conciseness. Across six datasets, TeaRAG improves the average Exact Match by 4% and 2% while reducing output tokens by 61% and 59% on Llama3-8B-Instruct and Qwen2.5-14B-Instruct, respectively. Code is available at https://github.com/Applied-Machine-Learning-Lab/TeaRAG.
- Abstract(参考訳): Retrieval-Augmented Generation (RAG) は、言語モデル(LLM)の信頼性を高めるために外部知識を利用する。
柔軟性のために、エージェントRAGは、クエリを解決するために、自律的な多ラウンド検索と推論を採用する。
最近のエージェントRAGは強化学習によって改善されているが、しばしば探索や推論プロセスからかなりのトークンオーバーヘッドを生じる。
このトレードオフは効率よりも正確さを優先します。
本研究は,検索内容と推論ステップの両方を圧縮可能なトークン効率のエージェントRAGフレームワークであるTeaRAGを提案する。
1)まず,チャンクに基づくセマンティック検索を,簡潔な三重項を用いたグラフ検索で強化することにより,検索内容の圧縮を行う。
知識関連グラフは、意味的類似性と共起性から構築される。
最後に、パーソナライズされたPageRankは、このグラフ内の重要な知識を強調するために利用され、検索毎のトークンの数を減らす。
2) 推論ステップを削減するため, 反復プロセス対応直接参照最適化(IP-DPO)を提案する。
具体的には,過度な推論ステップをペナルティ化しながら,知識マッチング機構によって知識満足度を評価する。
この設計は高品質な嗜好ペアデータセットを生成し、反復的なDPOをサポートし、推論の簡潔さを改善する。
6つのデータセットで、TeaRAGは平均Exact Matchを4%、2%改善し、出力トークンをLlama3-8B-Instructで61%、Qwen2.5-14B-Instructで59%削減した。
コードはhttps://github.com/Applied-Machine-Learning-Lab/TeaRAGで入手できる。
関連論文リスト
- PROPEX-RAG: Enhanced GraphRAG using Prompt-Driven Prompt Execution [4.1390735746263685]
本稿では, 実体抽出, 事実選択, 通過再開を促進する上で, 素早い定式化の意義を浮き彫りにした, プロンプト駆動型グラフRAGフレームワークを提案する。
我々のシステムはHotpotQAと2WikiMultiHopQAで最先端のパフォーマンスを獲得し、F1スコアは80.7%、78.9%、Recall@5スコアは97.1%、98.1%である。
論文 参考訳(メタデータ) (2025-11-03T18:00:56Z) - GRIL: Knowledge Graph Retrieval-Integrated Learning with Large Language Models [59.72897499248909]
本稿では,Large Language Models (LLM) を用いたエンドツーエンド学習のための新しいグラフ検索手法を提案する。
抽出したサブグラフでは, 構造的知識と意味的特徴をそれぞれ軟式トークンと言語化グラフで符号化し, LLMに注入する。
提案手法は、複雑な推論タスクに対する結合グラフ-LLM最適化の強みを検証し、最先端の性能を一貫して達成する。
論文 参考訳(メタデータ) (2025-09-20T02:38:00Z) - Clue-RAG: Towards Accurate and Cost-Efficient Graph-based RAG via Multi-Partite Graph and Query-Driven Iterative Retrieval [15.599544326509436]
Retrieval-Augmented Generation (RAG) は、しばしばグラフ構造化データから外部情報を統合することで制限に対処する。
本稿では,マルチパーティグラフインデックスとクエリ駆動反復検索戦略を導入した新しいアプローチであるClue-RAGを提案する。
3つのQAベンチマークの実験により、Clue-RAGは最先端のベースラインを著しく上回っている。
論文 参考訳(メタデータ) (2025-07-11T09:36:45Z) - Reinforcing Video Reasoning with Focused Thinking [65.85683941058916]
本稿では,集中的思考と深い報酬の粒度で視覚的推論を強化する新しいフレームワークであるTW-GRPOを提案する。
具体的には,高情報密度のトークンを優先するトークン重み付け機構を用いる。
また,シングルチョイスからマルチチョイスQAタスクにシフトすることで,RLトレーニングを再構築する。
論文 参考訳(メタデータ) (2025-05-30T15:42:19Z) - Align-GRAG: Reasoning-Guided Dual Alignment for Graph Retrieval-Augmented Generation [79.75818239774952]
大きな言語モデル(LLM)は目覚ましい能力を示しているが、幻覚や時代遅れの情報といった問題に苦戦している。
Retrieval-augmented Generation (RAG) は、情報検索システム(IR)を用いて、外部知識のLLM出力を基底にすることで、これらの問題に対処する。
本稿では、検索後句における新しい推論誘導二重アライメントフレームワークであるAlign-GRAGを提案する。
論文 参考訳(メタデータ) (2025-05-22T05:15:27Z) - Divide by Question, Conquer by Agent: SPLIT-RAG with Question-Driven Graph Partitioning [62.640169289390535]
SPLIT-RAGは、質問駆動セマンティックグラフ分割と協調サブグラフ検索による制限に対処するマルチエージェントRAGフレームワークである。
革新的なフレームワークは、まずリンク情報のセマンティック分割を作成し、次にタイプ特化知識ベースを使用してマルチエージェントRAGを実現する。
属性対応グラフセグメンテーションは、知識グラフを意味的に一貫性のあるサブグラフに分割し、サブグラフが異なるクエリタイプと整合することを保証する。
階層的なマージモジュールは、論理的検証を通じて、部分グラフ由来の解答間の矛盾を解消する。
論文 参考訳(メタデータ) (2025-05-20T06:44:34Z) - ROGRAG: A Robustly Optimized GraphRAG Framework [45.947928801693266]
グラフベースの検索強化生成(GraphRAG)は、動的検索のためのグラフとしてドメイン知識を構造化することによってこの問題に対処する。
既存のパイプラインには複雑なエンジニアリングが含まれており、個々のコンポーネントの影響を分離することは困難である。
本稿では,ロバストに最適化されたGraphRAGフレームワークであるROGRAGを紹介する。
論文 参考訳(メタデータ) (2025-03-09T06:20:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。