論文の概要: Retrieval as Reasoning: Self-Evolving Agent-Native Retrieval via LLM-Wiki
- arxiv url: http://arxiv.org/abs/2605.25480v2
- Date: Tue, 26 May 2026 10:31:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.097755
- Title: Retrieval as Reasoning: Self-Evolving Agent-Native Retrieval via LLM-Wiki
- Title(参考訳): 推論としての検索: LLM-Wikiによる自己進化型エージェントNative Retrieval
- Authors: Haoliang Ming, Feifei Li, Xiaoqing Wu, Wenhui Que,
- Abstract要約: LLMエージェントは、検索をワンショットのコンテキストフェッチのように振る舞うのではなく、推論のように振る舞う必要がある。
現在、RAG(Retrieval-Augmented Generation)システムは、類似性を埋め込んだフラットチャンクとして外部知識を整理している。
本稿では,外部知識をコンパイル可能,構成可能,自己進化的構造として扱うことにより,検索パラダイムを運用するエージェントネイティブ検索システム LLM-Wiki を提案する。
- 参考スコア(独自算出の注目度): 6.956097396264084
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: LLM agents require retrieval to behave less like one-shot context fetching and more like reasoning: searching, reading, traversing, and deciding when evidence is sufficient. Yet current Retrieval-Augmented Generation (RAG) systems organize external knowledge as flat chunks retrieved by embedding similarity, exposing a retrieval-as-lookup interface ill-suited to iterative reasoning agents. We propose LLM-Wiki, an agent-native retrieval system that operationalizes the Retrieval-as-Reasoning paradigm by treating external knowledge as a compilable, composable, and self-evolving structure rather than a static retrieval index. LLM-Wiki compiles documents into structured Wiki pages with bidirectional links, exposes search, read, and link-following operations through standard tool-calling interfaces, and introduces an Error Book for persistent structural and semantic self-correction. LLM-Wiki achieves state-of-the-art results on HotpotQA, MuSiQue, and 2WikiMultiHopQA, outperforming HippoRAG 2, LightRAG, and GraphRAG by 2.0-8.1 F1 points. On AuthTrace, LLM-Wiki achieves the best overall accuracy, with especially strong gains on multi-document structured queries, confirming that compilation-based retrieval generalizes beyond chain-style multi-hop reasoning.
- Abstract(参考訳): LLMエージェントは、検索をワンショットのコンテキストフェッチのように振る舞うのではなく、推論のように振る舞う必要がある。
しかし、現在のRetrieval-Augmented Generation (RAG) システムは、類似性を埋め込んだフラットチャンクとして外部知識を整理し、反復的推論エージェントに不適な検索・アズ・ルックアップインターフェースを公開する。
静的検索インデックスではなく,外部知識をコンパイル可能,構成可能,自己進化的構造として扱うことで,検索パラダイムを運用するエージェントネイティブ検索システム LLM-Wiki を提案する。
LLM-Wikiは、ドキュメントを双方向リンクで構造化Wikiページにコンパイルし、標準ツールコールインターフェースを通じて検索、読み取り、リンクフォロー操作を公開し、永続的な構造的および意味的自己訂正のためのエラーブックを導入する。
LLM-WikiはHotpotQA、MuSiQue、および2WikiMultiHopQAの最先端の結果を達成し、HippoRAG、LightRAG、GraphRAGを2.0-8.1 F1ポイント上回っている。
AuthTrace上では、LLM-Wikiは、特にマルチドキュメント構造化クエリにおいて、最高の全体的な精度を実現し、コンパイルベースの検索がチェーンスタイルのマルチホップ推論を超えて一般化されることを確認する。
関連論文リスト
- Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search via Direct Corpus Interaction [127.64173950476702]
エージェントが直接、汎用端末ツールを用いて、生コーパスを直接検索する直接コーパス間相互作用(DCI)について検討する。
このアプローチではオフラインインデックスを必要とせず、ローカルコーパスの進化に自然に適応する。
IRベンチマークとエンドツーエンドのエージェント検索タスク全体にわたって、この単純なセットアップは、強いスパース、密度、リランクベースラインよりも大幅に優れています。
論文 参考訳(メタデータ) (2026-05-03T19:13:11Z) - Don't Retrieve, Navigate: Distilling Enterprise Knowledge into Navigable Agent Skills for QA and RAG [7.558933130117637]
Corpus2Skillはドキュメントコーパスを階層的なスキルディレクトリにオフラインで蒸留する。
コンパイルパイプラインは、文書を反復的にクラスタリングし、各レベルでLCMで書かれた要約を生成し、ナビゲート可能なスキルファイルのツリーとして結果を実体化する。
サービス時には、エージェントは、コーパスの鳥眼ビューを受け取り、徐々に細かな要約を通してトピックブランチにドリルし、IDによって全文書を検索する。
論文 参考訳(メタデータ) (2026-04-16T03:05:37Z) - Align then Train: Efficient Retrieval Adapter Learning [16.855103318831073]
本稿では,自己教師付きアライメントと教師付きアライメントの2つの段階において,検索アダプタを訓練するラベル効率のフレームワークを提案する。
MAIRベンチマークの実験は、6つのドメインで126の検索タスクにまたがっており、ERAが低ラベル設定での検索を改善することを示している。
論文 参考訳(メタデータ) (2026-04-03T19:04:42Z) - DeepRead: Document Structure-Aware Reasoning to Enhance Agentic Search [23.447631421934847]
DeepReadは、ドキュメントネイティブな構造的事前を動作可能な推論機能に運用するために設計された、構造対応のドキュメント推論エージェントである。
DeepReadは、従来の検索手法に固有のコンテキストの断片化を効果的に軽減する、人間のような位置読み取りの推論パラダイムを提供する。
論文 参考訳(メタデータ) (2026-02-04T20:03:28Z) - BookRAG: A Hierarchical Structure-aware Index-based Approach for Retrieval-Augmented Generation on Complex Documents [11.158307125677375]
Retrieval-Augmented Generation (RAG)は、外部の複雑なドキュメントから非常に関連性の高い情報をクエリする。
本稿では,階層構造を持つ文書を対象とした新しいRAG手法であるBookRAGを紹介する。
BookRAGは最先端のパフォーマンスを実現し、検索リコールとQA精度の両方において、ベースラインを著しく上回っている。
論文 参考訳(メタデータ) (2025-12-03T03:40:49Z) - GRIL: Knowledge Graph Retrieval-Integrated Learning with Large Language Models [59.72897499248909]
本稿では,Large Language Models (LLM) を用いたエンドツーエンド学習のための新しいグラフ検索手法を提案する。
抽出したサブグラフでは, 構造的知識と意味的特徴をそれぞれ軟式トークンと言語化グラフで符号化し, LLMに注入する。
提案手法は、複雑な推論タスクに対する結合グラフ-LLM最適化の強みを検証し、最先端の性能を一貫して達成する。
論文 参考訳(メタデータ) (2025-09-20T02:38:00Z) - Beyond Isolated Dots: Benchmarking Structured Table Construction as Deep Knowledge Extraction [80.88654868264645]
Arranged and Organized extract Benchmarkは、断片化された文書を理解するための大規模言語モデルの能力を評価するために設計された。
AOEには3つの異なるドメインにまたがる11のタスクが含まれており、さまざまな入力クエリに適したコンテキスト固有のスキーマを生成するモデルが必要である。
結果は、最も先進的なモデルでさえ、かなり苦労したことを示している。
論文 参考訳(メタデータ) (2025-07-22T06:37:51Z) - Large Language Models are Good Relational Learners [55.40941576497973]
本稿では,グラフニューラルネットワーク(GNN)に基づくエンコーダを用いて,大規模言語モデル(LLM)のための構造化リレーショナルプロンプトを生成する新しいアーキテクチャであるRel-LLMを紹介する。
従来のテキストベースのシリアライズ手法とは異なり,本手法はデータベース固有の関係構造を保ちながら,LLMが複雑なエンティティ関係を処理・推論することを可能にする。
論文 参考訳(メタデータ) (2025-06-06T04:07:55Z) - Divide by Question, Conquer by Agent: SPLIT-RAG with Question-Driven Graph Partitioning [62.640169289390535]
SPLIT-RAGは、質問駆動セマンティックグラフ分割と協調サブグラフ検索による制限に対処するマルチエージェントRAGフレームワークである。
革新的なフレームワークは、まずリンク情報のセマンティック分割を作成し、次にタイプ特化知識ベースを使用してマルチエージェントRAGを実現する。
属性対応グラフセグメンテーションは、知識グラフを意味的に一貫性のあるサブグラフに分割し、サブグラフが異なるクエリタイプと整合することを保証する。
階層的なマージモジュールは、論理的検証を通じて、部分グラフ由来の解答間の矛盾を解消する。
論文 参考訳(メタデータ) (2025-05-20T06:44:34Z) - Generative Retrieval for Book search [106.67655212825025]
書籍検索のための効率的な生成検索フレームワークを提案する。
データ拡張とアウトライン指向の書籍エンコーディングの2つの主要コンポーネントがある。
プロプライエタリなBaiduデータセットの実験では、GBSが強力なベースラインを上回ることが示されている。
論文 参考訳(メタデータ) (2025-01-19T12:57:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。