論文の概要: ExpWeaver: LLM Agents Learn from Experience via Latent RAG
- arxiv url: http://arxiv.org/abs/2606.01041v1
- Date: Sun, 31 May 2026 06:11:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:29.160592
- Title: ExpWeaver: LLM Agents Learn from Experience via Latent RAG
- Title(参考訳): ExpWeaver: LLMエージェントは潜在RAGを通じて経験から学ぶ
- Authors: Tao Feng, Tianyang Luo, Jingjun Xu, Zhigang Hua, Yan Xie, Shuang Yang, Ge Liu, Jiaxuan You,
- Abstract要約: 我々は,LLMエージェントが潜時検索拡張生成を通じて経験から学習できるフレームワークであるExpWeaverを提案する。
ExpWeaverはLLM自身の隠された状態を使用してエクスペリエンスをエンコードし、各デコードステップで遅延空間で関連するエクスペリエンスを直接取得する。
ExpWeaverは、質問応答、推論、コーディング、科学的予測、レコメンデーションを含む13のタスクで評価する。
- 参考スコア(独自算出の注目度): 31.285842755478896
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Experience learning has achieved promising results in enhancing LLM agent planning and reasoning by integrating past interactions as reusable knowledge. However, existing methods remain confined to explicit text space, retrieving experiences via semantic similarity and concatenating them into the context window, leading to substantial token overhead and a decoupled architecture that separates retrieval from generation. To address these limitations, we propose ExpWeaver, a framework that enables LLM agents to learn from experience via latent retrieval-augmented generation, without requiring a separate RAG module. ExpWeaver encodes experiences using the LLM's own hidden states, retrieves relevant experiences directly in latent space at each decoding step, and integrates them through cross-attention aggregation and gated residual mechanisms. The entire pipeline is optimized end-to-end with reinforcement learning, supporting both generative and ranking tasks. We evaluate ExpWeaver on 13 diverse tasks spanning question answering, reasoning, coding, scientific prediction, and recommendation. Results demonstrate that ExpWeaver achieves state-of-the-art performance on 12 out of 13 tasks, outperforming the strongest baseline by over 6.8%; maintains token efficiency comparable to non-retrieval baselines while text-based retrieval methods require 1.5 to 2 times more tokens; and exhibits superior cross-domain generalization, outperforming the strongest baseline by 16.32% under zero-shot transfer and 15.21% under few-shot transfer. Our code for ExpWeaver is released at https://github.com/ulab-uiuc/ExpWeaver.
- Abstract(参考訳): 経験学習は、過去のインタラクションを再利用可能な知識として統合することで、LLMエージェントの計画と推論を強化するという有望な成果を達成した。
しかし、既存のメソッドは明示的なテキスト空間に限られており、セマンティックな類似性を通じて経験を検索し、それらをコンテキストウィンドウにまとめる。
これらの制約に対処するため,我々は,LLMエージェントがRAGモジュールを別途必要とせずに,潜時検索拡張生成を通じて経験から学習できるフレームワークであるExpWeaverを提案する。
ExpWeaverはLLM自身の隠された状態を使用して経験をエンコードし、各デコードステップで遅延空間で関連する経験を直接取得し、相互アテンションアグリゲーションを通じてそれらを統合し、残留メカニズムをゲートする。
パイプライン全体がエンドツーエンドに最適化され、強化学習され、生成タスクとランキングタスクの両方をサポートする。
ExpWeaverは、質問応答、推論、コーディング、科学的予測、レコメンデーションを含む13のタスクで評価する。
その結果、ExpWeaverは13タスク中12タスクで最先端のパフォーマンスを達成し、最強のベースラインを6.8%以上上回り、非検索ベースラインに匹敵するトークン効率を維持し、テキストベースの検索手法では1.5倍から2倍のトークンを必要とし、最強のベースラインを16.32%上回り、少ショット転送では15.21%上回った。
ExpWeaverのコードはhttps://github.com/ulab-uiuc/ExpWeaver.comで公開されています。
関連論文リスト
- APEX-EM: Non-Parametric Online Learning for Autonomous Agents via Structured Procedural-Episodic Experience Replay [7.370176470430802]
LLMベースの自律エージェントは、永続的な手続き記憶を欠いている。
我々は,構造化手続き計画の蓄積,検索,再利用を行う非パラメトリックオンライン学習フレームワークであるAPEX-EMを提案する。
論文 参考訳(メタデータ) (2026-03-31T00:24:56Z) - RetroAgent: From Solving to Evolving via Retrospective Dual Intrinsic Feedback [54.39884046754265]
RetroAgentは、エージェントが複雑なインタラクティブ環境をマスターできるオンラインRLフレームワークである。
実験の結果,RetroAgentはSOTA(State-of-the-art)の性能を達成できた。
論文 参考訳(メタデータ) (2026-03-09T16:23:33Z) - LaSER: Internalizing Explicit Reasoning into Latent Space for Dense Retrieval [74.72139580745511]
LaSERは、レトリバーの潜在空間に明示的な推論を内部化する、新しい自己蒸留フレームワークである。
提案手法は, 明示的なCoTパイプラインの推論深度と, 標準的な高密度検索器の推論効率をうまく組み合わせる。
論文 参考訳(メタデータ) (2026-03-02T04:11:18Z) - Eigen-1: Adaptive Multi-Agent Refinement with Monitor-Based RAG for Scientific Reasoning [53.45095336430027]
暗黙的な検索と構造化された協調を組み合わせた統合フレームワークを開発する。
Humanity's Last Exam (HLE) Bio/Chem Goldでは,48.3%の精度を実現している。
SuperGPQAとTRQAの結果はドメイン間の堅牢性を確認した。
論文 参考訳(メタデータ) (2025-09-25T14:05:55Z) - Toward Structured Knowledge Reasoning: Contrastive Retrieval-Augmented Generation on Experience [8.270615745804557]
大規模言語モデル(LLM)は、平易なテキストタスクでは高いパフォーマンスを達成するが、テーブルやデータベースのような構造化データでは性能が低い。
本稿では,体験記憶表現を構築するフレームワークであるContrastive Retrieval-Augmented Generation on Experience (CoRE)を紹介する。
実験の結果、CoREはパフォーマンスを著しく改善し、平均利得は3.44%と4.24%となり、挑戦的なタスクは最大17.2%向上した。
論文 参考訳(メタデータ) (2025-06-01T05:22:00Z) - KnowTrace: Bootstrapping Iterative Retrieval-Augmented Generation with Structured Knowledge Tracing [64.38243807002878]
我々は、大規模言語モデルにおけるコンテキスト過負荷を軽減するためのエレガントなRAGフレームワークであるKnowTraceを紹介する。
KnowTraceは、必要な知識三つ子を自律的に追跡して、入力された質問に関連する特定の知識グラフを整理する。
3つのマルチホップ質問応答ベンチマークで、既存のメソッドを一貫して上回っている。
論文 参考訳(メタデータ) (2025-05-26T17:22:20Z) - Iterative Self-Incentivization Empowers Large Language Models as Agentic Searchers [74.17516978246152]
大規模言語モデル(LLM)は、従来の手法を進化させるために情報検索に広く統合されている。
エージェント検索フレームワークであるEXSEARCHを提案する。
4つの知識集約ベンチマークの実験では、EXSEARCHはベースラインを大幅に上回っている。
論文 参考訳(メタデータ) (2025-05-26T15:27:55Z) - ExpandR: Teaching Dense Retrievers Beyond Queries with LLM Guidance [21.777817032607405]
大規模言語モデル(LLM)は、クエリ拡張による高密度検索の強化に有意な可能性を証明している。
本研究では,LLM拡張高密度検索フレームワークExpandRを提案する。
複数のベンチマーク実験の結果、ExpandRは強いベースラインを一貫して上回ることがわかった。
論文 参考訳(メタデータ) (2025-02-24T11:15:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。