論文の概要: CLEAR: Context Augmentation from Contrastive Learning of Experience via Agentic Reflection
- arxiv url: http://arxiv.org/abs/2604.07487v1
- Date: Wed, 08 Apr 2026 18:26:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.506759
- Title: CLEAR: Context Augmentation from Contrastive Learning of Experience via Agentic Reflection
- Title(参考訳): CLEAR: エージェント・リフレクションによる経験のコントラスト学習からの文脈拡張
- Authors: Linbo Liu, Guande Wu, Han Ding, Yawei Wang, Qiang Zhou, Yuzhe Lu, Zhichao Xu, Huan Song, Panpan Xu, Lin Lee Cheong,
- Abstract要約: エージェント・リフレクション(CLEAR)を用いたコントラッシブ・ラーニング・オブ・エクスペリエンス(Contrastive Learning of Experience)を用いた生成文脈拡張フレームワークを提案する。
CLEARはまずリフレクションエージェントを使用し、過去の実行軌跡に対してコントラスト分析を行い、観察された各タスクに有用なコンテキストを要約する。
さらに,タスク実行エージェントの実行によって報酬信号が得られる強化学習を用いてCAMを最適化する。
- 参考スコア(独自算出の注目度): 17.486111179784757
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Large language model agents rely on effective model context to obtain task-relevant information for decision-making. Many existing context engineering approaches primarily rely on the context generated from the past experience and retrieval mechanisms that reuse these context. However, retrieved context from past tasks must be adapted by the execution agent to fit new situations, placing additional reasoning burden on the underlying LLM. To address this limitation, we propose a generative context augmentation framework using Contrastive Learning of Experience via Agentic Reflection (CLEAR). CLEAR first employs a reflection agent to perform contrastive analysis over past execution trajectories and summarize useful context for each observed task. These summaries are then used as supervised fine-tuning data to train a context augmentation model (CAM). Then we further optimize CAM using reinforcement learning, where the reward signal is obtained by running the task execution agent. By learning to generate task-specific knowledge rather than retrieve knowledge from the past, CAM produces context that is better tailored to the current task. We conduct comprehensive evaluations on the AppWorld and WebShop benchmarks. Experimental results show that CLEAR consistently outperforms strong baselines. It improves task completion rate from 72.62% to 81.15% on AppWorld test set and averaged reward from 0.68 to 0.74 on a subset of WebShop, compared with baseline agent. Our code is publicly available at https://github.com/awslabs/CLEAR.
- Abstract(参考訳): 大規模言語モデルエージェントは、意思決定のタスク関連情報を得るために効果的なモデルコンテキストに依存する。
既存のコンテキストエンジニアリングアプローチの多くは、これらのコンテキストを再利用する過去の経験と検索メカニズムから生成されたコンテキストに依存している。
しかし、過去のタスクから取得したコンテキストは、実行エージェントが新しい状況に適合するように適応しなければなりません。
この制限に対処するため,エージェント・リフレクション(CLEAR)を用いたコントラッシブ・ラーニング・オブ・エクスペリエンス(Contrastive Learning of Experience)を用いた生成文脈拡張フレームワークを提案する。
CLEARはまずリフレクションエージェントを使用し、過去の実行軌跡に対してコントラスト分析を行い、観察された各タスクに有用なコンテキストを要約する。
これらの要約は、コンテキスト拡張モデル(CAM)をトレーニングするために教師付き微調整データとして使用される。
そして、さらに強化学習を用いてCAMを最適化し、タスク実行エージェントを実行することで報酬信号を得る。
過去から知識を取り出すのではなく、タスク固有の知識を生成することを学ぶことで、CAMは現在のタスクに合わせたコンテキストを生成する。
われわれはAppWorldとWebShopのベンチマークで包括的な評価を行っている。
実験の結果、CLEARは強いベースラインを一貫して上回ることがわかった。
AppWorldのテストセットでは72.62%から81.15%に、WebShopのサブセットでは平均0.68から0.74に改善されている。
私たちのコードはhttps://github.com/awslabs/CLEAR.comで公開されています。
関連論文リスト
- SEARL: Joint Optimization of Policy and Tool Graph Memory for Self-Evolving Agents [35.45207852488779]
本稿では,ツールメモリをベースとした自己進化型エージェントフレームワークSEARLを紹介する。
インタラクションエクスペリエンスを直接利用するアプローチとは異なり,本手法では,計画と実行を統合する構造化されたエクスペリエンスメモリを構築している。
我々は,知識推論と数学タスクの枠組みを評価し,より実践的で効率的な学習を実現する上での有効性を実証した。
論文 参考訳(メタデータ) (2026-04-09T04:38:47Z) - Retrieval-Augmented LLM Agents: Learning to Learn from Experience [16.248836438253814]
本研究では,検索対象のLLMエージェントを学習し,検索したトラジェクトリをコンテキスト内で活用する方法について検討する。
最先端のエージェントトレーニングパイプラインよりも優れたロラを用いた,堅牢な教師付き微調整(SFT)レシピを確立した。
その結果,この組み合わせによるタスクの一般化が著しく向上することが示唆された。
論文 参考訳(メタデータ) (2026-03-18T20:45:04Z) - ReSum: Unlocking Long-Horizon Search Intelligence via Context Summarization [86.57743637722596]
LLM(Large Language Model)ベースのWebエージェントは、知識集約的なタスクに強いパフォーマンスを示す。
複数のエンティティ、絡み合った関係、不確実性の高い検索サイクルを含む複雑なクエリ。
本稿では,周期的文脈要約による不確定探索を可能にする新しいパラダイムであるReSumを紹介する。
論文 参考訳(メタデータ) (2025-09-16T17:57:22Z) - Training a Utility-based Retriever Through Shared Context Attribution for Retrieval-Augmented Language Models [51.608246558235166]
SCARLetは、RALMsでユーティリティベースのレトリバーをトレーニングするためのフレームワークである。
マルチタスクの一般化とパッセージ間相互作用という2つの重要な要素が組み込まれている。
ドメイン内とドメイン外の両方で、さまざまなタスクにまたがる10のデータセットに対するアプローチを評価します。
論文 参考訳(メタデータ) (2025-04-01T09:28:28Z) - CoPS: Empowering LLM Agents with Provable Cross-Task Experience Sharing [70.25689961697523]
クロスタスク体験の共有と選択によるシーケンシャル推論を強化する一般化可能なアルゴリズムを提案する。
我々の研究は、既存のシーケンシャルな推論パラダイムのギャップを埋め、タスク間体験の活用の有効性を検証する。
論文 参考訳(メタデータ) (2024-10-22T03:59:53Z) - P-RAG: Progressive Retrieval Augmented Generation For Planning on Embodied Everyday Task [94.08478298711789]
Embodied Everyday Taskは、インボディードAIコミュニティで人気のあるタスクである。
自然言語命令は明示的なタスクプランニングを欠くことが多い。
タスク環境に関する知識をモデルに組み込むには、広範囲なトレーニングが必要である。
論文 参考訳(メタデータ) (2024-09-17T15:29:34Z) - ReLLa: Retrieval-enhanced Large Language Models for Lifelong Sequential Behavior Comprehension in Recommendation [43.270424225285105]
ゼロショットと少数ショットのレコメンデーションタスクのために、純粋に大きな言語モデルを適応し、強化することに重点を置いています。
ゼロショット設定と少数ショット設定の両方でレコメンデーションタスクを行うRetrieval-enhanced Large Language Model (ReLLa)を提案する。
論文 参考訳(メタデータ) (2023-08-22T02:25:04Z) - On Context Distribution Shift in Task Representation Learning for
Offline Meta RL [7.8317653074640186]
我々は、文脈に基づくOMRL、特にOMRLのタスク表現学習の課題に焦点を当てる。
この問題を解決するために、堅牢なタスクコンテキストエンコーダをトレーニングするためのハードサンプリングベースの戦略を提案する。
論文 参考訳(メタデータ) (2023-04-01T16:21:55Z) - Mastering the Unsupervised Reinforcement Learning Benchmark from Pixels [112.63440666617494]
強化学習アルゴリズムは成功するが、エージェントと環境の間の大量の相互作用を必要とする。
本稿では,教師なしモデルベースRLを用いてエージェントを事前学習する手法を提案する。
我々はReal-Word RLベンチマークにおいて、適応中の環境摂動に対する抵抗性を示唆し、堅牢な性能を示す。
論文 参考訳(メタデータ) (2022-09-24T14:22:29Z) - Retrieval-Augmented Reinforcement Learning [63.32076191982944]
過去の経験のデータセットを最適な行動にマップするために、ネットワークをトレーニングします。
検索プロセスは、現在のコンテキストで有用なデータセットから情報を取得するために訓練される。
検索強化R2D2はベースラインR2D2エージェントよりもかなり高速に学習し,より高いスコアを得ることを示す。
論文 参考訳(メタデータ) (2022-02-17T02:44:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。