Fugu-MT 論文翻訳(概要): Agent KB: Leveraging Cross-Domain Experience for Agentic Problem Solving

論文の概要: Agent KB: Leveraging Cross-Domain Experience for Agentic Problem Solving

arxiv url: http://arxiv.org/abs/2507.06229v2
Date: Thu, 10 Jul 2025 05:50:36 GMT
ステータス: 翻訳完了
システム内更新日: 2025-07-11 12:24:00.084961
Title: Agent KB: Leveraging Cross-Domain Experience for Agentic Problem Solving
Title（参考訳）: Agent KB:エージェント問題解決のためのクロスドメインエクスペリエンスを活用する
Authors: Xiangru Tang, Tianrui Qin, Tianhao Peng, Ziyang Zhou, Daniel Shao, Tingting Du, Xinming Wei, Peng Xia, Fang Wu, He Zhu, Ge Zhang, Jiaheng Liu, Xingyao Wang, Sirui Hong, Chenglin Wu, Hao Cheng, Chi Wang, Wangchunshu Zhou,
Abstract要約: Agent KBは、複雑なエージェント問題の解決を可能にする階層的な経験フレームワークである。ハイレベル戦略と詳細な実行ログの両方をキャプチャすることで、Agent KBは、エージェント間の知識伝達を可能にする共有知識ベースを生成する。
参考スコア（独自算出の注目度）: 40.51373344437501
License: http://creativecommons.org/licenses/by/4.0/
Abstract: As language agents tackle increasingly complex tasks, they struggle with effective error correction and experience reuse across domains. We introduce Agent KB, a hierarchical experience framework that enables complex agentic problem solving via a novel Reason-Retrieve-Refine pipeline. Agent KB addresses a core limitation: agents traditionally cannot learn from each other's experiences. By capturing both high-level strategies and detailed execution logs, Agent KB creates a shared knowledge base that enables cross-agent knowledge transfer. Evaluated on the GAIA benchmark, Agent KB improves success rates by up to 16.28 percentage points. On the most challenging tasks, Claude-3 improves from 38.46% to 57.69%, while GPT-4 improves from 53.49% to 73.26% on intermediate tasks. On SWE-bench code repair, Agent KB enables Claude-3 to improve from 41.33% to 53.33%. Our results suggest that Agent KB provides a modular, framework-agnostic infrastructure for enabling agents to learn from past experiences and generalize successful strategies to new tasks.
Abstract（参考訳）: 言語エージェントはますます複雑なタスクに取り組むため、効果的なエラー修正とドメイン間の再利用に苦労する。本稿では,新しいReason-Retrieve-Refineパイプラインを通じて複雑なエージェント問題の解決を可能にする階層的経験フレームワークであるAgent KBを紹介する。エージェントKBは中核的な制限に対処する: エージェントは伝統的に互いの経験から学ぶことができない。ハイレベル戦略と詳細な実行ログの両方をキャプチャすることで、Agent KBは、エージェント間の知識伝達を可能にする共有知識ベースを生成する。 GAIAベンチマークで評価すると、Agent KBは最大16.28ポイントの成功率を改善する。最も困難なタスクでは、Claude-3は38.46%から57.69%に改善され、GPT-4は53.49%から73.26%に改善された。 SWEベンチのコード修復では、Agent KBはClaude-3を41.33%から53.33%に改善した。この結果から,エージェントKBは,過去の経験から学習し,新たなタスクに成功戦略を一般化するための,モジュール化されたフレームワークに依存しない基盤を提供する可能性が示唆された。

関連論文リスト

DoVer: Intervention-Driven Auto Debugging for LLM Multi-Agent Systems [48.971606069204825]
DoVerは、大規模言語モデル(LLM)ベースのマルチエージェントシステムのための介入駆動デバッグフレームワークである。ターゲットの介入を通じて、アクティブな検証によって仮説生成を増強する。 DoVerは失敗試験の18～28%を成功させ、最大16%のマイルストーンを達成し、失敗仮説の30～60%を検証または否定する。
論文参考訳（メタデータ） (2025-12-07T09:23:48Z)
Alita-G: Self-Evolving Generative Agent for Agent Generation [54.49365835457433]
汎用エージェントをドメインエキスパートに変換するフレームワークであるALITA-Gを提案する。このフレームワークでは、ジェネラリストエージェントが対象ドメインタスクのキュレートされたスイートを実行する。計算コストを削減しながら、大きな利益を得ることができます。
論文参考訳（メタデータ） (2025-10-27T17:59:14Z)
Metacognitive Self-Correction for Multi-Agent System via Prototype-Guided Next-Execution Reconstruction [58.51530390018909]
大規模言語モデルに基づくマルチエージェントシステムは、協調的な問題解決において優れているが、エラーのカスケードには脆弱である。我々は,MASにリアルタイム,教師なし,ステップレベルの誤り検出と自己補正を付与するメタ認知フレームワークMASCを提案する。
論文参考訳（メタデータ） (2025-10-16T05:35:37Z)
Eigen-1: Adaptive Multi-Agent Refinement with Monitor-Based RAG for Scientific Reasoning [53.45095336430027]
暗黙的な検索と構造化された協調を組み合わせた統合フレームワークを開発する。 Humanity's Last Exam (HLE) Bio/Chem Goldでは,48.3%の精度を実現している。 SuperGPQAとTRQAの結果はドメイン間の堅牢性を確認した。
論文参考訳（メタデータ） (2025-09-25T14:05:55Z)
RLVMR: Reinforcement Learning with Verifiable Meta-Reasoning Rewards for Robust Long-Horizon Agents [43.806220882212386]
RLVMRは、検証可能なメタ推論の振る舞いに報いることによって、密集したプロセスレベルの監視をエンドツーエンドのRLに統合する。挑戦的なALFWorldとScienceWorldのベンチマークでは、RLVMRが新たな最先端の結果を達成している。
論文参考訳（メタデータ） (2025-07-30T17:00:48Z)
From Unstructured Communication to Intelligent RAG: Multi-Agent Automation for Supply Chain Knowledge Bases [8.640991293068248]
サプライチェーン操作は大量の運用データを生成する。システムの使用、トラブルシューティング、非構造化、解決技術といった重要な知識は、しばしば通信の中に埋もれています。 RAGシステムは知識ベースとしてそのようなコミュニケーションを活用することを目的としているが、その有効性は生データの問題によって制限されている。我々はこれらのコミュニケーションを構造化知識ベースに変換する新しいオフラインファースト手法を導入する。
論文参考訳（メタデータ） (2025-06-20T21:38:06Z)
OWL: Optimized Workforce Learning for General Multi-Agent Assistance in Real-World Task Automation [65.15955645757705]
専門的な実行から戦略的計画を切り離す階層的なマルチエージェントフレームワークであるWorkforceを紹介します。推論中、Workforceはワーカーエージェントの追加や修正によって新しいドメインにシームレスに適応する。トレーニングには、ドメイン間の一般化を改善する最適化されたワークフォース学習(OWL)を導入する。
論文参考訳（メタデータ） (2025-05-29T17:51:58Z)
Let the Trial Begin: A Mock-Court Approach to Vulnerability Detection using LLM-Based Agents [10.378745306569053]
VulTrialは、自動脆弱性検出を強化するために設計された法廷インスパイアされたフレームワークである。セキュリティ研究者、コード作者、モデレーター、レビューボードの4つの役割専門エージェントを雇用している。 GPT-3.5とGPT-4oを使用して、VulTrialはそれぞれのベースラインに対して102.39%、84.17%の性能を向上させる。
論文参考訳（メタデータ） (2025-05-16T07:54:10Z)
Self-Generated In-Context Examples Improve LLM Agents for Sequential Decision-Making Tasks [11.125564622217892]
大規模言語モデルエージェントは、人間の介入なしに自身の成功経験から学習することで改善する。提案手法は,将来的なタスクのコンテキスト内例として機能する,自己生成トラジェクトリのデータベースを構築し,改良する。我々の軌道ブートストラッピング技術は、エージェントが経験を通じて自律的に改善できることを示し、労働集約的な知識工学に代わるスケーラブルな代替手段を提供する。
論文参考訳（メタデータ） (2025-05-01T00:48:12Z)
Exploring Expert Failures Improves LLM Agent Tuning [74.0772570556016]
本稿では,失敗した専門家の軌道から有益な行動を識別する専門的失敗の探索(EEF)を提案する。 EEFは、未解決のいくつかのサブタスクをうまく解決し、エージェントチューニング性能を改善する。
論文参考訳（メタデータ） (2025-04-17T17:53:54Z)
A Dual-Agent Adversarial Framework for Robust Generalization in Deep Reinforcement Learning [7.923577336744156]
両エージェント対応型政策学習フレームワークを提案する。このフレームワークは、エージェントが人間の事前知識を導入することなく、基礎となるセマンティクスを自発的に学習することを可能にする。実験により, 両エージェントの一般化性能が著しく向上することが確認された。
論文参考訳（メタデータ） (2025-01-29T02:36:47Z)
KBAlign: Efficient Self Adaptation on Specific Knowledge Bases [73.34893326181046]
本稿では,効率的なモデル適応によりRAGシステムを強化する自己教師型フレームワークKBAlignを提案する。私たちのキーとなる洞察は、2つの革新的なメカニズムを通じて、モデルの本質的な能力を知識の整合性に活用することです。 KBAlign は GPT-4 による適応によって得られる性能向上の90%を達成できることを示した。
論文参考訳（メタデータ） (2024-11-22T08:21:03Z)
From Novice to Expert: LLM Agent Policy Optimization via Step-wise Reinforcement Learning [62.54484062185869]
本稿では,エージェントの強化学習プロセスの最適化にステップワイド報酬を利用するStepAgentを紹介する。エージェント反射とポリシー調整を容易にする暗黙の逆・逆の強化学習手法を提案する。
論文参考訳（メタデータ） (2024-11-06T10:35:11Z)
Diversity Empowers Intelligence: Integrating Expertise of Software Engineering Agents [106.87436596397816]
大規模言語モデル(LLM)エージェントは、現実世界のソフトウェア工学(SWE)問題を解決する大きな可能性を示している。専門知識を活かしたフレームワークであるDEI(Diversity Empowered Intelligence)を提案する。実験により、DEAが指導するエージェント委員会が、最高のエージェントのパフォーマンスを大きなマージンで上回ることが可能であることが示されている。
論文参考訳（メタデータ） (2024-08-13T17:50:28Z)
On the Resilience of LLM-Based Multi-Agent Collaboration with Faulty Agents [58.79302663733703]
大規模言語モデルに基づくマルチエージェントシステムは、専門家エージェントの協力により、様々なタスクにまたがる優れた能力を示している。不器用なエージェントや悪意のあるエージェントが与える影響 - システム全体のパフォーマンスにおいて、頻繁にタスクでエラーを犯すものは、いまだに過小評価されていない。本稿では,下流タスクにおける障害要因下での各種システム構造のレジリエンスについて検討する。
論文参考訳（メタデータ） (2024-08-02T03:25:20Z)
Watch Every Step! LLM Agent Learning via Iterative Step-Level Process Refinement [50.481380478458945]
反復的なステップレベルプロセスリファインメント(IPR)フレームワークは、エージェントトレーニングを強化するためのステップバイステップのガイダンスを提供する。 3つの複雑なエージェントタスクに関する我々の実験は、我々のフレームワークが様々な強力なベースラインより優れていることを示した。
論文参考訳（メタデータ） (2024-06-17T03:29:13Z)
Devil's Advocate: Anticipatory Reflection for LLM Agents [53.897557605550325]
我々のアプローチは、LLMエージェントに対して、与えられたタスクを管理可能なサブタスクに分解するように促す。イントロスペクティブ・イントロスペクティブ・イントロスペクティブ・イントロスペクティブ(introspective intervention)を3回実施する。潜在的な障害の予測と、アクション実行前の代替策。サブタスクの目的とのポストアクションアライメントと、計画実行における最大限の努力を保証するための改善によるバックトラック。
論文参考訳（メタデータ） (2024-05-25T19:20:15Z)
360$^\circ$REA: Towards A Reusable Experience Accumulation with 360° Assessment for Multi-Agent System [71.96888731208838]
評価フィードバックからの経験を総合的に評価し蓄積することは、システム性能を改善するための効果的なアプローチである、と我々は主張する。企業組織の実践にインスパイアされた階層的なマルチエージェントフレームワークである360$circ$REA(360$circ$REA)による再利用可能なエクスペリエンス蓄積を提案する。
論文参考訳（メタデータ） (2024-04-08T14:43:13Z)
Triad: A Framework Leveraging a Multi-Role LLM-based Agent to Solve Knowledge Base Question Answering [42.277248862366164]
Triadは、KBQAタスクに3つの役割を持つLLMベースのエージェントを利用する統一フレームワークである。我々のフレームワークは、エージェントの複数の役割の協調を含む4つのフェーズで実行される。
論文参考訳（メタデータ） (2024-02-22T06:23:37Z)
KT-BT: A Framework for Knowledge Transfer Through Behavior Trees in Multi-Robot Systems [0.0]
マルチロボットとマルチエージェントシステムは、局所行動の体系的および分散的な統合を通して、集合的(脅威)インテリジェンスを示す。本稿では,KT-BT: Knowledge Transfer through Behavior Treesという新たな知識表現フレームワークと伝達戦略を提案する。
論文参考訳（メタデータ） (2022-09-07T02:17:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。