Fugu-MT 論文翻訳(概要): Get Experience from Practice: LLM Agents with Record & Replay

論文の概要: Get Experience from Practice: LLM Agents with Record & Replay

arxiv url: http://arxiv.org/abs/2505.17716v1
Date: Fri, 23 May 2025 10:33:14 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-26 18:08:33.998758
Title: Get Experience from Practice: LLM Agents with Record & Replay
Title（参考訳）: Get Experience from Practice: LLM Agents with Record & Replay
Authors: Erhu Feng, Wenbo Zhou, Zibin Liu, Le Chen, Yunpeng Dong, Cheng Zhang, Yisheng Zhao, Dong Du, Zhichao Hua, Yubin Xia, Haibo Chen,
Abstract要約: 本稿では,AIエージェントフレームワークに古典的なレコード再生機構を導入する,Agent Record & Replay(Agent Record & Replay)と呼ばれる新しいパラダイムを提案する。本稿では,AgentRRにおけるマルチレベル体験抽象化手法とチェック関数機構について述べる。さらに,AgentRRの複数のアプリケーションモードについて検討し,ユーザ記録タスクのデモ,大規模モデルコラボレーション,プライバシ対応エージェントの実行などを検討した。
参考スコア（独自算出の注目度）: 16.179801770737892
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: AI agents, empowered by Large Language Models (LLMs) and communication protocols such as MCP and A2A, have rapidly evolved from simple chatbots to autonomous entities capable of executing complex, multi-step tasks, demonstrating great potential. However, the LLMs' inherent uncertainty and heavy computational resource requirements pose four significant challenges to the development of safe and efficient agents: reliability, privacy, cost and performance. Existing approaches, like model alignment, workflow constraints and on-device model deployment, can partially alleviate some issues but often with limitations, failing to fundamentally resolve these challenges. This paper proposes a new paradigm called AgentRR (Agent Record & Replay), which introduces the classical record-and-replay mechanism into AI agent frameworks. The core idea is to: 1. Record an agent's interaction trace with its environment and internal decision process during task execution, 2. Summarize this trace into a structured "experience" encapsulating the workflow and constraints, and 3. Replay these experiences in subsequent similar tasks to guide the agent's behavior. We detail a multi-level experience abstraction method and a check function mechanism in AgentRR: the former balances experience specificity and generality, while the latter serves as a trust anchor to ensure completeness and safety during replay. In addition, we explore multiple application modes of AgentRR, including user-recorded task demonstration, large-small model collaboration and privacy-aware agent execution, and envision an experience repository for sharing and reusing knowledge to further reduce deployment cost.
Abstract（参考訳）: 大規模言語モデル(LLM)とMPPやA2Aといった通信プロトコルによって強化されたAIエージェントは、単純なチャットボットから、複雑なマルチステップタスクの実行が可能な自律エンティティへと急速に進化し、大きな可能性を秘めている。しかし、LSMの本質的な不確実性と重い計算資源の要求は、信頼性、プライバシー、コスト、パフォーマンスの4つの安全で効率的なエージェントの開発に重大な課題をもたらす。モデルアライメント、ワークフローの制約、オンデバイスモデルデプロイメントといった既存のアプローチは、一部の問題を部分的に緩和するが、しばしば制限を伴うため、これらの課題を根本的に解決することができない。本稿では,AIエージェントフレームワークに古典的なレコード再生機構を導入する,Agent Record & Replay(Agent Record & Replay)と呼ばれる新しいパラダイムを提案する。中心となる考え方は次のとおりです。 1.タスク実行中のエージェントの環境と内部決定プロセスとのインタラクショントレースを記録する。 2. この痕跡をワークフローと制約をカプセル化した構造化された「経験」に要約し、 3. エージェントの動作をガイドするために、同様のタスクでこれらの体験を再生する。我々は,AgentRRのマルチレベル体験抽象化手法とチェック関数機構について詳述する: 前者は特異性と汎用性を,後者はリプレイ時の完全性と安全性を確保するための信頼アンカーとして機能する。さらに、AgentRRの複数のアプリケーションモードについて検討し、ユーザ記録タスクのデモ、大規模モデルコラボレーション、プライバシ対応エージェントの実行、知識の共有と再利用のためのエクスペリエンスリポジトリの構想などを行い、デプロイメントコストをさらに削減する。

関連論文リスト

GoalfyMax: A Protocol-Driven Multi-Agent System for Intelligent Experience Entities [4.406205045227101]
私たちは、エンドツーエンドのマルチエージェントコラボレーションのためのプロトコル駆動フレームワークであるGoalfyMaxを紹介します。 GoalfyMax が Model Context Protocol (MCP) 上に構築された標準化された Agent-to-Agent (A2A) 通信層を導入 Experience Pack(XP)アーキテクチャは、タスクの合理性と実行トレースの両方を保存する階層型メモリシステムである。
論文参考訳（メタデータ） (2025-07-13T05:13:52Z)
SafeMobile: Chain-level Jailbreak Detection and Automated Evaluation for Multimodal Mobile Agents [58.21223208538351]
本研究は,モバイルマルチモーダルエージェントを取り巻くセキュリティ問題について考察する。行動シーケンス情報を組み込んだリスク識別機構の構築を試みる。また、大規模言語モデルに基づく自動アセスメントスキームも設計している。
論文参考訳（メタデータ） (2025-07-01T15:10:00Z)
Cross-Task Experiential Learning on LLM-based Multi-Agent Collaboration [63.90193684394165]
マルチエージェント・クロスタスク体験学習(MAEL)は,LSM駆動型エージェントに明示的なクロスタスク学習と経験蓄積を付与する新しいフレームワークである。経験的学習フェーズでは、タスク解決ワークフローの各ステップの品質を定量化し、その結果の報酬を記憶する。推論中、エージェントは、各推論ステップの有効性を高めるために、いくつかの例として、高頻度のタスク関連体験を検索する。
論文参考訳（メタデータ） (2025-05-29T07:24:37Z)
Co-Saving: Resource Aware Multi-Agent Collaboration for Software Development [65.94639060883475]
本稿では,リソースを意識したマルチエージェントシステムであるCo-Savingを提案する。私たちの重要なイノベーションは、"ショートカット"の導入です。最先端のMAS ChatDevと比較して,トークン使用量の平均50.85%の削減を実現している。
論文参考訳（メタデータ） (2025-05-28T02:23:53Z)
A Novel Zero-Trust Identity Framework for Agentic AI: Decentralized Authentication and Fine-Grained Access Control [7.228060525494563]
本稿では,Agentic AI IAMフレームワークの提案について述べる。リッチで検証可能なエージェント識別子(ID)に基づく包括的フレームワークを提案する。また、Zero-Knowledge Proofs(ZKPs)によって、プライバシ保護属性の開示と検証可能なポリシーコンプライアンスを実現する方法について検討する。
論文参考訳（メタデータ） (2025-05-25T20:21:55Z)
AgentOrca: A Dual-System Framework to Evaluate Language Agents on Operational Routine and Constraint Adherence [54.317522790545304]
本稿では,言語エージェントの動作制約やルーチンに対するコンプライアンスを評価するための,デュアルシステムフレームワークであるAgentOrcaを提案する。本フレームワークは,エージェントの自然言語プロンプトと,それに対応する実行可能コードが,自動検証のための基礎的真理として機能することを通じて,行動制約とルーチンを符号化する。以上の結果から,o1のような大きな推論モデルではコンプライアンスが良好であり,他のモデルではパフォーマンスが著しく低下していることが明らかとなった。
論文参考訳（メタデータ） (2025-03-11T17:53:02Z)
AppAgentX: Evolving GUI Agents as Proficient Smartphone Users [34.70342284525283]
本稿では,インテリジェンスと柔軟性を維持しつつ,操作効率を向上させるGUIエージェントの進化的フレームワークを提案する。本手法は,エージェントのタスク実行履歴を記録するメモリ機構を組み込んだものである。複数のベンチマークタスクに対する実験結果から,本手法は既存の手法よりも効率と精度が優れていることが示された。
論文参考訳（メタデータ） (2025-03-04T04:34:09Z)
CRMArena: Understanding the Capacity of LLM Agents to Perform Professional CRM Tasks in Realistic Environments [90.29937153770835]
CRMArenaは、プロフェッショナルな作業環境に根ざした現実的なタスクにおいて、AIエージェントを評価するために設計されたベンチマークである。現状のLDMエージェントはReActプロンプトのタスクの40%以下で成功し,機能呼び出し能力でも55%以下であった。この結果から,実環境に展開する関数呼び出しやルールフォローにおいて,エージェント機能の向上の必要性が示唆された。
論文参考訳（メタデータ） (2024-11-04T17:30:51Z)
Agent-Oriented Planning in Multi-Agent Systems [54.429028104022066]
マルチエージェントシステムにおけるエージェント指向計画のための新しいフレームワークであるAOPを提案する。本研究では, エージェント指向計画の3つの重要な設計原則, 可解性, 完全性, 非冗長性を明らかにする。大規模実験は,マルチエージェントシステムにおける単一エージェントシステムと既存の計画戦略と比較して,現実の問題を解決する上でのAOPの進歩を実証している。
論文参考訳（メタデータ） (2024-10-03T04:07:51Z)
Towards Human-Level Understanding of Complex Process Engineering Schematics: A Pedagogical, Introspective Multi-Agent Framework for Open-Domain Question Answering [0.0]
化学・プロセス産業では、プロセス・フロー・ダイアグラム(PFD)とパイプ・アンド・インスツルメンテーション・ダイアグラム(P&ID)が設計、建設、保守に不可欠である。生成型AIの最近の進歩は、ビジュアル質問回答(VQA)のプロセス図の理解と解釈の約束を示している。本稿では,階層的かつマルチエージェントなRetrieval Augmented Generation(RAG)フレームワークを用いた,セキュアでオンプレミスなエンタープライズソリューションを提案する。
論文参考訳（メタデータ） (2024-08-24T19:34:04Z)
Internet of Agents: Weaving a Web of Heterogeneous Agents for Collaborative Intelligence [79.5316642687565]
既存のマルチエージェントフレームワークは、多種多様なサードパーティエージェントの統合に苦慮することが多い。我々はこれらの制限に対処する新しいフレームワークであるInternet of Agents (IoA)を提案する。 IoAはエージェント統合プロトコル、インスタントメッセージのようなアーキテクチャ設計、エージェントのチーム化と会話フロー制御のための動的メカニズムを導入している。
論文参考訳（メタデータ） (2024-07-09T17:33:24Z)
BMW Agents -- A Framework For Task Automation Through Multi-Agent Collaboration [0.0]
我々は、様々なドメインにわたる複雑なユースケースアプリケーションを扱う柔軟なエージェントエンジニアリングフレームワークの設計に重点を置いている。提案するフレームワークは,産業用アプリケーションの信頼性を提供し,複数の自律エージェントに対して,スケーラブルでフレキシブルで協調的なワークフローを保証するためのテクニックを提供する。
論文参考訳（メタデータ） (2024-06-28T16:39:20Z)
Experiential Co-Learning of Software-Developing Agents [83.34027623428096]
大規模言語モデル(LLM)は、特にソフトウェア開発において、様々な領域に大きな変化をもたらした。本稿では,新しいLLM学習フレームワークであるExperiential Co-Learningを紹介する。実験では、このフレームワークにより、エージェントは、目に見えないソフトウェア開発タスクをより効果的に対処できることを示した。
論文参考訳（メタデータ） (2023-12-28T13:50:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。