論文の概要: State and Memory is All You Need for Robust and Reliable AI Agents
- arxiv url: http://arxiv.org/abs/2507.00081v1
- Date: Mon, 30 Jun 2025 02:02:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-03 14:22:58.334778
- Title: State and Memory is All You Need for Robust and Reliable AI Agents
- Title(参考訳): 頑丈で信頼性の高いAIエージェントに必要なのは、ステートとメモリだけだ
- Authors: Matthew Muhoberac, Atharva Parikh, Nirvi Vakharia, Saniya Virani, Aco Radujevic, Savannah Wood, Meghav Verma, Dimitri Metaxotos, Jeyaraman Soundararajan, Thierry Masquelin, Alexander G. Godfrey, Sean Gardner, Dobrila Rudnicki, Sam Michael, Gaurav Chopra,
- Abstract要約: 大規模言語モデル(LLM)は、自然言語の理解と生成において強力な進歩を実現している。
しかし、複雑な現実世界の科学への応用は、記憶、計画、ツール統合の課題によって制限されている。
本稿では、LLMベースのエージェントが自律的に計画し、推論し、堅牢で信頼性の高いドメイン固有タスク実行を実現することができるモジュール型エージェントフレームワークであるSciBORGを紹介する。
- 参考スコア(独自算出の注目度): 29.259008600842517
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Large language models (LLMs) have enabled powerful advances in natural language understanding and generation. Yet their application to complex, real-world scientific workflows remain limited by challenges in memory, planning, and tool integration. Here, we introduce SciBORG (Scientific Bespoke Artificial Intelligence Agents Optimized for Research Goals), a modular agentic framework that allows LLM-based agents to autonomously plan, reason, and achieve robust and reliable domain-specific task execution. Agents are constructed dynamically from source code documentation and augmented with finite-state automata (FSA) memory, enabling persistent state tracking and context-aware decision-making. This approach eliminates the need for manual prompt engineering and allows for robust, scalable deployment across diverse applications via maintaining context across extended workflows and to recover from tool or execution failures. We validate SciBORG through integration with both physical and virtual hardware, such as microwave synthesizers for executing user-specified reactions, with context-aware decision making and demonstrate its use in autonomous multi-step bioassay retrieval from the PubChem database utilizing multi-step planning, reasoning, agent-to-agent communication and coordination for execution of exploratory tasks. Systematic benchmarking shows that SciBORG agents achieve reliable execution, adaptive planning, and interpretable state transitions. Our results show that memory and state awareness are critical enablers of agentic planning and reliability, offering a generalizable foundation for deploying AI agents in complex environments.
- Abstract(参考訳): 大規模言語モデル(LLM)は、自然言語の理解と生成において強力な進歩を実現している。
しかし、複雑な現実世界の科学ワークフローへの応用は、メモリ、計画、ツール統合の課題によって制限されている。
SciBORG(SciBORG:Scientific Bespoke Artificial Intelligence Agents Optimized for Research Goals)は、LLMをベースとしたエージェントが自律的に計画し、推論し、堅牢で信頼性の高いドメイン固有タスク実行を実現するためのモジュール型エージェントフレームワークである。
エージェントはソースコードのドキュメンテーションから動的に構築され、有限状態オートマトン(FSA)メモリで拡張される。
このアプローチは、手動のプロンプトエンジニアリングの必要性を排除し、拡張ワークフロー間のコンテキストを維持し、ツールや実行障害から回復することで、さまざまなアプリケーションにまたがる堅牢でスケーラブルなデプロイメントを可能にする。
我々は,SciBORGを,ユーザ特定反応を実行するマイクロ波シンセサイザーなどの物理ハードウェアおよび仮想ハードウェアと統合して検証し,多段階計画,推論,エージェント・ツー・エージェント通信,探索タスクの実行のためのコーディネートを利用したPubChemデータベースからの自律的多段階バイオアッセイ検索に利用することを証明する。
システムベンチマークは、SciBORGエージェントが信頼できる実行、適応計画、解釈可能な状態遷移を実現することを示している。
我々の結果は、メモリと状態の認識がエージェント計画と信頼性の重要な実現要因であることを示し、複雑な環境にAIエージェントをデプロイするための一般化可能な基盤を提供する。
関連論文リスト
作成中
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。