論文の概要: Open Agent Specification (Agent Spec) Technical Report
- arxiv url: http://arxiv.org/abs/2510.04173v3
- Date: Mon, 03 Nov 2025 11:55:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-04 16:14:22.285673
- Title: Open Agent Specification (Agent Spec) Technical Report
- Title(参考訳): Open Agent Specification (Agent Spec)テクニカルレポート
- Authors: Yassine Benajiba, Cesare Bernardis, Vladislav Blinov, Paul Cayet, Hassan Chafi, Abderrahim Fathan, Louis Faucon, Damien Hilloulin, Sungpack Hong, Ingo Kossyk, Rhicheek Patra, Sujith Ravi, Jonas Schweizer, Jyotika Singh, Shailender Singh, Xuelin Situ, Weiyi Sun, Kartik Talamadupula, Jerry Xu, Ying Xu,
- Abstract要約: Open Agent Specification(Agent Spec)は、AIエージェントを定義するための宣言型言語である。
Agent Specは、断片化されたエージェント開発の課題を解決することを目的としている。
- 参考スコア(独自算出の注目度): 15.665374131039309
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Open Agent Specification (Agent Spec) is a declarative language for defining AI agents and workflows in a way that is compatible across different AI frameworks, promoting portability and interoperability within AI Agent frameworks. Agent Spec aims to resolve the challenges of fragmented agent development by providing a common unified specification that allows AI agents to be designed once and deployed across various frameworks, improving interoperability and reusability, while reducing redundant efforts. Additionally, Agent Spec facilitates development tools and portability, allowing AI agents to be defined independently of their execution environment and enabling teams to exchange solutions without implementation-specific limitations. Agent Spec benefits four key groups: (i) Agent developers, who gain a superset of reusable components and design patterns, enabling them to leverage a broader range of functionalities; (ii) Agent framework and tool developers, who can use Agent Spec as an interchange format and therefore benefit from cross-framework and tool support; (iii) Researchers, who can achieve reproducible results and comparability, facilitating more reliable and consistent outcomes; (iv) Enterprises, which see faster prototype-to-deployment, increased productivity, and greater scalability and maintainability for their AI agent solutions. This technical report provides an overview of the technical foundations of Agent Spec, including motivation, benefits, and future work. We also introduce a standardized Evaluation harness to assess agent behavior and agentic workflows across runtimes (LangGraph, CrewAI, AutoGen, and WayFlow), using three different benchmarks (SimpleQA Verified, $\tau^2$-Bench and BIRD-SQL) - analogous to how HELM and related harnesses standardized LLM evaluation - so that performance, robustness, and efficiency can be compared consistently across frameworks.
- Abstract(参考訳): Open Agent Specification(Agent Spec)は、AIエージェントとワークフローを定義する宣言型言語で、さまざまなAIフレームワーク間で互換性があり、AI Agentフレームワークの移植性と相互運用性を促進する。
Agent Specは、AIエージェントを設計し、さまざまなフレームワークにまたがってデプロイし、相互運用性と再利用性を改善し、冗長な労力を削減できる共通の統一仕様を提供することで、断片化されたエージェント開発の課題を解決することを目的としている。
さらに、Agent Specは開発ツールと移植性を促進し、AIエージェントを実行環境から独立して定義し、実装固有の制限なしにソリューションを交換できるようにする。
Agent Specは4つの主要なグループにメリットがある。
一 再利用可能なコンポーネント及びデザインパターンのスーパーセットを取得し、幅広い機能を利用することができるエージェント開発者
(ii)エージェントフレームワークとツール開発者は、Agent Specを交換フォーマットとして使用できるため、クロスフレームワークやツールサポートの恩恵を受けることができる。
三 再現可能な結果と可読性を達成し、より信頼性のある一貫した結果を促進する研究者。
(iv)AIエージェントソリューションのプロトタイプ・トゥ・デプロイの高速化、生産性の向上、スケーラビリティと保守性の向上を期待する企業。
このテクニカルレポートは、モチベーション、利益、将来の仕事を含む、Agent Specの技術基盤の概要を提供する。
また,3つのベンチマーク(SimpleQA Verified, $\tau^2$-Bench, BIRD-SQL)を用いて,エージェントの動作とエージェントワークフローをランタイム全体(LangGraph, CrewAI, AutoGen, WayFlow)で評価するための標準化された評価ハーネスを導入する。
関連論文リスト
- AgentScope 1.0: A Developer-Centric Framework for Building Agentic Applications [95.42093979627703]
AgentScopeは柔軟で効率的なツールベースのエージェント環境インタラクションをサポートする。
エージェントの動作をReActパラダイムに基盤として,エージェントレベルの高度なインフラストラクチャを提供します。
AgentScopeには、開発者フレンドリーなエクスペリエンスのための堅牢なエンジニアリングサポートも含まれている。
論文 参考訳(メタデータ) (2025-08-22T10:35:56Z) - DAWN: Designing Distributed Agents in a Worldwide Network [0.38447712214412116]
DAWNはグローバルに分散エージェントを登録し、ゲートウェイエージェントを通じて簡単に発見できる。
No-LLM Mode for Deterministic Task, Copilot for augmented decision-making, and LLM Agent for autonomous operations。
DAWNは、専用の安全性、セキュリティ、コンプライアンスレイヤを通じて、世界中のエージェントコラボレーションの安全性とセキュリティを保証する。
論文 参考訳(メタデータ) (2024-10-11T18:47:04Z) - Gödel Agent: A Self-Referential Agent Framework for Recursive Self-Improvement [112.04307762405669]
G"odel AgentはG"odelマシンにインスパイアされた自己進化型フレームワークである。
G"odel Agentは、パフォーマンス、効率、一般化性において手作業によるエージェントを上回る、継続的な自己改善を実現することができる。
論文 参考訳(メタデータ) (2024-10-06T10:49:40Z) - Internet of Agents: Weaving a Web of Heterogeneous Agents for Collaborative Intelligence [79.5316642687565]
既存のマルチエージェントフレームワークは、多種多様なサードパーティエージェントの統合に苦慮することが多い。
我々はこれらの制限に対処する新しいフレームワークであるInternet of Agents (IoA)を提案する。
IoAはエージェント統合プロトコル、インスタントメッセージのようなアーキテクチャ設計、エージェントのチーム化と会話フロー制御のための動的メカニズムを導入している。
論文 参考訳(メタデータ) (2024-07-09T17:33:24Z) - AgentScope: A Flexible yet Robust Multi-Agent Platform [66.64116117163755]
AgentScopeは、メッセージ交換をコアコミュニケーションメカニズムとする、開発者中心のマルチエージェントプラットフォームである。
豊富な構文ツール、組み込みエージェントとサービス機能、アプリケーションのデモとユーティリティモニタのためのユーザフレンドリなインターフェース、ゼロコードプログラミングワークステーション、自動プロンプトチューニング機構により、開発とデプロイメントの両方の障壁は大幅に低下した。
論文 参考訳(メタデータ) (2024-02-21T04:11:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。