論文の概要: AgentSPEX: An Agent SPecification and EXecution Language
- arxiv url: http://arxiv.org/abs/2604.13346v1
- Date: Tue, 14 Apr 2026 23:16:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-16 20:38:32.325999
- Title: AgentSPEX: An Agent SPecification and EXecution Language
- Title(参考訳): AgentSPEX: A Agent Specification and Execution Language
- Authors: Pengcheng Wang, Jerry Huang, Jiarui Yao, Rui Pan, Peizhi Niu, Yaowenqi Liu, Ruida Wang, Renhao Lu, Yuwei Guo, Tong Zhang,
- Abstract要約: 本稿では,明示的な制御フローとモジュール構造を持つエージェントフレームワークであるAgentSPEXを紹介する。
AgentSPEXは、型付きステップ、分岐とループ、並列実行、再利用可能なサブモジュール、明示的な状態管理をサポートする。
我々は、AgentSPEXが一般的なエージェントフレームワークよりも解釈可能でアクセシブルなワークフローオーサリングパラダイムを提供するというユーザスタディを通して示す。
- 参考スコア(独自算出の注目度): 17.439531520677594
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Language-model agent systems commonly rely on reactive prompting, in which a single instruction guides the model through an open-ended sequence of reasoning and tool-use steps, leaving control flow and intermediate state implicit and making agent behavior potentially difficult to control. Orchestration frameworks such as LangGraph, DSPy, and CrewAI impose greater structure through explicit workflow definitions, but tightly couple workflow logic with Python, making agents difficult to maintain and modify. In this paper, we introduce AgentSPEX, an Agent SPecification and EXecution Language for specifying LLM-agent workflows with explicit control flow and modular structure, along with a customizable agent harness. AgentSPEX supports typed steps, branching and loops, parallel execution, reusable submodules, and explicit state management, and these workflows execute within an agent harness that provides tool access, a sandboxed virtual environment, and support for checkpointing, verification, and logging. Furthermore, we provide a visual editor with synchronized graph and workflow views for authoring and inspection. We include ready-to-use agents for deep research and scientific research, and we evaluate AgentSPEX on 7 benchmarks. Finally, we show through a user study that AgentSPEX provides a more interpretable and accessible workflow-authoring paradigm than a popular existing agent framework.
- Abstract(参考訳): 言語モデルエージェントシステムは、一般的にはリアクティブプロンプトに依存しており、単一の命令が推論とツールの使用手順のオープンなシーケンスを通じてモデルを誘導し、制御フローと中間状態が暗黙的に残され、エージェントの振る舞いを制御しにくくする。
LangGraph、DSPy、CrewAIといったオーケストレーションフレームワークは、明示的なワークフロー定義を通じてより構造を強制するが、ワークフローロジックをPythonと密に結合することにより、エージェントのメンテナンスと修正が困難になる。
本稿では、明示的な制御フローとモジュール構造を持つLLMエージェントワークフローと、カスタマイズ可能なエージェントハーネスを指定するためのエージェントSPEXについて紹介する。
AgentSPEXは、タイプされたステップ、ブランチとループ、並列実行、再利用可能なサブモジュール、明示的な状態管理をサポートし、これらのワークフローは、ツールアクセス、サンドボックス化された仮想環境、チェックポインティング、検証、ロギングを提供するエージェントハーネス内で実行される。
さらに、オーサリングとインスペクションのための同期グラフとワークフロービューを備えたビジュアルエディタを提供する。
我々は,深層研究と科学的研究に使えるエージェントを含め,エージェントSPEXを7つのベンチマークで評価する。
最後に、AgentSPEXは一般的なエージェントフレームワークよりも解釈可能でアクセスしやすいワークフローオーサリングパラダイムを提供するというユーザスタディを通して示します。
関連論文リスト
- Agent Mentor: Framing Agent Knowledge through Semantic Trajectory Analysis [4.365760422569902]
我々は、Agent Mentorオープンソースライブラリの一部として実装された分析パイプラインを紹介する。
システムの監視と漸進的な適応によって、他のエージェントの振る舞いを定義する。
パイプラインは、エージェントの知識に修正命令を体系的に注入することで、パフォーマンスを向上させる。
論文 参考訳(メタデータ) (2026-04-12T08:02:54Z) - AgentXRay: White-Boxing Agentic Systems via Workflow Reconstruction [18.58136299119322]
本稿では,明示的で解釈可能なスタンドインワークフローの合成を目的とした新しいタスクであるエージェント再構成(AWR)を紹介する。
本稿では、AWRを個別のエージェントロールに対する最適化指標として定式化する検索ベースのフレームワークであるAgentXRayを提案する。
我々は,AgentXRayが未処理の検索と比較して高いプロキシ類似性を実現し,トークンの消費を減らすことを実証した。
論文 参考訳(メタデータ) (2026-02-05T06:24:15Z) - Beyond Rule-Based Workflows: An Information-Flow-Orchestrated Multi-Agents Paradigm via Agent-to-Agent Communication from CORAL [0.15199492741752027]
本稿ではエージェント・ツー・エージェント(A2A)通信を用いた情報フロー型マルチエージェントパラダイムを提案する。
汎用ベンチマークGAIAに対する我々のアプローチを,代表的ワークフローベースMASをベースラインとして評価した。
本手法は63.64%の精度を達成し, OWL の55.15% を8.49 % に上回り, トークン消費に匹敵する性能を示した。
論文 参考訳(メタデータ) (2026-01-14T21:35:51Z) - Monadic Context Engineering [59.95390010097654]
本稿では,エージェント設計の正式な基盤を提供するために,モナディックコンテキストエンジニアリング(MCE)を紹介する。
我々は、モナドがロバストなコンポジションをどのように実現し、Applicativesが並列実行に原則化された構造を提供し、また、モナドトランスフォーマーがこれらの機能の体系的なコンポジションをどのように可能にしているかを実証する。
この階層化されたアプローチにより、開発者は、単純で独立した検証可能なコンポーネントから、複雑でレジリエントで効率的なAIエージェントを構築することができる。
論文 参考訳(メタデータ) (2025-12-27T01:52:06Z) - A Declarative Language for Building And Orchestrating LLM-Powered Agent Workflows [0.0]
本稿では,エージェントワークフロー仕様と実装を分離する宣言型システムを提案する。
これらの結果から,開発時間の60%削減,デプロイメント速度の3倍の改善が見られた。
製品検索やパーソナライズ,カート管理といった複雑な処理は,500行以上の命令型コードと比較して,50行未満のDSLで表現可能であることを示す。
論文 参考訳(メタデータ) (2025-12-22T05:03:37Z) - GUISpector: An MLLM Agent Framework for Automated Verification of Natural Language Requirements in GUI Prototypes [58.197090145723735]
本稿では,GUIプロトタイプにおけるNL要求の自動検証にマルチモーダル(M)LLMエージェントを利用する新しいフレームワークを提案する。
GuiSpectorはエージェントの検証プロセスから詳細なNLフィードバックを抽出し、開発者に実行可能な洞察を提供する。
本稿では,これらの機能を統合化し,検証実行の監視,エージェントの合理性検査,エンドツーエンドの要件検証プロセスの管理を行うインターフェースを提供する。
論文 参考訳(メタデータ) (2025-10-06T13:15:24Z) - Open Agent Specification (Agent Spec): A Unified Representation for AI Agents [10.685555728094338]
我々はAIエージェントとエージェントを定義する宣言型言語Open Agent Specification(Agent Spec)を紹介する。
Agent Specは、コンポーネント、コントロールとデータフローのセマンティクス、スキーマの共通セットを定義し、エージェントを一度定義し、異なるランタイム間で実行できるようにする。
論文 参考訳(メタデータ) (2025-10-05T12:26:42Z) - AgentScope 1.0: A Developer-Centric Framework for Building Agentic Applications [95.42093979627703]
AgentScopeは柔軟で効率的なツールベースのエージェント環境インタラクションをサポートする。
エージェントの動作をReActパラダイムに基盤として,エージェントレベルの高度なインフラストラクチャを提供します。
AgentScopeには、開発者フレンドリーなエクスペリエンスのための堅牢なエンジニアリングサポートも含まれている。
論文 参考訳(メタデータ) (2025-08-22T10:35:56Z) - PC-Agent: A Hierarchical Multi-Agent Collaboration Framework for Complex Task Automation on PC [98.82146219495792]
本稿では,PC-Agentという階層型エージェントフレームワークを提案する。
認識の観点からは,現在のMLLMのスクリーンショットコンテンツに対する認識能力の不十分さを克服するために,アクティブ知覚モジュール(APM)を考案する。
意思決定の観点から、複雑なユーザ命令や相互依存サブタスクをより効果的に扱うために、階層的なマルチエージェント協調アーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-02-20T05:41:55Z) - AgentScope: A Flexible yet Robust Multi-Agent Platform [66.64116117163755]
AgentScopeは、メッセージ交換をコアコミュニケーションメカニズムとする、開発者中心のマルチエージェントプラットフォームである。
豊富な構文ツール、組み込みエージェントとサービス機能、アプリケーションのデモとユーティリティモニタのためのユーザフレンドリなインターフェース、ゼロコードプログラミングワークステーション、自動プロンプトチューニング機構により、開発とデプロイメントの両方の障壁は大幅に低下した。
論文 参考訳(メタデータ) (2024-02-21T04:11:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。