論文の概要: Composing Verifiable Conceptual Models via Building Blocks: Towards Design-Time Verification of Agentic AI Workflows
- arxiv url: http://arxiv.org/abs/2606.21565v1
- Date: Fri, 19 Jun 2026 16:03:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 12:41:22.404125
- Title: Composing Verifiable Conceptual Models via Building Blocks: Towards Design-Time Verification of Agentic AI Workflows
- Title(参考訳): ビルディングブロックによる検証可能な概念モデルの構成:エージェントAIワークフローの設計時検証に向けて
- Authors: Noe Y. Flandre, Alexander C. Nwala, Philippe J. Giabbanelli,
- Abstract要約: エージェントAIシステムは、意思決定、ツール、外部アクションを調整するワークフローアーキテクチャを通じて、複数のベースエージェントをオーケストレーションする。
現在のプラットフォームではランタイムセーフガードが重視されているが、システム設計時の検証のサポートはほとんどない。
本稿では,エージェント構成を再利用可能なビルディングブロックとして相互作用させる設計時検証手法を提案する。
- 参考スコア(独自算出の注目度): 39.47298454012977
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Agentic AI systems orchestrate multiple LLM-based agents through workflow architectures that coordinate decisions, tools, and external actions. While current platforms emphasize runtime safeguards, little support exists for verifying workflows during system design. From a Modeling \& Simulation perspective, this gap is analogous to composing conceptual models without verifying whether their building blocks interact coherently. We propose a design-time verification approach that models agentic workflows as compositions of reusable building blocks and checks their compatibility through twelve structural rules. We implemented these rules in a software prototype and evaluated them using two openly released datasets: 48 workflows with known design flaws and 168 variants that preserve workflow logic but alter graph structure. Results show that our verifier reliably detects violations even when flawed designs are obscured through structural transformations such as splitting tasks between agents. Future works could combine our verification with community repositories of building blocks to compose safe agentic workflows.
- Abstract(参考訳): エージェントAIシステムは、意思決定、ツール、外部アクションを調整するワークフローアーキテクチャを通じて、複数のLLMベースのエージェントをオーケストレーションする。
現在のプラットフォームではランタイムセーフガードが重視されているが、システム設計中のワークフローを検証するためのサポートはほとんどない。
Modeling \& Simulationの観点から見ると、このギャップは、ビルディングブロックがコヒーレントに相互作用するかどうかを検証せずに概念モデルを構成するのと類似している。
本稿では,再利用可能なビルディングブロックの構成としてエージェントワークフローをモデル化し,12の構造規則による適合性を確認するための設計時検証手法を提案する。
ソフトウェアプロトタイプでこれらのルールを実装した上で、既知の設計上の欠陥を持つ48のワークフローと、ワークフローロジックを保持するがグラフ構造を変更する168の亜種という、2つの公開データセットを使用してそれらを評価した。
その結果, エージェント間のタスク分割などの構造変換によって, 欠陥のある設計が隠蔽された場合でも, 確実に違反を検知できることが判明した。
今後の作業では、安全なエージェントワークフローを構成するために、検証とビルディングブロックのコミュニティリポジトリを組み合わせることができます。
関連論文リスト
- From Question Answering to Task Completion: A Survey on Agent System and Harness Design [67.8241530947325]
本研究はモデルハーネスレンズを用いてLCMをベースとしたエージェントについて検討する。
まず, LLMをベースとしたエージェントを基礎モデルと実行ハーネスとして, エージェントの機能的定義と実装の視点を明らかにする。
次に、モデル中心のスケーリングの限界を分析し、エージェントエンジニアリングの4つのパラダイムをトレースし、実行ハーネスを6つの結合ランタイム責任に分解する。
論文 参考訳(メタデータ) (2026-06-14T05:40:16Z) - TopoPilot: Reliable Conversational Workflow Automation for Topological Data Analysis and Visualization [4.62716665682001]
TopoPilotは、複雑な科学的視覚化を自動化するための信頼性が高くエージェント的なフレームワークである。
TopoPilotは、信頼性の高い運用を保証するために、系統的なガードレールと検証メカニズムを組み込んでいる。
評価では、TopoPilotは99%以上の成功率を達成したが、ベースラインでは50%以下で、包括的なガードレールやチェックがない。
論文 参考訳(メタデータ) (2026-03-26T05:56:53Z) - Multi-Agent Procedural Graph Extraction with Structural and Logical Refinement [66.51979814832332]
モデル式は、専用の構造的および論理的洗練を伴う多ラウンド推論プロセスとして手続きグラフ抽出を定式化する。
実験により、モデルが強いベースラインに対して構造的正当性と論理的整合性の両方において大幅に改善されることが示されている。
論文 参考訳(メタデータ) (2026-01-27T04:00:48Z) - Towards a Declarative Agentic Layer for Intelligent Agents in MCP-Based Server Ecosystems [0.0]
本稿では, 接地型エージェントシステムのためのモデル非依存アーキテクチャ層を提案する。
提案するレイヤであるDALIAは、実行可能な機能を形式化し、タスクを公開し、決定論的タスクグラフを構築する。
発見と計画と実行を明確に分離することで、アーキテクチャはエージェントの振る舞いを検証可能な運用空間に制約する。
論文 参考訳(メタデータ) (2026-01-24T12:15:49Z) - CaMeLs Can Use Computers Too: System-level Security for Computer Use Agents [60.98294016925157]
AIエージェントは、悪意のあるコンテンツがエージェントの行動をハイジャックして認証情報を盗んだり、金銭的損失を引き起こすような、インジェクション攻撃に弱い。
CUAのためのシングルショットプランニングでは、信頼できるプランナーが、潜在的に悪意のあるコンテンツを観察する前に、条件付きブランチで完全な実行グラフを生成する。
このアーキテクチャ分離は命令インジェクションを効果的に防止するが、ブランチステアリング攻撃を防ぐには追加の対策が必要であることを示す。
論文 参考訳(メタデータ) (2026-01-14T23:06:35Z) - Monadic Context Engineering [59.95390010097654]
本稿では,エージェント設計の正式な基盤を提供するために,モナディックコンテキストエンジニアリング(MCE)を紹介する。
我々は、モナドがロバストなコンポジションをどのように実現し、Applicativesが並列実行に原則化された構造を提供し、また、モナドトランスフォーマーがこれらの機能の体系的なコンポジションをどのように可能にしているかを実証する。
この階層化されたアプローチにより、開発者は、単純で独立した検証可能なコンポーネントから、複雑でレジリエントで効率的なAIエージェントを構築することができる。
論文 参考訳(メタデータ) (2025-12-27T01:52:06Z) - AgentCompass: Towards Reliable Evaluation of Agentic Workflows in Production [4.031479494871582]
本稿では,エージェントパイプラインのデプロイ後監視と推論に特化して設計された,最初の評価フレームワークであるAgentを紹介する。
Agentは、主要なメトリクスに関する最先端の結果を達成すると同時に、人間のアノテーションで見逃された重要な問題を明らかにする。
論文 参考訳(メタデータ) (2025-09-18T05:59:04Z) - Executable Ontologies: Synthesizing Event Semantics with Dataflow Architecture [51.56484100374058]
我々は、セマンティックイベントセマンティクスとデータフローアーキテクチャを統合することで、従来のビジネスプロセス管理システムの限界に対処できることを実証する。
大胆なシーエンジニアリングのアーキテクチャは、セマンティックモデルをコンパイルなしで実行可能なアルゴリズムとして解釈する。
実行時にイベントモデルを変更することで、透明性を確保し、統一されたセマンティックフレームワーク内でデータとビジネスロジックをシームレスにマージする。
論文 参考訳(メタデータ) (2025-09-11T18:12:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。