論文の概要: Governance-Aware Agent Telemetry for Closed-Loop Enforcement in Multi-Agent AI Systems
- arxiv url: http://arxiv.org/abs/2604.05119v1
- Date: Mon, 06 Apr 2026 19:30:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-08 17:42:09.464609
- Title: Governance-Aware Agent Telemetry for Closed-Loop Enforcement in Multi-Agent AI Systems
- Title(参考訳): マルチエージェントAIシステムにおけるクローズドループ強化のためのガバナンス対応エージェントテレメトリ
- Authors: Anshul Pathak, Nishant Jain,
- Abstract要約: OpenTelemetryとLangfuseはテレメトリを収集するが、ガバナンスはリアルタイムの執行対象ではなく、下流の分析上の問題として扱う。
本稿では、テレメトリ収集と自動政策執行のループを閉じる参照アーキテクチャであるガバナンス対応エージェントテレメトリ(ATGA)を提案する。
- 参考スコア(独自算出の注目度): 9.74681037042927
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Enterprise multi-agent AI systems produce thousands of inter-agent interactions per hour, yet existing observability tools capture these dependencies without enforcing anything. OpenTelemetry and Langfuse collect telemetry but treat governance as a downstream analytics concern, not a real-time enforcement target. The result is an "observe-but-do-not-act" gap where policy violations are detected only after damage is done. We present Governance-Aware Agent Telemetry (GAAT), a reference architecture that closes the loop between telemetry collection and automated policy enforcement for multi-agent systems. GAAT introduces (1) a Governance Telemetry Schema (GTS) extending OpenTelemetry with governance attributes; (2) a real-time policy violation detection engine using OPA-compatible declarative rules under sub-200 ms latency; (3) a Governance Enforcement Bus (GEB) with graduated interventions; and (4) a Trusted Telemetry Plane with cryptographic provenance.
- Abstract(参考訳): エンタープライズマルチエージェントAIシステムは、1時間に数千のエージェント間インタラクションを生成するが、既存の可観測性ツールは、何も強制せずにこれらの依存関係をキャプチャする。
OpenTelemetryとLangfuseはテレメトリを収集するが、ガバナンスはリアルタイムの執行対象ではなく、下流の分析上の問題として扱う。
その結果、被害が生じた後のみ、政策違反が検出される「観測されるが、実行されない」ギャップとなる。
本稿では,マルチエージェントシステムにおけるテレメトリ収集と自動ポリシー適用のループを閉じる参照アーキテクチャであるGovernment-Aware Agent Telemetry(GAAT)を提案する。
GAATは,(1)OpenTelemetryをガバナンス属性で拡張するガバナンステレメトリスキーマ(GTS),(2)OPA互換宣言ルールを用いたリアルタイムポリシー違反検出エンジン(200ms未満のレイテンシ),(3)段階的な介入を伴うガバナンス強化バス(GEB),(4)暗号証明付き信頼テレメトリプレーン(Trusted Telemetry Plane)を紹介する。
関連論文リスト
- AI Trust OS -- A Continuous Governance Framework for Autonomous AI Observability and Zero-Trust Compliance in Enterprise Environments [4.3073750462661256]
本稿では,継続的かつ自律的なAIオブザーバビリティとゼロトラストコンプライアンスのためのガバナンスアーキテクチャであるAI Trust OSを提案する。
このフレームワークはゼロトラストテレメトリ境界を介して動作し、短命の読み取り専用プローブが構造メタデータを検証する。
論文 参考訳(メタデータ) (2026-04-06T15:14:10Z) - Willful Disobedience: Automatically Detecting Failures in Agentic Traces [2.2365938060262356]
AgentPexはエージェントトレースを体系的に評価するAIツールである。
エージェントプロンプトとシステム命令から振る舞いルールを抽出し、これらの仕様を使用してコンプライアンスのトレースを自動的に評価する。
我々は、通信、小売、航空会社の顧客サービスにおいて、AgentPexを2ベンチから424のトレースで評価した。
論文 参考訳(メタデータ) (2026-03-25T00:33:39Z) - REGAL: A Registry-Driven Architecture for Deterministic Grounding of Agentic AI in Enterprise Telemetry [0.0]
大規模言語モデル(LLM)は、エージェント自動化の新しい形態を可能にする。
本稿では,企業テレメトリにおけるエージェントAIシステムの決定論的基盤化のためのレジストリ駆動型アーキテクチャREGALを提案する。
論文 参考訳(メタデータ) (2026-03-03T14:13:39Z) - DeepAgent: A General Reasoning Agent with Scalable Toolsets [111.6384541877723]
DeepAgentは、自律的な思考、ツール発見、アクション実行を実行するエンドツーエンドのディープ推論エージェントである。
長期にわたる相互作用の課題に対処するために,過去の相互作用を構造化エピソード,動作,ツール記憶に圧縮する自律的メモリ折り畳み機構を導入する。
LLMシミュレートされたAPIを活用し、ツール呼び出しトークンにきめ細かいクレジットを割り当てるツールコールアドバンテージ属性を適用した、エンドツーエンドの強化学習戦略であるToolPOを開発した。
論文 参考訳(メタデータ) (2025-10-24T16:24:01Z) - AgentSight: System-Level Observability for AI Agents Using eBPF [10.37440633887049]
既存のツールは、エージェントの高レベルな意図(LSMプロンプトを介して)または低レベルな行動(例えば、システムコール)を観察するが、これら2つのビューを関連付けることはできない。
AgentOpsはハイブリッドアプローチを使用して,このセマンティックギャップをブリッジする,AgentOpsオブザーバビリティフレームワークです。
AgentSightはTLS暗号化されたLLMトラフィックをインターセプトしてセマンティックインテントを抽出し、カーネルイベントを監視してシステム全体の効果を観察し、これら2つのストリームをプロセス境界を越えて因果的に関連付ける。
論文 参考訳(メタデータ) (2025-08-02T01:43:39Z) - DRIFT: Dynamic Rule-Based Defense with Injection Isolation for Securing LLM Agents [52.92354372596197]
大規模言語モデル(LLM)は、強力な推論と計画能力のため、エージェントシステムの中心となってきています。
この相互作用は、外部ソースからの悪意のある入力がエージェントの振る舞いを誤解させる可能性がある、インジェクション攻撃のリスクも引き起こす。
本稿では,信頼に値するエージェントシステムのための動的ルールベースの分離フレームワークを提案する。
論文 参考訳(メタデータ) (2025-06-13T05:01:09Z) - ThinkGeo: Evaluating Tool-Augmented Agents for Remote Sensing Tasks [64.86209459039313]
ThinkGeoは、構造化ツールの使用とマルチステップ計画を通じて、リモートセンシングタスクにおけるツール拡張エージェントを評価するために設計されたエージェントベンチマークである。
我々はReActスタイルの対話ループを実装し,486 個の構造化エージェントタスク上でのオープンソース LLM とクローズドソース LLM の両方を1,773 個の専門家が検証した推論ステップで評価する。
分析の結果、ツールの精度とモデル間の計画整合性に顕著な相違が明らかになった。
論文 参考訳(メタデータ) (2025-05-29T17:59:38Z) - SOPBench: Evaluating Language Agents at Following Standard Operating Procedures and Constraints [59.645885492637845]
SOPBenchは、各サービス固有のSOPコードプログラムを実行可能な関数の有向グラフに変換する評価パイプラインである。
提案手法では,各サービス固有のSOPコードプログラムを実行可能関数の有向グラフに変換し,自然言語SOP記述に基づいてこれらの関数を呼び出しなければならない。
我々は18の先行モデルを評価し、上位モデルでさえタスクが困難であることを示す。
論文 参考訳(メタデータ) (2025-03-11T17:53:02Z) - Monitoring ROS2: from Requirements to Autonomous Robots [58.720142291102135]
本稿では,構造化自然言語で記述された要件から自律ロボットのランタイムモニタを生成するための形式的アプローチの概要について述べる。
当社のアプローチでは,Fletal Requirement Elicitation Tool (FRET) とランタイム検証フレームワークであるCopilotを,Ogma統合ツールを通じて統合しています。
論文 参考訳(メタデータ) (2022-09-28T12:19:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。