論文の概要: Beyond Autonomy: A Dynamic Tiered AgentRunner Framework for Governable and Resilient Enterprise AI Execution
- arxiv url: http://arxiv.org/abs/2605.10223v1
- Date: Mon, 11 May 2026 09:03:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.67344
- Title: Beyond Autonomy: A Dynamic Tiered AgentRunner Framework for Governable and Resilient Enterprise AI Execution
- Title(参考訳): Beyond Autonomy: 統治可能でレジリエントなエンタープライズAI実行のための動的階層型エージェントランナーフレームワーク
- Authors: Kai Pan, Rong Hou,
- Abstract要約: プロダクショングレードのマルチテナントプラットフォームから抽出した制御実行プロトコルであるDynamic Tiered AgentRunnerを提案する。
本フレームワークは,(1)タスクリスクプロファイルに基づいて動的に計算資源を割り当てるリスク適応型タイリング,(2)物理的に分離された独立したエージェントによって提案,レビュー,実行,検証を行うパワーズアーキテクチャの分離,(3)障害を第一級システム状態として扱う検証器-回復閉ループによるレジリエンス・バイ・デザインの3つのコアメカニズムを紹介する。
- 参考スコア(独自算出の注目度): 1.509090088899154
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Current large language model agent frameworks prioritize autonomy but lack the governability mechanisms required for enterprise deployment. High-risk write operations proceed without independent review, complex tasks lack acceptance verification, and computational resources are allocated uniformly regardless of risk level. We propose the Dynamic Tiered AgentRunner, a controlled execution protocol distilled from a production-grade multi-tenant SaaS platform. The framework introduces three core mechanisms: (1) Risk-Adaptive Tiering that dynamically allocates computational resources and review intensity based on task risk profiles, achieving Pareto-optimal trade-offs between safety and efficiency; (2) Separation of Powers architecture where proposal, review, execution, and verification are performed by independent agents with physically isolated boundaries; and (3) Resilience-by-Design through a Verifier-Recovery closed loop that treats failure as a first-class system state. We formalize the tier selectio
- Abstract(参考訳): 現在の大規模言語モデルエージェントフレームワークは、自律性を優先するが、エンタープライズデプロイメントに必要な管理性メカニズムは欠如している。
リスクの高い書き込み操作は、独立したレビューなしで進行し、複雑なタスクは受け入れ検証を欠き、計算リソースはリスクレベルに関係なく均一に割り当てられる。
プロダクショングレードのマルチテナントSaaSプラットフォームから抽出した制御実行プロトコルであるDynamic Tiered AgentRunnerを提案する。
本フレームワークでは,(1)タスクリスクプロファイルに基づいて計算資源を動的に割り当てるリスク適応型タイリング,安全性と効率のパレート最適トレードオフを実現すること,(2)物理的に孤立した境界を持つ独立したエージェントによる提案,レビュー,実行,検証を行うパワーズアーキテクチャの分離,(3)検証-回復閉ループを介し,障害を第一級システム状態として扱うレジリエンス・バイ・デザイン(Resilience-by-Design)の3つのメカニズムを紹介する。
階層セレクトを形式化する
関連論文リスト
- Harness as an Asset: Enforcing Determinism via the Convergent AI Agent Framework (CAAF) [0.0]
大規模言語モデルは、安全クリティカルエンジニアリングにおける制御可能性のギャップを生み出します。
本稿では,エージェントをオープンループ生成からクローズループフェールセーフ決定性に移行するConvergent AI Agent Framework(CAAF)を紹介する。
CAAFの3つの柱は相補的な故障面に対処し、コモディティコストで制御可能性ギャップを閉じることはない。
論文 参考訳(メタデータ) (2026-04-18T15:15:09Z) - When Should a Robot Think? Resource-Aware Reasoning via Reinforcement Learning for Embodied Robotic Decision-Making [68.12864562049957]
身体ロボットシステムは、高レベルの推論をサポートするために、大規模言語モデル(LLM)ベースのエージェントにますます依存している。
エージェントはいつ、いつ、いつ行動すべきか?
本稿では,エンボディエージェントのリソース・アウェア・オーケストレーションのための階層的なフレームワークであるRARRL(Resource-Aware Reasoning via Reinforcement Learning)を提案する。
論文 参考訳(メタデータ) (2026-03-17T15:38:50Z) - K^2-Agent: Co-Evolving Know-What and Know-How for Hierarchical Mobile Device Control [73.50217471850658]
K2-Agentは、計画と実行のための宣言的(何)および手続き的(どのように)知識を知り、共進化させることによって、人間のような認知をモデル化する階層的なフレームワークである。
挑戦的なAndroidWorldベンチマークでは、K2-Agentは生とオープンソースのバックボーンのみを使用して76.1%の成功率を達成した。
論文 参考訳(メタデータ) (2026-02-28T14:33:14Z) - EmboCoach-Bench: Benchmarking AI Agents on Developing Embodied Robots [68.29056647487519]
Embodied AIは、高忠実度シミュレーションと大規模データ収集によって実現されている。
しかし、このスケーリング能力は、労働集約的な手作業の監視に依存しているため、いまだにボトルネックになっている。
実装ポリシーを自律的に構築するための LLM エージェントの能力を評価するベンチマークである textscEmboCoach-Bench を紹介する。
論文 参考訳(メタデータ) (2026-01-29T11:33:49Z) - Assured Autonomy: How Operations Research Powers and Orchestrates Generative AI Systems [18.881800772626427]
生成モデルは、実現可能性、分散シフトに対する堅牢性、ストレステストを提供するメカニズムと組み合わせない限り、運用領域で脆弱である可能性がある、と我々は主張する。
我々は,運用研究に根ざした自律性確保のための概念的枠組みを開発する。
これらの要素は、安全クリティカルで信頼性に敏感な運用領域における自律性を保証するための研究アジェンダを定義する。
論文 参考訳(メタデータ) (2025-12-30T04:24:06Z) - Towards Efficient Agents: A Co-Design of Inference Architecture and System [66.59916327634639]
本稿では,エージェントアクセラレーションのための統合フレームワークであるAgentInferを提案する。
問題をAgentCollab、AgentSched、AgentSAM、AgentCompressの4つの相乗的コンポーネントに分解する。
BrowseComp-zhとDeepDiverベンチマークの実験では、これらの手法の相乗的コラボレーションを通じて、AgentInferは非効率なトークン消費を50%以上削減することを示した。
論文 参考訳(メタデータ) (2025-12-20T12:06:13Z) - Towards a Science of Scaling Agent Systems [79.64446272302287]
エージェント評価の定義を定式化し,エージェント量,コーディネーション構造,モデル,タスク特性の相互作用として,スケーリング法則を特徴付ける。
協調指標を用いて予測モデルを導出し,R2=0をクロスバリデーションし,未知のタスク領域の予測を可能にする。
ツールコーディネーショントレードオフ: 固定的な計算予算の下では, ツールヘビータスクはマルチエージェントのオーバーヘッドから不均衡に悩まされ, 2) 能力飽和: 調整が減少または負のリターンを, 単一エージェントのベースラインが45%を超えると達成できる。
論文 参考訳(メタデータ) (2025-12-09T06:52:21Z) - STRIDE: A Systematic Framework for Selecting AI Modalities - Agentic AI, AI Assistants, or LLM Calls [6.5640770609606385]
本稿では,3つのモード間の選択を原則として推奨するフレームワークSTRIDE(Systematic Task Reasoning Intelligence Deployment Evaluator)を提案する。
STRIDEは構造化されたタスク分解、ダイナミズムの属性、自己回帰要求分析を統合し、エージェント適合スコアを生成する。
モダリティの選択では92%の精度を達成し、不要なエージェントの配置を45%削減し、リソースコストを37%削減した。
論文 参考訳(メタデータ) (2025-12-01T21:54:07Z) - Governance-as-a-Service: A Multi-Agent Framework for AI System Compliance and Policy Enforcement [0.0]
ガバナンス・アズ・ア・サービス(Government-as-a-Service:G)は、エージェントのアウトプットを実行時に規制するポリシー駆動の執行層である。
Gは宣言的ルールと、違反のコンプライアンスと深刻度に基づいてエージェントをスコアするTrust Factorメカニズムを採用している。
その結果、Gはスループットを保ちながら高いリスクの振る舞いを確実にブロックまたはリダイレクトすることを示した。
論文 参考訳(メタデータ) (2025-08-26T07:48:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。