論文の概要: Sovereign-OS: A Charter-Governed Operating System for Autonomous AI Agents with Verifiable Fiscal Discipline
- arxiv url: http://arxiv.org/abs/2603.14011v1
- Date: Sat, 14 Mar 2026 16:25:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-17 16:19:35.543664
- Title: Sovereign-OS: A Charter-Governed Operating System for Autonomous AI Agents with Verifiable Fiscal Discipline
- Title(参考訳): Sovereign-OS: 正当性検証可能な自律型AIエージェントのためのチャーター管理オペレーティングシステム
- Authors: Aojie Yuan, Haiyue Zhang, Ziyi Wang, Yue Zhao,
- Abstract要約: Sovereign-OSはガバナンスファーストのオペレーティングシステムで、すべてのエージェントアクションを憲法上の管理下に置く。
CEO(ストラテジスト)は、目標を依存性を認識したタスクDAGに分解する。
CFOは、オークションベースの入札エンジンを介して、予算上限、日々の燃焼制限、収益性フロアに対して各支出をゲートする。
労働者は、動的TrustScoreが管理する有給オートノミーの下で活動する。
- 参考スコア(独自算出の注目度): 7.232369984903087
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: As AI agents evolve from text generators into autonomous economic actors that accept jobs, manage budgets, and delegate to sub-agents, the absence of runtime governance becomes a critical gap. Existing frameworks orchestrate agent behavior but impose no fiscal constraints, require no earned permissions, and offer no tamper-evident audit trail. We introduce Sovereign-OS, a governance-first operating system that places every agent action under constitutional control. A declarative Charter (YAML) defines mission scope, fiscal boundaries, and success criteria. A CEO (Strategist) decomposes goals into dependency-aware task DAGs; a CFO (Treasury) gates each expenditure against budget caps, daily burn limits, and profitability floors via an auction-based bidding engine; Workers operate under earned-autonomy permissions governed by a dynamic TrustScore; and an Auditor (ReviewEngine) verifies outputs against Charter KPIs, sealing each report with a SHA-256 proof hash. Across our evaluation suite, Sovereign-OS blocks 100% of fiscal violations (30 scenarios), achieves 94% correct permission gating (200 trust-escalation missions), and maintains zero integrity failure over 1,200+ audit reports. The system further integrates Stripe for real-world payment processing, closing the loop from task planning to revenue collection. Our live demonstration walks through three scenarios: loading distinct Charters to observe divergent agent behavior, triggering CFO fiscal denials under budget and profitability constraints, and escalating a new worker's TrustScore from restricted to fully authorized with on-the-spot cryptographic audit verification.
- Abstract(参考訳): AIエージェントがテキストジェネレータから、ジョブを受け入れ、予算を管理し、サブエージェントに委譲する自律的な経済アクターへと進化するにつれ、ランタイムガバナンスの欠如が重要なギャップとなる。
既存のフレームワークはエージェントの動作を編成するが、財政的な制約は課せず、許可も必要とせず、不正な監査証跡も提供しない。
ガバナンスファーストなOSであるSovereign-OSを紹介します。
宣言的憲章(YAML)は、ミッションの範囲、財政境界、成功基準を定義する。
CEO(ストラテジスト)は、依存を意識したタスクDAGに目標を分解し、CFO(Treasury)は、オークションベースの入札エンジンを介して、予算上限、日々のバーン制限、収益性フロアに対して各支出をゲートし、労働者は動的トラストスコアによって管理される完全自治許可の下で活動し、監査官(ReviewEngine)は、チャーターKPIに対する出力を検証し、各レポートをSHA-256証明ハッシュで封印する。
評価スイート全体で、Sovereign-OSは、財政上の違反(30のシナリオ)の100%をブロックし、94%の正当性保証(200の信頼エスカレーションミッション)を達成し、1200以上の監査報告に対してゼロ整合性障害を維持します。
このシステムはStripeを現実世界の支払い処理に統合し、タスク計画から収益収集までのループを閉じる。
我々のライブデモは、異なるエージェントの振る舞いを観察するために、異なるチャーターをロードすること、予算と収益性の制約の下でCFOの財政的否定を引き起こすこと、新しいワーカーのTrustScoreが、オンザスポット暗号監査で完全に認証されるように制限されること、の3つのシナリオを通過します。
関連論文リスト
- Agents of Chaos [50.53354213047402]
実験室環境に展開する自律言語モデルを用いたエージェントの探索的再チームの研究を報告する。
20人のAI研究者が、良心的および敵対的な条件下でエージェントと対話した。
我々の発見は、現実的なデプロイメント設定におけるセキュリティ、プライバシ、ガバナンスに関連する脆弱性の存在を確立します。
論文 参考訳(メタデータ) (2026-02-23T16:28:48Z) - Aegis: Towards Governance, Integrity, and Security of AI Voice Agents [52.7512082818639]
音声エージェントのガバナンス,整合性,セキュリティのためのフレームワークであるAegisを提案する。
我々は,銀行コールセンタ,ITサポート,ロジスティクスにおけるケーススタディを通じて,この枠組みを評価する。
モデルファミリ間の系統的な差異を観察し,より感受性の高いオープンウェイトモデルを示した。
論文 参考訳(メタデータ) (2026-02-07T05:51:36Z) - A Blockchain-Monitored Agentic AI Architecture for Trusted Perception-Reasoning-Action Pipelines [0.0]
自律的な意思決定におけるエージェントAIシステムの応用は、医療、スマートシティ、デジタル法医学、サプライチェーン管理の領域で増加している。
本稿では,ラングチェインをベースとしたマルチエージェントシステムと,一定の監視,ポリシー施行,エージェントアクションの不変監査性を保証するために,ブロックチェーンを許可した単一アーキテクチャモデルを提案する。
論文 参考訳(メタデータ) (2025-12-24T06:20:28Z) - Policy-Governed RAG - Research Design Study [0.0]
RAGアーキテクチャは、規制されたゲート領域における監査可能な生成のために規定される。
この設計は既存のRAG/ガードレールを補完し、ポリシーチェックを監査可能、再生可能、レシートバックで補完する。
論文 参考訳(メタデータ) (2025-10-22T10:33:27Z) - Holistic Agent Leaderboard: The Missing Infrastructure for AI Agent Evaluation [87.47155146067962]
数百のタスクで並列評価をオーケストレーションする,標準化された評価ハーネスを提供する。
モデル、足場、ベンチマークにまたがる3次元解析を行う。
私たちの分析では、ほとんどのランで精度を低下させる高い推論努力など、驚くべき洞察が示されています。
論文 参考訳(メタデータ) (2025-10-13T22:22:28Z) - Audit the Whisper: Detecting Steganographic Collusion in Multi-Agent LLMs [0.0]
Audit the Whisperは、理論、ベンチマーク設計、検出、検証にまたがるカンファレンスグレードの研究成果物である。
i) パラフレーズ, レート制限, 役割置換などの介入が, ペアリングしたKullback-Leibler診断によって定量的なペナルティの操作を課すことを示すチャネル容量分析を行った。
我々は、匿名化された再生スクリプト、匿名化されたマニフェスト、ドキュメントをリリースし、外部監査官がすべての図を再現し、二重盲検要件を満たし、最小限の努力でフレームワークを拡張します。
論文 参考訳(メタデータ) (2025-10-05T17:51:52Z) - Governance-as-a-Service: A Multi-Agent Framework for AI System Compliance and Policy Enforcement [0.0]
ガバナンス・アズ・ア・サービス(Government-as-a-Service:G)は、エージェントのアウトプットを実行時に規制するポリシー駆動の執行層である。
Gは宣言的ルールと、違反のコンプライアンスと深刻度に基づいてエージェントをスコアするTrust Factorメカニズムを採用している。
その結果、Gはスループットを保ちながら高いリスクの振る舞いを確実にブロックまたはリダイレクトすることを示した。
論文 参考訳(メタデータ) (2025-08-26T07:48:55Z) - Security Challenges in AI Agent Deployment: Insights from a Large Scale Public Competition [101.86739402748995]
44の現実的なデプロイメントシナリオを対象とした,22のフロンティアAIエージェントを対象にしています。
Agent Red Teamingベンチマークを構築し、19の最先端モデルで評価します。
私たちの発見は、今日のAIエージェントの重要かつ永続的な脆弱性を浮き彫りにしたものです。
論文 参考訳(メタデータ) (2025-07-28T05:13:04Z) - Agent-as-a-Judge: Evaluate Agents with Agents [61.33974108405561]
本稿ではエージェント・アズ・ア・ジャッジ(Agent-as-a-Judge)フレームワークを紹介し,エージェント・システムを用いてエージェント・システムの評価を行う。
これはLLM-as-a-Judgeフレームワークの有機的拡張であり、タスク解決プロセス全体の中間フィードバックを可能にするエージェント的特徴を取り入れている。
55のリアルな自動化AI開発タスクのベンチマークであるDevAIを紹介します。
論文 参考訳(メタデータ) (2024-10-14T17:57:02Z) - Robust and Performance Incentivizing Algorithms for Multi-Armed Bandits with Strategic Agents [52.75161794035767]
性能インセンティブとロバストネスの2つの目的を同時に満たすバンディットアルゴリズムのクラスを導入する。
そこで本研究では,第2価格オークションのアイデアをアルゴリズムと組み合わせることで,プリンシパルが腕の性能特性に関する情報を持たないような設定が可能であることを示す。
論文 参考訳(メタデータ) (2023-12-13T06:54:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。