論文の概要: From Craft to Kernel: A Governance-First Execution Architecture and Semantic ISA for Agentic Computers
- arxiv url: http://arxiv.org/abs/2604.18652v1
- Date: Mon, 20 Apr 2026 05:25:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.38661
- Title: From Craft to Kernel: A Governance-First Execution Architecture and Semantic ISA for Agentic Computers
- Title(参考訳): クラフトからカーネルへ - エージェントコンピュータのためのガバナンスファーストな実行アーキテクチャとセマンティックISA
- Authors: Xiangyu Wen, Yuang Zhao, Xiaoyu Xu, Lingjun Chen, Changran Xu, Shu Chi, Jianrong Ding, Zeju Li, Haomin Li, Li Jiang, Fangxin Liu, Qiang Xu,
- Abstract要約: Arbiter-Kはガバナンスファーストな実行アーキテクチャで、基盤となるモデルを確率的処理ユニットとして再認識する。
我々は、Arbiter-Kがマイクロアーキテクチャー特性としてセキュリティを強制し、76%から95%の安全でないインターセプションを達成し、92.79%のネイティブポリシーを絶対的に獲得したことを示す。
- 参考スコア(独自算出の注目度): 19.861459645485976
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The transition of agentic AI from brittle prototypes to production systems is stalled by a pervasive crisis of craft. We suggest that the prevailing orchestration paradigm-delegating the system control loop to large language models and merely patching with heuristic guardrails-is the root cause of this fragility. Instead, we propose Arbiter-K, a Governance-First execution architecture that reconceptualizes the underlying model as a Probabilistic Processing Unit encapsulated by a deterministic, neuro-symbolic kernel. Arbiter-K implements a Semantic Instruction Set Architecture (ISA) to reify probabilistic messages into discrete instructions. This allows the kernel to maintain a Security Context Registry and construct an Instruction Dependency Graph at runtime, enabling active taint propagation based on the data-flow pedigree of each reasoning node. By leveraging this mechanism, Arbiter-K precisely interdicts unsafe trajectories at deterministic sinks (e.g., high-risk tool calls or unauthorized network egress) and enables autonomous execution correction and architectural rollback when security policies are triggered. Evaluations on OpenClaw and NanoBot demonstrate that Arbiter-K enforces security as a microarchitectural property, achieving 76% to 95% unsafe interception for a 92.79% absolute gain over native policies. The code is publicly available at https://github.com/cure-lab/ArbiterOS.
- Abstract(参考訳): エージェントAIの脆いプロトタイプから生産システムへの移行は、多岐にわたるクラフトの危機によって停滞している。
一般的なオーケストレーションのパラダイムは,システム制御ループを大規模言語モデルに委譲し,ヒューリスティックなガードレールにパッチを当てることが,この脆弱性の根本原因であることを示唆する。
代わりに、我々は、決定論的、ニューロシンボリックカーネルによってカプセル化された確率的処理ユニットとして基盤モデルを再認識するガバナンスファースト実行アーキテクチャであるArbiter-Kを提案する。
Arbiter-Kは、確率的メッセージを個別の命令に変換するためのセマンティック命令セットアーキテクチャ(ISA)を実装している。
これにより、カーネルはSecurity Context Registryを維持し、実行時にインストラクション依存性グラフを構築することができ、各推論ノードのデータフローパターンに基づいてアクティブなテント伝搬を可能にする。
このメカニズムを活用することで、Arbiter-Kは決定論的シンク(ハイリスクなツールコールや不正なネットワークエクスグレスなど)で安全でないトラジェクトリを正確に解釈し、セキュリティポリシの起動時に自動実行の修正とアーキテクチャのロールバックを可能にする。
OpenClawとNanoBotの評価は、Arbiter-Kがマイクロアーキテクチャとしてセキュリティを強制し、76%から95%の安全でないインターセプションを達成し、ネイティブポリシーよりも92.79%の絶対的な利益を得たことを示している。
コードはhttps://github.com/cure-lab/ArbiterOSで公開されている。
関連論文リスト
- Parallax: Why AI Agents That Think Must Never Act [0.0]
本稿では,4つの原則に基づく自律型AI実行のパラダイムであるParallaxを紹介する。
本稿では、Goのオープンソースリファレンス実装であるOpenParallaxを紹介し、Assume-Compromise Evaluationを用いて評価する。
9つの攻撃カテゴリにおける280件の敵の試験ケースのうち、パララックスは98.9%の攻撃をブロックし、デフォルト設定ではゼロの偽陽性、最大セキュリティ設定では100%の攻撃をブロックした。
論文 参考訳(メタデータ) (2026-04-14T17:20:48Z) - Compiling Activation Steering into Weights via Null-Space Constraints for Stealthy Backdoors [48.881343993730844]
安全性に整合した大規模言語モデル(LLM)は、現実世界のパイプラインにますますデプロイされている。
敵は通常の評価では動作しないバックドアのチェックポイントを配布することができる。
最近のポストホック重み付け法は、そのようなバックドアを注入するための効率的なアプローチを提供する。
論文 参考訳(メタデータ) (2026-04-14T06:48:33Z) - OpenKedge: Governing Agentic Mutation with Execution-Bound Safety and Evidence Chains [2.124730017640531]
OpenKedgeは、突然変異を支配プロセスとして再定義するプロトコルである。
EEC(Intent-to-Execution Evidence Chain)は、意図、文脈、政策決定、実行境界、成果を統一された系統にリンクする。
マルチエージェントのコンフリクトシナリオとクラウドインフラストラクチャの変異に対してOpenKedgeを評価した。
論文 参考訳(メタデータ) (2026-04-07T22:51:08Z) - Clawed and Dangerous: Can We Trust Open Agentic Systems? [12.04979073308511]
オープンエージェントシステムは、プランニングを外部機能、永続メモリ、特権実行と組み合わせる。
本稿では,6次元分析分類法を導入し,攻撃,ベンチマーク,防衛,監査,隣接技術基盤にまたがる50の論文を合成する。
文献は攻撃特性とベンチマーク構築において比較的成熟しているが,デプロイメントコントロールや運用管理,永続的メモリの完全性,能力回復には依然として弱いことが,我々のレビューで示されている。
論文 参考訳(メタデータ) (2026-03-27T09:45:12Z) - Uncovering Security Threats and Architecting Defenses in Autonomous Agents: A Case Study of OpenClaw [42.9467373594646]
本報告では,OpenClawエコシステムの総合的なセキュリティ分析について述べる。
我々は、インジェクション駆動のRemote Code Execution(RCE)、シーケンシャルツールアタックチェーン、コンテキスト記憶、サプライチェーン汚染などの重要な脆弱性を強調した。
これらのシステム的アーキテクチャ欠陥に対処するために、フルライフサイクルエージェントセキュリティアーキテクチャ(FASA)を導入します。
この理論的な防御青写真は、ゼロトラストエージェント実行、動的意図検証、および層間推論-作用相関を提唱している。
論文 参考訳(メタデータ) (2026-03-13T04:33:05Z) - AJAR: Adaptive Jailbreak Architecture for Red-teaming [1.356919241968803]
AJARは概念実証フレームワークであり、"赤チーム"と"アクションセキュリティ"のギャップを埋めるように設計されている。
AJARは実行ループから逆ロジックを分離し、X-Teamingのような最先端のアルゴリズムを標準化されたプラグイン・アンド・プレイサービスとしてカプセル化する。
AJARは、この出現する攻撃面の標準化された環境対応評価を容易にするために、オープンソース化されている。
論文 参考訳(メタデータ) (2026-01-16T03:30:40Z) - ReasAlign: Reasoning Enhanced Safety Alignment against Prompt Injection Attack [52.17935054046577]
本稿では、間接的インジェクション攻撃に対する安全性アライメントを改善するためのモデルレベルのソリューションであるReasAlignを提案する。
ReasAlignには、ユーザクエリの分析、競合する命令の検出、ユーザの意図したタスクの継続性を維持するための構造化された推論ステップが組み込まれている。
論文 参考訳(メタデータ) (2026-01-15T08:23:38Z) - CaMeLs Can Use Computers Too: System-level Security for Computer Use Agents [60.98294016925157]
AIエージェントは、悪意のあるコンテンツがエージェントの行動をハイジャックして認証情報を盗んだり、金銭的損失を引き起こすような、インジェクション攻撃に弱い。
CUAのためのシングルショットプランニングでは、信頼できるプランナーが、潜在的に悪意のあるコンテンツを観察する前に、条件付きブランチで完全な実行グラフを生成する。
このアーキテクチャ分離は命令インジェクションを効果的に防止するが、ブランチステアリング攻撃を防ぐには追加の対策が必要であることを示す。
論文 参考訳(メタデータ) (2026-01-14T23:06:35Z) - The Trojan Knowledge: Bypassing Commercial LLM Guardrails via Harmless Prompt Weaving and Adaptive Tree Search [58.8834056209347]
大規模言語モデル(LLM)は、有害な出力を誘導するために安全ガードレールをバイパスするジェイルブレイク攻撃に弱いままである。
CKA-Agent(Correlated Knowledge Attack Agent)は、ターゲットモデルの知識基盤の適応的木構造探索としてジェイルブレイクを再構成する動的フレームワークである。
論文 参考訳(メタデータ) (2025-12-01T07:05:23Z) - Adaptive Attacks on Trusted Monitors Subvert AI Control Protocols [80.68060125494645]
プロトコルとモニタモデルを知っている信頼できないモデルによるアダプティブアタックについて検討する。
我々は、攻撃者がモデル出力に公知またはゼロショットプロンプトインジェクションを埋め込む単純な適応攻撃ベクトルをインスタンス化する。
論文 参考訳(メタデータ) (2025-10-10T15:12:44Z) - DRIFT: Dynamic Rule-Based Defense with Injection Isolation for Securing LLM Agents [52.92354372596197]
大規模言語モデル(LLM)は、強力な推論と計画能力のため、エージェントシステムの中心となってきています。
この相互作用は、外部ソースからの悪意のある入力がエージェントの振る舞いを誤解させる可能性がある、インジェクション攻撃のリスクも引き起こす。
本稿では,信頼に値するエージェントシステムのための動的ルールベースの分離フレームワークを提案する。
論文 参考訳(メタデータ) (2025-06-13T05:01:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。