論文の概要: Architectural Obsolescence of Unhardened Agentic-AI Runtimes
- arxiv url: http://arxiv.org/abs/2605.01740v1
- Date: Sun, 03 May 2026 06:38:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.916407
- Title: Architectural Obsolescence of Unhardened Agentic-AI Runtimes
- Title(参考訳): 未硬化型エージェントAIランタイムのアーキテクチャ・オブゾルミネッセンス
- Authors: Alfredo Metere,
- Abstract要約: 上流のOpenClawは、公開リリースで最もエンジニアリングされたシングルユーザエージェントAIゲートウェイである。
すべての混乱行列の全てのセルにおいて、リコールが0.000であることを示す。
未修正のエージェントAIランタイムはアーキテクチャ上時代遅れである、と私たちは主張する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: An agentic-AI runtime issues tool calls, sends messages, and actuates devices on behalf of an LLM. Catching the four ways an action can diverge from its audit record -- F1 gate-bypass, F2 audit-forgery, silent host failure, F4 wrong-target, -- is a load-bearing safety property of any such runtime. We show that upstream OpenClaw, the most engineered single-user agentic-AI gateway in public release, catches none of them: recall is 0.000 on every cell of every confusion matrix, on a 1600-sample template baseline through OpenClaw's actual production command-line interface (CLI) and on a ten-LLM cross-model generalisation run. Detecting F1--F4 requires seven specific runtime structures absent from OpenClaw's source tree: a biconditional checker, a hash-chained audit log, an extension admission gate, a two-layer egress guard, a Bell-LaPadula classification policy, a module-signing trust root, and a bootstrap seal. enclawed-oss -- an MIT-licensed drop-in fork that ships all seven -- reaches $P = R = F_1 =$ accuracy $= 1.000$ on the same input. The gap is structural, not parametric: a six-line append-only widening of enclawed-oss's data-loss-prevention (DLP) regex catalog raises per-channel F3 detection by 14.6\% net at unchanged precision; the same edit on OpenClaw has nowhere to land. The harness deliberately exercises real Discord and Telegram channels -- plugin categories the first enclawed release deleted as unsafe -- to show F1--F4 detection extends to those previously-unsafe extensions. With architectural superiority for security and feature parity for extensions, we argue that unhardened agentic-AI runtimes are architecturally obsolete: a strictly better alternative exists, is adoptable today, and the gap requires re-architecture rather than configuration. We invite reviewers to apply the harness to any candidate runtime.
- Abstract(参考訳): Agentic-AIランタイムは、LDMに代わってツールコール、メッセージ送信、デバイスアクティベートを行う。
F1 gate-bypass、F2 audit-forgery、サイレントホスト障害、F4 wrong-targetという4つのアクションを監査レコードから切り離すことができるのは、そのようなランタイムのロード可能な安全特性である。
OpenClawの実際のプロダクションコマンドラインインターフェース(CLI)を通した1600サンプルのテンプレートベースラインと10-LLMのクロスモデル一般化実行によるリコールは、すべての混乱マトリックスのすべてのセルで0.000である。
F1-F4の検出には,OpenClawのソースツリーから欠落した7つの特定のランタイム構造 – バイコンディショニングチェッカー,ハッシュチェーン監査ログ,拡張アクセスゲート,2層エグレスガード,Bell-LaPadula分類ポリシ,モジュール署名の信頼ルート,ブートストラップシール – が必要になる。
enclawed-oss -- MITライセンスのドロップインフォークで、すべての7つを出荷する - が、同じ入力で$P = R = F_1 =$ accuracy $= 1.000$に達する。
DLP(Data-loss-prevention) regexカタログを6行追加で拡張することで、チャンネルごとのF3検出が14.6\%の精度で増加し、OpenClawでも同様の編集が行われた。
このハーネスは、実際のDiscordとTelegramチャンネル(プラグインカテゴリ)を意図的に実行し、F1--F4検出が以前は安全ではなかった拡張にまで拡張されたことを示す。
セキュリティと拡張機能に対するアーキテクチャ上の優位性により、未修正のエージェントAIランタイムはアーキテクチャ上時代遅れである、と私たちは主張する。
我々は、任意の候補ランタイムにハーネスを適用するようレビュアーを招待します。
関連論文リスト
- VLAA-GUI: Knowing When to Stop, Recover, and Search, A Modular Framework for GUI Automation [98.38575149237442]
VLAA-GUIは3つの統合コンポーネントを中心に構築されたモジュラーGUIフレームワークである。
必須完全性検証は、UIで観測可能な成功基準と検証を、各完了ステップで実施する。
強制的なループブレーカは、繰り返し失敗した後、多層切替インタラクションモードを提供する。
論文 参考訳(メタデータ) (2026-04-23T07:42:37Z) - Governed MCP: Kernel-Level Tool Governance for AI Agents via Logit-Based Safety Primitives [0.0]
Governed MCPは、ログベースの安全プリミティブ上に構築されたツールガバナンスゲートウェイである。
ゲートウェイは6層パイプライン内のすべてのMPPツールコールに介在する。
私は、約86,000行のRustのベアメタルx86_64 OSにGoverned MCPを実装しました。
論文 参考訳(メタデータ) (2026-04-18T06:40:20Z) - enclawed: A Configurable, Sector-Neutral Hardening Framework for Single-User AI Assistant Gateways [0.0]
Enclawedは、証明不可能なピア信頼、非定型外部接続、署名付きモジュールローディング、タンパー・エビデント監査パスを必要とするデプロイメントをターゲットとする。
フレームワークには2つのフレーバーがある。オープンフレーバーはOpenClawとの互換性を維持しつつ、監査、分類、データロス防止シグナルを出力する。
実装には、セキュリティレビュー、204ケースのテストスイート、継続的インテグレーション対応のGitHub Actionsが伴います。
論文 参考訳(メタデータ) (2026-04-18T05:10:11Z) - Dive into Claude Code: The Design Space of Today's and Future AI Agent Systems [42.345465506597044]
Claude Codeは、シェルコマンドを実行し、ファイルを編集し、ユーザに代わって外部サービスを呼び出すことができるエージェントコーディングツールである。
本研究では、公開されているTypeScriptソースコードを分析して、その包括的なアーキテクチャについて説明する。
論文 参考訳(メタデータ) (2026-04-14T17:59:37Z) - Compiling Activation Steering into Weights via Null-Space Constraints for Stealthy Backdoors [48.881343993730844]
安全性に整合した大規模言語モデル(LLM)は、現実世界のパイプラインにますますデプロイされている。
敵は通常の評価では動作しないバックドアのチェックポイントを配布することができる。
最近のポストホック重み付け法は、そのようなバックドアを注入するための効率的なアプローチを提供する。
論文 参考訳(メタデータ) (2026-04-14T06:48:33Z) - ElephantBroker: A Knowledge-Grounded Cognitive Runtime for Trustworthy AI Agents [45.88028371034407]
ElephantBrokerはオープンソースの認知ランタイムで、Neo4jナレッジグラフとQdrantベクトルストアを統合する。
このシステムは、ハイブリッド5ソース検索パイプラインからなる完全な認知ループ(ストア、検索、スコア、構成、保護、学習)を実装している。
論文 参考訳(メタデータ) (2026-03-26T07:03:12Z) - Governing Dynamic Capabilities: Cryptographic Binding and Reproducibility Verification for AI Agent Tool Use [0.0]
既存のセキュリティレイヤでは、AIエージェントに何ができるか、それが主張するものを実行したのか、マルチエージェントインタラクションで何が起きたのかを検証できない。
既存のフレームワークはこれら2つを詳述し、サイレントな能力のエスカレーションを可能にし、検証済みの証明なしに相互作用を残す。
我々は3つのエージェントガバナンス要件を導出する:能力の完全性(G1)、行動の妥当性(G2)、相互作用監査性(G3)。
基本(Ed25519, SHA-256; 97 us verify)と拡張(BBS+選択開示、Groth16 DV-SNARK; 13.8 ms)の2つの暗号に依存しないインスタンス化で検証する。
論文 参考訳(メタデータ) (2026-03-15T11:46:57Z) - Backdoor4Good: Benchmarking Beneficial Uses of Backdoors in LLMs [63.668008418097905]
クリーンタスク性能を保ちながら、優れたバックドアは高い制御性、タンパー抵抗性、ステルスネスを達成できることを示す。
私たちの発見は、バックドアは本質的に悪意のあるものではない、という新たな洞察を示しています。適切に設計された場合、信頼できるAIシステムのためのモジュールで解釈可能、有益なビルディングブロックとして機能します。
論文 参考訳(メタデータ) (2026-03-08T04:01:13Z) - The Trojan Knowledge: Bypassing Commercial LLM Guardrails via Harmless Prompt Weaving and Adaptive Tree Search [58.8834056209347]
大規模言語モデル(LLM)は、有害な出力を誘導するために安全ガードレールをバイパスするジェイルブレイク攻撃に弱いままである。
CKA-Agent(Correlated Knowledge Attack Agent)は、ターゲットモデルの知識基盤の適応的木構造探索としてジェイルブレイクを再構成する動的フレームワークである。
論文 参考訳(メタデータ) (2025-12-01T07:05:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。