論文の概要: ICAN-Deploy: Identity-Stable Canary Deployment for Safety-Critical Embodied Agents
- arxiv url: http://arxiv.org/abs/2605.28097v1
- Date: Wed, 27 May 2026 07:52:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.858003
- Title: ICAN-Deploy: Identity-Stable Canary Deployment for Safety-Critical Embodied Agents
- Title(参考訳): ICAN-Deploy: 安全臨界体化剤のためのアイデンティティ安定カナリア展開
- Authors: Xue Qin, Simin Luan, John See, Zeyd Boukhers, Cong Yang, Zhijun Li,
- Abstract要約: Canaryデプロイメントは、トラフィックの一部を新しいソフトウェアバージョンにルーティングし、メトリクスを監視し、レグレッションをロールバックする。
ICAN-Deployは、状態マシンが実行時にそのIDハッシュをカナリアウィンドウに保持する構成である。
アイデンティティ生成時に一度認証されたシステムは、同じ認証の下で任意の能力進化を出荷することができる。
- 参考スコア(独自算出の注目度): 15.314555403098318
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Canary deployment routes a fraction of traffic to a new software version, monitors metrics, and rolls back on regression. Mainstream controllers (Argo Rollouts, Spinnaker, Flagger) change the deployed system's cryptographic identity during the canary window. The drift is harmless for stateless microservices but breaks the claim that "the agent you certified is still the agent you have" for safety-critical embodied agents, forcing re-certification per canary. We present ICAN-Deploy (Identity-stable CANary Deployment), a middleware construction whose state machine holds the identity hash invariant across the canary window by separating capability names (frozen, hashed) from capability versions (mutable runtime state). We implement ICAN-Deploy inside a runtime governance layer for LLM-driven robots and verify invariance by closed-form proof, AST lint, and TLA+ model-checking, then corroborate over N=100 real canary cycles on a Franka Panda arm in MuJoCo (zero drift; entry latency 95% BCa CI [1.52, 2.01] ms). A feature-flagged strawman that folds versions into the manifest falsifies on the same workload. A system certified once at identity-creation time can then ship arbitrary capability evolution under that same certification, within the version-and-name envelope.
- Abstract(参考訳): Canaryデプロイメントは、トラフィックの一部を新しいソフトウェアバージョンにルーティングし、メトリクスを監視し、レグレッションをロールバックする。
メインストリームコントローラ(Argo Rollouts, Spinnaker, Flagger)は、カナリアウィンドウ中にデプロイされたシステムの暗号化IDを変更する。
ドリフトはステートレスなマイクロサービスには無害だが,“認定したエージェントは依然としてエージェントである”という主張を,安全クリティカルな実施エージェントに対して破り,カナリア毎に再認証を強制する。
ICAN-Deploy(Identity-stable CANary Deployment)は、状態マシンがキャナリアウィンドウ全体のIDハッシュ不変性を保持しているミドルウェア構造で、機能名(フリーズ、ハッシュ)と機能バージョン(可変ランタイム状態)を分離する。
LLM駆動型ロボットのランタイムガバナンス層内にICANデプロイを実装し、クローズドフォーム証明、ASTリント、TLA+モデルチェックにより不変性を検証し、MuJoCoのFranka Pandaアーム上でN=100実カナリアサイクルをコロボレートする(ゼロドリフト、エントリレイテンシ95% BCa CI [1.52,2.01] ms)。
バージョンをマニフェストに折り畳むフィーチャーフラッグ付きのイチゴマンは、同じワークロード上で偽装します。
アイデンティティ生成時に一度認証されたシステムは、同じ認証の下で、バージョン・アンド・ネームエンベロープ内で任意の能力進化を出荷することができる。
関連論文リスト
- ChipMATE: Multi-Agent Training via Reinforcement Learning for Enhanced RTL Generation [55.947962672433675]
ChipMATEは、RTL生成のための最初の自己学習型マルチエージェントフレームワークである。
ChipMATEは産業的な実践に触発され、VerilogエージェントとPythonのリファレンスモデルエージェントをペアにし、相互に出力を検証する。
ChipMATEは、VerilogEval V2で75.0%と80.1%パス@1を4Bと9Bベースモデルで達成している。
論文 参考訳(メタデータ) (2026-05-13T01:04:21Z) - When Child Inherits: Modeling and Exploiting Subagent Spawn in Multi-Agent Networks [4.0552376861221635]
我々は、サブエージェント継承のレンズを通して、現代のマルチエージェントネットワークをモデル化する。
我々の分析によると、現在のフレームワークは、安全でないメモリ継承、リソース制御の弱い、スポーニング後の古い状態、不適切な終了権限を通じて、信頼境界に違反する可能性がある。
論文 参考訳(メタデータ) (2026-05-08T20:27:23Z) - enclawed: A Configurable, Sector-Neutral Hardening Framework for Single-User AI Assistant Gateways [0.0]
Enclawedは、証明不可能なピア信頼、非定型外部接続、署名付きモジュールローディング、タンパー・エビデント監査パスを必要とするデプロイメントをターゲットとする。
フレームワークには2つのフレーバーがある。オープンフレーバーはOpenClawとの互換性を維持しつつ、監査、分類、データロス防止シグナルを出力する。
実装には、セキュリティレビュー、204ケースのテストスイート、継続的インテグレーション対応のGitHub Actionsが伴います。
論文 参考訳(メタデータ) (2026-04-18T05:10:11Z) - Compiling Activation Steering into Weights via Null-Space Constraints for Stealthy Backdoors [48.881343993730844]
安全性に整合した大規模言語モデル(LLM)は、現実世界のパイプラインにますますデプロイされている。
敵は通常の評価では動作しないバックドアのチェックポイントを配布することができる。
最近のポストホック重み付け法は、そのようなバックドアを注入するための効率的なアプローチを提供する。
論文 参考訳(メタデータ) (2026-04-14T06:48:33Z) - Governing Dynamic Capabilities: Cryptographic Binding and Reproducibility Verification for AI Agent Tool Use [0.0]
既存のセキュリティレイヤでは、AIエージェントに何ができるか、それが主張するものを実行したのか、マルチエージェントインタラクションで何が起きたのかを検証できない。
既存のフレームワークはこれら2つを詳述し、サイレントな能力のエスカレーションを可能にし、検証済みの証明なしに相互作用を残す。
我々は3つのエージェントガバナンス要件を導出する:能力の完全性(G1)、行動の妥当性(G2)、相互作用監査性(G3)。
基本(Ed25519, SHA-256; 97 us verify)と拡張(BBS+選択開示、Groth16 DV-SNARK; 13.8 ms)の2つの暗号に依存しないインスタンス化で検証する。
論文 参考訳(メタデータ) (2026-03-15T11:46:57Z) - Zombie Agents: Persistent Control of Self-Evolving LLM Agents via Self-Reinforcing Injections [57.64370755825839]
セルフ進化エージェントはセッション間で内部状態を更新する。
我々はこのリスクを調査し、Zombie Agentと呼ばれる永続的な攻撃を形式化する。
我々は,攻撃者が制御するWebコンテンツを通じて間接的露光のみを使用するブラックボックス攻撃フレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-17T15:28:24Z) - Agent Identity URI Scheme: Topology-Independent Naming and Capability-Based Discovery for Multi-Agent Systems [0.0]
マルチエージェントシステムは基本的なアーキテクチャ上の欠陥に直面している。
我々は、トポロジから3つのコンポーネントを通してアイデンティティを分離する Agent:// scheme を提案する。
組織権限を確立する信頼根、階層的な能力パス、ソート可能なユニークな識別子は安定した参照を提供する。
論文 参考訳(メタデータ) (2026-01-21T01:09:22Z) - BackdoorAgent: A Unified Framework for Backdoor Attacks on LLM-based Agents [58.83028403414688]
大規模言語モデル(LLM)エージェントは、計画、メモリ、ツールの使用を組み合わせた多段階ワークフローを通じてタスクを実行する。
エージェントワークフローの特定のステージに注入されたバックドアトリガーは、複数の中間状態を通して持続し、下流出力に悪影響を及ぼす可能性がある。
LLMエージェントにおけるバックドア脅威を統一したエージェント中心のビューを提供するモジュールおよびステージアウェアフレームワークである textbfBackdoorAgent を提案する。
論文 参考訳(メタデータ) (2026-01-08T03:49:39Z) - Agentic JWT: A Secure Delegation Protocol for Autonomous AI Agents [0.6747475365990533]
エージェント設定の推論、プロンプトインジェクション、マルチエージェントオーケストレーションは、サイレントに特権を拡張することができる。
本稿では,エージェントのアクションをユーザインテントにバインドする2面インテントトークンであるAgentic JWT(A-JWT)を紹介する。
A-JWTはエージェントのアイデンティティを、そのプロンプト、ツール、設定から派生したワンウェイハッシュとして保持する。
論文 参考訳(メタデータ) (2025-09-16T23:43:24Z) - CANTXSec: A Deterministic Intrusion Detection and Prevention System for CAN Bus Monitoring ECU Activations [53.036288487863786]
物理ECUアクティベーションに基づく最初の決定論的侵入検知・防止システムであるCANTXSecを提案する。
CANバスの古典的な攻撃を検知・防止し、文献では調査されていない高度な攻撃を検知する。
物理テストベッド上での解法の有効性を実証し,攻撃の両クラスにおいて100%検出精度を達成し,100%のFIAを防止した。
論文 参考訳(メタデータ) (2025-05-14T13:37:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。