論文の概要: Governed Capability Evolution for Embodied Agents: Safe Upgrade, Compatibility Checking, and Runtime Rollback for Embodied Capability Modules
- arxiv url: http://arxiv.org/abs/2604.08059v1
- Date: Thu, 09 Apr 2026 10:18:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.859494
- Title: Governed Capability Evolution for Embodied Agents: Safe Upgrade, Compatibility Checking, and Runtime Rollback for Embodied Capability Modules
- Title(参考訳): Embodied AgentのGoverned Capability Evolution:Safe Upgrade、Compatibility Checking、Embodied Capability ModulesのRuntime Rollback
- Authors: Xue Qin, Simin Luan, John See, Cong Yang, Zhijun Li,
- Abstract要約: エージェント自体を書き換えるのではなく、実行可能な機能を更新することで、時間とともに改善されることが期待されている。
ライフサイクルを意識したアップグレードフレームワークを提案し、新しい機能バージョンはすべて、管理されたデプロイメント候補として扱われる。
- 参考スコア(独自算出の注目度): 14.412476605788482
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Embodied agents are increasingly expected to improve over time by updating their executable capabilities rather than rewriting the agent itself. Prior work has separately studied modular capability packaging, capability evolution, and runtime governance. However, a key systems problem remains underexplored: once an embodied capability module evolves into a new version, how can the hosting system deploy it safely without breaking policy constraints, execution assumptions, or recovery guarantees? We formulate governed capability evolution as a first-class systems problem for embodied agents. We propose a lifecycle-aware upgrade framework in which every new capability version is treated as a governed deployment candidate rather than an immediately executable replacement. The framework introduces four upgrade compatibility checks -- interface, policy, behavioral, and recovery -- and organizes them into a staged runtime pipeline comprising candidate validation, sandbox evaluation, shadow deployment, gated activation, online monitoring, and rollback. We evaluate over 6 rounds of capability upgrade with 15 random seeds. Naive upgrade achieves 72.9% task success but drives unsafe activation to 60% by the final round; governed upgrade retains comparable success (67.4%) while maintaining zero unsafe activations across all rounds (Wilcoxon p=0.003). Shadow deployment reveals 40% of regressions invisible to sandbox evaluation alone, and rollback succeeds in 79.8% of post-activation drift scenarios.
- Abstract(参考訳): エージェント自体を書き換えるのではなく、実行可能な機能を更新することで、時間とともに改善されることが期待されている。
以前の作業では、モジュール機能のパッケージング、機能進化、ランタイムガバナンスを別々に研究しました。
実装された機能モジュールが新しいバージョンに進化すると、ホストシステムは、ポリシーの制約や実行の前提、リカバリの保証を破ることなく、どうやって安全にデプロイできるのか?
エージェントの第一級システム問題として機能進化を定式化する。
ライフサイクルを意識したアップグレードフレームワークを提案し、すべての新しい機能バージョンは、即時実行可能な置き換えではなく、管理されたデプロイメント候補として扱われる。
このフレームワークは、インターフェース、ポリシー、行動、リカバリの4つのアップグレード互換性チェックを導入し、候補検証、サンドボックス評価、シャドーデプロイメント、ゲートアクティベーション、オンライン監視、ロールバックを含むステージングランタイムパイプラインに編成する。
15個のランダムシードで6ラウンド以上の能力向上を評価した。
ネイブ・アップグレードは72.9%のタスク成功を達成しているが、最終ラウンドで60%まで安全でないアクティベーションを推進し、支配的なアップグレードは同等の成功(67.4%)を維持し、全ラウンドで安全でないアクティベーションをゼロに維持する(Wilcoxon p=0.003)。
シャドーデプロイメントでは、サンドボックス評価だけでは見えないレグレッションの40%が公開されており、ロールバックは、アクティベーション後のドリフトシナリオの79.8%で成功している。
関連論文リスト
- Learning Without Losing Identity: Capability Evolution for Embodied Agents [14.412476605788482]
エンボディエージェントのための機能中心進化パラダイムを提案する。
我々はロボットが認知的アイデンティティとして永続的なエージェントを維持するべきだと主張する。
エージェントアイデンティティから機能進化を分離する統合されたフレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-09T04:51:07Z) - ClawsBench: Evaluating Capability and Safety of LLM Productivity Agents in Simulated Workspaces [17.202580606345666]
生産性タスクを自動化するために、大規模言語モデル(LLM)エージェントがますますデプロイされる。
既存のベンチマークは単純化された環境に依存しており、現実的なマルチサービス環境をキャプチャできない。
我々は,現実的な生産性設定におけるLCMエージェントの評価と改善のためのベンチマークであるClawsBenchを紹介する。
論文 参考訳(メタデータ) (2026-04-06T21:09:06Z) - Zombie Agents: Persistent Control of Self-Evolving LLM Agents via Self-Reinforcing Injections [57.64370755825839]
セルフ進化エージェントはセッション間で内部状態を更新する。
我々はこのリスクを調査し、Zombie Agentと呼ばれる永続的な攻撃を形式化する。
我々は,攻撃者が制御するWebコンテンツを通じて間接的露光のみを使用するブラックボックス攻撃フレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-17T15:28:24Z) - Best-of-Q: Improving VLM agents with Q-function Action Ranking at Inference [4.943575742796223]
VLM(Vision-Language Models)は、エージェントがデジタル環境で自律的に操作するための強力なバックボーンとなっている。
これらのモデルは、Webのような高速に変化する環境に適応できない。
本稿では,エージェントVLMポリシーを政策再訓練なしで推論時に拡張するための新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2026-01-30T08:22:18Z) - DRIFT: Dynamic Rule-Based Defense with Injection Isolation for Securing LLM Agents [52.92354372596197]
大規模言語モデル(LLM)は、強力な推論と計画能力のため、エージェントシステムの中心となってきています。
この相互作用は、外部ソースからの悪意のある入力がエージェントの振る舞いを誤解させる可能性がある、インジェクション攻撃のリスクも引き起こす。
本稿では,信頼に値するエージェントシステムのための動的ルールベースの分離フレームワークを提案する。
論文 参考訳(メタデータ) (2025-06-13T05:01:09Z) - AegisLLM: Scaling Agentic Systems for Self-Reflective Defense in LLM Security [74.22452069013289]
AegisLLMは、敵の攻撃や情報漏洩に対する協調的なマルチエージェント防御である。
テスト時のエージェント推論システムのスケーリングは,モデルの有用性を損なうことなく,ロバスト性を大幅に向上させることを示す。
アンラーニングやジェイルブレイクを含む主要な脅威シナリオに対する総合的な評価は、AegisLLMの有効性を示している。
論文 参考訳(メタデータ) (2025-04-29T17:36:05Z) - RepliBench: Evaluating the Autonomous Replication Capabilities of Language Model Agents [2.058691706358809]
RepliBenchは、自律レプリケーション機能を測定するために設計された評価スイートである。
我々は5つのフロンティアモデルをベンチマークし、それらが現在、自己複製の信頼できる脅威を生じていないことを発見した。
我々が評価した最良のモデル(Claude 3.7 Sonnet)は、15/20タスクファミリで50%パス@10スコア、最も難しい亜種で9/20ファミリーで50%パス@10スコアである。
論文 参考訳(メタデータ) (2025-04-21T11:39:22Z) - Dissecting Adversarial Robustness of Multimodal LM Agents [70.2077308846307]
我々は、VisualWebArena上に現実的な脅威モデルを用いて、200の敵タスクと評価スクリプトを手動で作成する。
我々は,クロボックスフロンティアLMを用いた最新のエージェントを,リフレクションやツリーサーチを行うエージェントを含む,壊すことに成功している。
AREを使用して、新しいコンポーネントの追加に伴うロバスト性の変化を厳格に評価しています。
論文 参考訳(メタデータ) (2024-06-18T17:32:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。