論文の概要: APIOT: Autonomous Vulnerability Management Across Bare-Metal Industrial OT Networks
- arxiv url: http://arxiv.org/abs/2605.02346v1
- Date: Mon, 04 May 2026 08:47:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.196878
- Title: APIOT: Autonomous Vulnerability Management Across Bare-Metal Industrial OT Networks
- Title(参考訳): APIOT: ベアメタル産業用OTネットワーク全体での自律的脆弱性管理
- Authors: Adel ElZemity, Budi Arief, Shujun Li, Calvin Brierley, Yichao Wang, Yuxiang Huang, James Pope, Haoxiang Li, George Oikonomou,
- Abstract要約: APIOTは、ベアメタルOTデバイスの自律的な攻撃と修復を示す最初の大きな言語モデルである。
人間の介入をステップバイステップせずに、完全な発見 -> エクスプロイト -> 検証サイクルを達成する。
ランタイムガバナンス層(監督層と呼ぶ)が重要なエンジニアリング変数であることに気付きました。
- 参考スコア(独自算出の注目度): 10.774830802685813
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Bare-metal operational technology (OT) devices -- especially the microcontrollers running Modbus/TCP and CoAP at the base of industrial control systems -- have remained outside the reach of autonomous security attacks. Prior autonomous pentesting studies target Linux and web systems, whose shells and filesystems are familiar to LLM agents. Bare-metal OT has neither, so agents must reason directly over protocol fields and parser semantics. This requires new action-space designs and runtime controls, and opens new research questions about protocol-level exploit reasoning and its deployment envelope. We present APIOT (Autonomous Purple-teaming for Industrial OT), the first large language model (LLM) framework demonstrating an autonomous attack and remediation of bare-metal OT devices, achieving the full discovery -> exploitation -> patching -> verification cycle without step-by-step human intervention. We implemented and evaluated this framework on Zephyr RTOS firmware across heterogeneous industrial IoT (IIoT) topologies. Through 290 experiment runs spanning five frontier LLMs, three network topologies, two impairment levels, and guided versus unguided conditions, APIOT achieved a mission success rate of 90.0% on the full attack-remediation cycle. We found that the runtime governance layer (which we call an overseer) is a critical engineering variable: without it, agents exhibit systematic degenerate patterns, including repetition loops, missing crash verification, and reconnaissance deadlocks. Together, these findings carry two implications beyond our testbed. Attacker expertise is no longer the binding constraint on bare-metal OT exploitation, and defender threat models must now assume LLM-augmented adversaries capable of executing autonomous discovery-through-remediation cycles against industrial firmware.
- Abstract(参考訳): ベアメタル・オペレーショナル・テクノロジー(OT)デバイス(特に産業制御システムの基盤でModbus/TCPとCoAPを実行するマイクロコントローラ)は、自律的なセキュリティ攻撃の範囲外にとどまっている。
以前の自律型ペンテスティング研究はLinuxとWebシステムをターゲットにしており、シェルとファイルシステムはLLMエージェントになじみがある。
ベアメタルOTは存在しないので、エージェントはプロトコルフィールドとパーサのセマンティクスを直接的に推論する必要がある。
これは新しいアクションスペース設計とランタイムコントロールを必要とし、プロトコルレベルのエクスプロイト推論とそのデプロイメントエンベロープに関する新しい研究質問を開きます。
本稿では,人間の介入を段階的に行なわずに,APIOT (Autonomous Purple-teaming for Industrial OT) を提案する。
ヘテロジニアス産業用IoT(IIoT)トポロジにわたって,Zephyr RTOSファームウェア上でこのフレームワークを実装し,評価した。
290の実験は5つのフロンティアLSM、ネットワークトポロジ、3つの障害レベル、2つの障害レベル、ガイドと誘導されていない条件にまたがって行われ、APIOTは全攻撃修復サイクルで90.0%のミッション成功率を達成した。
私たちはランタイムガバナンス層(監督層と呼ぶ)が重要なエンジニアリング変数であることに気付きました。それなしでは、エージェントは繰り返しループ、クラッシュ検証の欠如、偵察デッドロックを含む、系統的な退化パターンを示します。
これらの所見は, 検査室の外に2つの意味を持つ。
攻撃者の専門知識は、もはやベアメタルOT攻撃に対する拘束力ではなく、ディフェンダー脅威モデルでは、産業用ファームウェアに対する自律的な発見スルー修復サイクルを実行するLLM強化敵を仮定しなければならない。
関連論文リスト
- From Prompt to Physical Action: Structured Backdoor Attacks on LLM-Mediated Robotic Control Systems [3.6185608572339962]
大規模言語モデル(LLM)は、ユーザプロンプトを実行可能なコマンドに変換するために、ロボット制御パイプラインに統合される。
このデジタル・物理的インターフェースは、重要で未発見の脆弱性、すなわち微調整中に埋め込まれた構造化バックドア攻撃を導入している。
LLMによるROS2ロボット制御システムにおけるLoRAベースのサプライチェーンバックドアを実験的に検討し、ロボットの物理的実行への影響を評価する。
論文 参考訳(メタデータ) (2026-04-04T23:06:16Z) - T-MAP: Red-Teaming LLM Agents with Trajectory-aware Evolutionary Search [49.99459363244884]
提案手法は, 対向的プロンプトの発見を導くために, 実行トラジェクトリを利用するトラジェクトリ対応の進化探索手法であるT-MAPを提案する。
本手法は,安全ガードレールをバイパスするだけでなく,実際のツールインタラクションによる有害な目標を確実に実現するための攻撃の自動生成を可能にする。
論文 参考訳(メタデータ) (2026-03-21T12:33:34Z) - Systems-Level Attack Surface of Edge Agent Deployments on IoT [5.081228499547384]
3つのアーキテクチャ(クラウドホスト、エッジローカル、ハイブリッド)の実証セキュリティ分析を提示する。
実地テストベッドで観測された2つの緊急障害を含む,システムレベルの攻撃面を5つ同定した。
結果は、モデルやプロンプト設計だけでなく、デプロイメントアーキテクチャがエージェント制御IoTシステムにおけるセキュリティリスクの主要な決定要因であることを実証している。
論文 参考訳(メタデータ) (2026-02-26T01:48:46Z) - The Trojan Knowledge: Bypassing Commercial LLM Guardrails via Harmless Prompt Weaving and Adaptive Tree Search [58.8834056209347]
大規模言語モデル(LLM)は、有害な出力を誘導するために安全ガードレールをバイパスするジェイルブレイク攻撃に弱いままである。
CKA-Agent(Correlated Knowledge Attack Agent)は、ターゲットモデルの知識基盤の適応的木構造探索としてジェイルブレイクを再構成する動的フレームワークである。
論文 参考訳(メタデータ) (2025-12-01T07:05:23Z) - Hiding in the AI Traffic: Abusing MCP for LLM-Powered Agentic Red Teaming [0.0]
本稿では,モデルコンテキストプロトコル(MCP)を利用した新しいコマンド・アンド・コントロール(C2)アーキテクチャを導入し,適応型偵察エージェントを網羅的に協調する。
私たちのアーキテクチャは、システム全体のゴール指向の振る舞いを改善するだけでなく、コマンドとコントロールの振る舞いを完全に検出および防止するために使用できる主要なホストやネットワークアーティファクトを排除します。
論文 参考訳(メタデータ) (2025-11-20T02:51:04Z) - Adaptive Attacks on Trusted Monitors Subvert AI Control Protocols [80.68060125494645]
プロトコルとモニタモデルを知っている信頼できないモデルによるアダプティブアタックについて検討する。
我々は、攻撃者がモデル出力に公知またはゼロショットプロンプトインジェクションを埋め込む単純な適応攻撃ベクトルをインスタンス化する。
論文 参考訳(メタデータ) (2025-10-10T15:12:44Z) - A multi-layered embedded intrusion detection framework for programmable logic controllers [0.0]
本研究は,コントローラ内で動作し,ヘッダレベルのテレメトリを用いてネットワーク攻撃を検出し,応答する組込み侵入検知システムを提案する。
提案アーキテクチャは,産業システムのリアルタイム要件を満たす多層組込みセキュリティを提供する。
論文 参考訳(メタデータ) (2025-10-08T16:12:02Z) - Alignment Tipping Process: How Self-Evolution Pushes LLM Agents Off the Rails [103.05296856071931]
本稿では,自己進化型大規模言語モデル(LLM)エージェントに特有の,アライメント・ティッピング・プロセス(ATP)を同定する。
ATPは、連続的な相互作用によってエージェントが訓練中に確立されたアライメント制約を放棄し、強化された自己関心の戦略を支持するときに生じる。
実験の結果、アライメントの利点は自己進化の下で急速に低下し、最初は整合性のない状態に収束したモデルであることが判明した。
論文 参考訳(メタデータ) (2025-10-06T14:48:39Z) - BlindGuard: Safeguarding LLM-based Multi-Agent Systems under Unknown Attacks [58.959622170433725]
BlindGuardは、攻撃固有のラベルや悪意のある振る舞いに関する事前の知識を必要とせずに学習する、教師なしの防御方法である。
BlindGuardはマルチエージェントシステムにまたがる多様な攻撃タイプ(即時注入、メモリ中毒、ツール攻撃)を効果的に検出する。
論文 参考訳(メタデータ) (2025-08-11T16:04:47Z) - AutoPT: How Far Are We from the End2End Automated Web Penetration Testing? [54.65079443902714]
LLMによって駆動されるPSMの原理に基づく自動浸透試験エージェントであるAutoPTを紹介する。
以上の結果から, AutoPT は GPT-4o ミニモデル上でのベースラインフレームワーク ReAct よりも優れていた。
論文 参考訳(メタデータ) (2024-11-02T13:24:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。