論文の概要: Self-Adaptive Multi-Agent LLM-Based Security Pattern Selection for IoT Systems
- arxiv url: http://arxiv.org/abs/2605.00741v1
- Date: Fri, 01 May 2026 15:42:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 17:43:29.003863
- Title: Self-Adaptive Multi-Agent LLM-Based Security Pattern Selection for IoT Systems
- Title(参考訳): IoTシステムのための自己適応型マルチエージェントLDMに基づくセキュリティパターンの選択
- Authors: Saeid Jamshidi, Foutse Khomh, Carol Fung, Kawser Wazed Nafi,
- Abstract要約: セキュリティコントロールは、レイテンシ、エネルギ、計算上の制約の下で慎重に選択、組み合わせ、実行されなければならない。
既存のアプローチは静的なルールセットと学習ポリシーに依存しており、実現可能性、競合安全性、実行の正しさの保証が制限されている。
本稿では,Large Language Model(LLM)に基づく推論と決定論的強制を統合した,自己適応型マルチエージェントセキュリティパターン選択であるASPOを紹介する。
- 参考スコア(独自算出の注目度): 5.880950534553082
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The adoption of Internet of Things (IoT) systems at the network edge of smart architectures is increasing rapidly, intensifying the need for security mechanisms that are both adaptive and resource-efficient. In such environments, runtime defence mechanisms are no longer limited to detection alone but become a resource-constrained task of selecting mitigation actions. Security controls must be carefully selected, combined, and executed under latency, energy, and computational constraints, while preventing unsafe interactions between controls. Existing approaches predominantly rely on static rule sets and learned policies, which provide limited guarantees of feasibility, conflict safety, and execution correctness in resource-constrained edge settings. To address this limitation, we introduce ASPO, a self-adaptive multi-agent security pattern selection that integrates Large Language Model (LLM)-based reasoning with deterministic enforcement within a MAPE-K control loop. ASPO explicitly separates stochastic decision generation from execution: LLM agents propose candidate mitigation portfolios, while a deterministic optimisation core enforces closed-world action integrity, conflict-free composition, and resource feasibility at every decision epoch. We deploy ASPO on a distributed edge-gateway testbed and evaluate it across two workloads, each comprising 500 and 1000 runtime security decisions, using replayed IoT attack traffic. In addition, the results demonstrate invariant safety properties, including 100% conflict-free activation, consistent resource feasibility across workloads, and stable pattern dominance with perfect rank preservation. Importantly, deeper decision exploration reduces extreme-case execution costs, compressing tail latency and energy overheads by 21.9% and 23.1%, respectively, without increasing mean energy consumption.
- Abstract(参考訳): スマートアーキテクチャのネットワークエッジにおけるIoT(Internet of Things)システムの採用は急速に増加しており、適応性とリソース効率の両方のセキュリティメカニズムの必要性が増している。
このような環境では、ランタイム防御機構は検出のみに限定されるのではなく、緩和アクションを選択するためのリソース制約されたタスクになる。
セキュリティコントロールは、レイテンシ、エネルギ、計算上の制約の下で慎重に選択、組み合わせ、実行されなければならない。
既存のアプローチは主に静的なルールセットと学習ポリシーに依存しており、リソース制約のあるエッジ設定における実現可能性、競合安全性、実行の正しさの保証が制限されている。
この制限に対処するため、MAPE-K制御ループ内に大言語モデル(LLM)に基づく推論と決定的強制を組み込んだ自己適応型マルチエージェントセキュリティパターン選択であるASPOを導入する。
LLMエージェントは候補緩和ポートフォリオを提案し、決定論的最適化コアはクローズドワールドのアクション整合性、コンフリクトフリーコンポジション、リソース実現性をすべての決定エポックで実施する。
私たちは、分散エッジゲートウェイテストベッドにASPOをデプロイし、2つのワークロードで評価します。それぞれが、リプレイされたIoT攻撃トラフィックを使用して、500と1000のランタイムセキュリティ決定で構成されています。
さらに、100%のコンフリクトフリーアクティベーション、ワークロード間の一貫したリソース実現性、完全なランク保存による安定したパターン支配など、不変な安全性特性を示す。
重要なことは、より深い決定探索によって極端ケースの実行コストを削減し、平均エネルギー消費を増大させることなく、尾の遅延とエネルギーオーバーヘッドをそれぞれ21.9%、23.1%圧縮することである。
関連論文リスト
- DeFRiS: Silo-Cooperative IoT Applications Scheduling via Decentralized Federated Reinforcement Learning [62.347535250646196]
本稿では、ロバストでスケーラブルなシロコラボ型IoTアプリケーションスケジューリングのための分散フェデレーション強化学習フレームワークであるDeFRiSを提案する。
DeFRiSは、(i)異種サイロ間のシームレスな知識伝達を可能にするための候補資源スコアを利用したアクション空間非依存ポリシー、(ii)汎用アドバンテージ推定とクリッピングされたポリシー更新を組み合わせたサイロ最適化ローカル学習メカニズム、(iii)類似性認識の知識伝達と異常検出に勾配指紋を利用するDual-Track Non-IIDロバストな分散集約プロトコル、の3つのイノベーションを統合する。
論文 参考訳(メタデータ) (2026-03-16T02:02:38Z) - ODAR: Principled Adaptive Routing for LLM Reasoning via Active Inference [60.958331943869126]
ODAR-Expertは、原則化されたリソース割り当てによる精度と効率のトレードオフを最適化する適応的なルーティングフレームワークである。
我々は、MATHの98.2%の精度、HumanityのLast Examの54.8%を含む、強く一貫した利得を示している。
論文 参考訳(メタデータ) (2026-02-27T05:22:01Z) - ALPINE: A Lightweight and Adaptive Privacy-Decision Agent Framework for Dynamic Edge Crowdsensing [34.752121524751466]
ALPINEは軽量で適応的なフレームワークで、端末デバイスがリアルタイムに差分プライバシーレベルを調整できるようにする。
環境リスク評価に基づいて、プライバシゲイン、データユーティリティ、エネルギーコストのバランスをとる報酬関数を設計する。
協調リスクモデルと事前訓練されたTD3ベースのエージェントの両方が、低オーバーヘッドデプロイメント用に設計されている。
論文 参考訳(メタデータ) (2025-10-20T05:03:25Z) - MAD-PINN: A Decentralized Physics-Informed Machine Learning Framework for Safe and Optimal Multi-Agent Control [13.531665564516155]
大規模マルチエージェントシステムにおける安全性とパフォーマンスの最適化は、依然として根本的な課題である。
マルチエージェント状態制約最適制御問題を解くための分散機械学習フレームワークMAD-PINNを提案する。
マルチエージェントナビゲーションタスクの実験では、MAD-PINNは優れた安全性と性能のトレードオフを実現し、エージェントの数が増えるにつれてスケーラビリティを維持し、常に最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2025-09-28T16:31:22Z) - DRIFT: Dynamic Rule-Based Defense with Injection Isolation for Securing LLM Agents [52.92354372596197]
大規模言語モデル(LLM)は、強力な推論と計画能力のため、エージェントシステムの中心となってきています。
この相互作用は、外部ソースからの悪意のある入力がエージェントの振る舞いを誤解させる可能性がある、インジェクション攻撃のリスクも引き起こす。
本稿では,信頼に値するエージェントシステムのための動的ルールベースの分離フレームワークを提案する。
論文 参考訳(メタデータ) (2025-06-13T05:01:09Z) - Secure Resource Allocation via Constrained Deep Reinforcement Learning [49.15061461220109]
リソース割り当て、タスクオフロード、セキュリティ、パフォーマンスのバランスをとるフレームワークであるSARMTOを紹介します。
SARMTOは5つのベースラインアプローチを一貫して上回り、最大40%のシステムコスト削減を実現している。
これらの拡張は、複雑な分散コンピューティング環境におけるリソース管理に革命をもたらすSARMTOの可能性を強調している。
論文 参考訳(メタデータ) (2025-01-20T15:52:43Z) - Uniformly Safe RL with Objective Suppression for Multi-Constraint Safety-Critical Applications [73.58451824894568]
広く採用されているCMDPモデルは予測のリスクを制約しており、長い尾の州で危険な行動を起こす余地がある。
安全クリティカルな領域では、そのような行動は破滅的な結果をもたらす可能性がある。
本稿では,目標を最大化するタスク報酬を適応的に抑制する新しい手法であるObjective Suppressionを提案する。
論文 参考訳(メタデータ) (2024-02-23T23:22:06Z) - Learning Predictive Safety Filter via Decomposition of Robust Invariant
Set [6.94348936509225]
本稿では, RMPCとRL RLの併用による非線形システムの安全フィルタの合成について述べる。
本稿では,ロバストリーチ問題に対する政策アプローチを提案し,その複雑性を確立する。
論文 参考訳(メタデータ) (2023-11-12T08:11:28Z) - Decentralized Safe Multi-agent Stochastic Optimal Control using Deep
FBSDEs and ADMM [16.312625634442092]
本稿では,障害発生時のマルチエージェント制御のための,安全でスケーラブルな分散ソリューションを提案する。
分散化は、各エージェントの最適化変数、コピー変数、隣人への拡張によって達成される。
安全なコンセンサスソリューションを実現するために,ADMMベースのアプローチを取り入れた。
論文 参考訳(メタデータ) (2022-02-22T03:57:23Z) - Safe RAN control: A Symbolic Reinforcement Learning Approach [62.997667081978825]
本稿では,無線アクセスネットワーク(RAN)アプリケーションの安全管理のためのシンボル強化学習(SRL)アーキテクチャを提案する。
我々は、ユーザが所定のセルネットワークトポロジに対して高レベルの論理的安全性仕様を指定できる純粋に自動化された手順を提供する。
ユーザがシステムに意図仕様を設定するのを支援するために開発されたユーザインターフェース(UI)を導入し、提案するエージェントの動作の違いを検査する。
論文 参考訳(メタデータ) (2021-06-03T16:45:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。