論文の概要: A Secure Learning Control Strategy via Dynamic Camouflaging for Unknown
Dynamical Systems under Attacks
- arxiv url: http://arxiv.org/abs/2102.00573v1
- Date: Mon, 1 Feb 2021 00:34:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-04 09:56:00.866263
- Title: A Secure Learning Control Strategy via Dynamic Camouflaging for Unknown
Dynamical Systems under Attacks
- Title(参考訳): 攻撃下の未知力学系に対する動的カモフラージュによるセキュアな学習制御戦略
- Authors: Sayak Mukherjee, Veronica Adetola
- Abstract要約: 本稿では、未知の線形時間不変サイバー物理システム(CPS)に対するセキュア強化学習(RL)に基づく制御手法を提案する。
本研究では,設計者による学習の探索段階において,攻撃者が動的モデルについて学習する攻撃シナリオについて考察する。
本稿では,動的カモフラージュに基づく攻撃耐性強化学習(ARRL)アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a secure reinforcement learning (RL) based control method
for unknown linear time-invariant cyber-physical systems (CPSs) that are
subjected to compositional attacks such as eavesdropping and covert attack. We
consider the attack scenario where the attacker learns about the dynamic model
during the exploration phase of the learning conducted by the designer to learn
a linear quadratic regulator (LQR), and thereafter, use such information to
conduct a covert attack on the dynamic system, which we refer to as doubly
learning-based control and attack (DLCA) framework. We propose a dynamic
camouflaging based attack-resilient reinforcement learning (ARRL) algorithm
which can learn the desired optimal controller for the dynamic system, and at
the same time, can inject sufficient misinformation in the estimation of system
dynamics by the attacker. The algorithm is accompanied by theoretical
guarantees and extensive numerical experiments on a consensus multi-agent
system and on a benchmark power grid model.
- Abstract(参考訳): 本稿では、盗聴や隠蔽攻撃などの構成攻撃を受ける未知の線形時間不変サイバー物理システム(CPS)に対するセキュア強化学習(RL)に基づく制御手法を提案する。
設計者が線形二次制御器(LQR)を学ぶために行う学習の探索段階で攻撃者が動的モデルについて学習する攻撃シナリオを検討し、その後、我々は二重学習ベースの制御と攻撃(DLCA)フレームワークと呼ばれる動的システムへの隠れた攻撃を実行するためにそのような情報を使用します。
本研究では,動的システムの最適制御器を学習し,同時に,攻撃者によるシステムダイナミクスの推定に十分な誤情報を注入することができる,動的迷彩に基づく攻撃回復力強化学習アルゴリズム(ARRL)を提案する。
このアルゴリズムには、コンセンサスマルチエージェントシステムとベンチマーク電力グリッドモデルに関する理論的保証と広範な数値実験が伴っている。
関連論文リスト
- Multi-agent Reinforcement Learning-based Network Intrusion Detection System [3.4636217357968904]
侵入検知システム(IDS)は,コンピュータネットワークのセキュリティ確保において重要な役割を担っている。
本稿では,自動,効率的,堅牢なネットワーク侵入検出が可能な,新しいマルチエージェント強化学習(RL)アーキテクチャを提案する。
我々のソリューションは、新しい攻撃の追加に対応し、既存の攻撃パターンの変更に効果的に適応するように設計されたレジリエントなアーキテクチャを導入します。
論文 参考訳(メタデータ) (2024-07-08T09:18:59Z) - Learning System Dynamics without Forgetting [60.08612207170659]
未知の力学を持つ系の軌道予測は、物理学や生物学を含む様々な研究分野において重要である。
本稿では,モードスイッチンググラフODE (MS-GODE) の新たなフレームワークを提案する。
生体力学の異なる多様な系を特徴とする生体力学システムの新しいベンチマークを構築した。
論文 参考訳(メタデータ) (2024-06-30T14:55:18Z) - Model Extraction Attacks Against Reinforcement Learning Based
Controllers [9.273077240506016]
本稿では,Reinforcement Learning (RL)アルゴリズムを用いてDNN(Deep Neural Network)コントローラをトレーニングし,システムを制御する際の設定に焦点を当てる。
オフラインフェーズとも呼ばれる第1フェーズでは、攻撃者はRL-リワード関数とシステムダイナミクスに関するサイドチャネル情報を使用して、未知のDNNの候補推定セットを特定する。
オンラインフェーズとも呼ばれる第2フェーズでは、攻撃者は未知のDNNの振る舞いを観察し、これらの観察を使用して最終的なポリシー推定のセットをショートリスト化する。
論文 参考訳(メタデータ) (2023-04-25T18:48:42Z) - Deep Reinforcement Learning for Cyber System Defense under Dynamic
Adversarial Uncertainties [5.78419291062552]
本稿では,データ駆動型深層強化学習フレームワークを提案する。
動的防御最適化問題は、異なる種類の敵に対する複数の保護姿勢で定式化される。
論文 参考訳(メタデータ) (2023-02-03T08:33:33Z) - Physics-Inspired Temporal Learning of Quadrotor Dynamics for Accurate
Model Predictive Trajectory Tracking [76.27433308688592]
クオーロタのシステムダイナミクスを正確にモデル化することは、アジャイル、安全、安定したナビゲーションを保証する上で非常に重要です。
本稿では,ロボットの経験から,四重項系の力学を純粋に学習するための新しい物理インスパイアされた時間畳み込みネットワーク(PI-TCN)を提案する。
提案手法は,スパース時間的畳み込みと高密度フィードフォワード接続の表現力を組み合わせて,正確なシステム予測を行う。
論文 参考訳(メタデータ) (2022-06-07T13:51:35Z) - Learning-Based Vulnerability Analysis of Cyber-Physical Systems [10.066594071800337]
本研究は,サイバー物理システムの脆弱性解析におけるディープラーニングの利用に焦点を当てる。
我々は,低レベル制御が拡張カルマンフィルタ(ekf)や異常検出器(anomaly detector)などに基づくcpsにおいて広く用いられている制御アーキテクチャを考える。
潜在的なセンシング攻撃が持つ影響を分析することを容易にするため、学習可能な攻撃生成器の開発が目的である。
論文 参考訳(メタデータ) (2021-03-10T06:52:26Z) - An RL-Based Adaptive Detection Strategy to Secure Cyber-Physical Systems [0.0]
ソフトウェアベースの制御への依存が高まり、サイバー物理システムの脆弱性が高まった。
攻撃シナリオから学んだ経験に基づいて,このような検出器のパラメータを適応的に設定する強化学習(RL)ベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-04T07:38:50Z) - Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。
軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。
NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文 参考訳(メタデータ) (2020-12-04T18:59:32Z) - Online Reinforcement Learning Control by Direct Heuristic Dynamic
Programming: from Time-Driven to Event-Driven [80.94390916562179]
時間駆動学習は、新しいデータが到着すると予測モデルのパラメータを継続的に更新する機械学習手法を指す。
ノイズなどの重要なシステムイベントによる時間駆動型dHDPの更新を防止することが望ましい。
イベント駆動型dHDPアルゴリズムは,従来の時間駆動型dHDPと比較して動作することを示す。
論文 参考訳(メタデータ) (2020-06-16T05:51:25Z) - Enhanced Adversarial Strategically-Timed Attacks against Deep
Reinforcement Learning [91.13113161754022]
本稿では,DRLに基づくナビゲーションシステムに対して,選択した時間フレーム上の物理ノイズパターンを妨害することにより,タイミングに基づく逆方向戦略を導入する。
実験結果から, 対向タイミング攻撃は性能低下を引き起こす可能性が示唆された。
論文 参考訳(メタデータ) (2020-02-20T21:39:25Z) - Information Theoretic Model Predictive Q-Learning [64.74041985237105]
本稿では,情報理論的MPCとエントロピー正規化RLとの新たな理論的関連性を示す。
バイアスモデルを利用したQ-ラーニングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2019-12-31T00:29:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。