論文の概要: A Scalable Reinforcement Learning Approach for Attack Allocation in
Swarm to Swarm Engagement Problems
- arxiv url: http://arxiv.org/abs/2210.08319v1
- Date: Sat, 15 Oct 2022 15:36:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-18 17:41:23.934854
- Title: A Scalable Reinforcement Learning Approach for Attack Allocation in
Swarm to Swarm Engagement Problems
- Title(参考訳): swarmのswarmエンゲージメント問題に対する攻撃割当のためのスケーラブル強化学習手法
- Authors: Umut Demir and Nazim Kemal Ure
- Abstract要約: 本稿では,大規模なSwarmの密度を制御し,敵のSwarm攻撃に対処する強化学習フレームワークを提案する。
我々の主な貢献は、マルコフ決定プロセスとして、スワムエンゲージメント問題に対するスワムの定式化である。
開発したフレームワークは,大規模エンゲージメントシナリオを多種多様なシナリオで効率的に処理できることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this work we propose a reinforcement learning (RL) framework that controls
the density of a large-scale swarm for engaging with adversarial swarm attacks.
Although there is a significant amount of existing work in applying artificial
intelligence methods to swarm control, analysis of interactions between two
adversarial swarms is a rather understudied area. Most of the existing work in
this subject develop strategies by making hard assumptions regarding the
strategy and dynamics of the adversarial swarm. Our main contribution is the
formulation of the swarm to swarm engagement problem as a Markov Decision
Process and development of RL algorithms that can compute engagement strategies
without the knowledge of strategy/dynamics of the adversarial swarm. Simulation
results show that the developed framework can handle a wide array of
large-scale engagement scenarios in an efficient manner.
- Abstract(参考訳): 本研究では,敵集団攻撃に対処すべく,大規模群集の密度を制御する強化学習(rl)フレームワークを提案する。
人工知能をスワーミングコントロールに適用する作業には、すでにかなりの量があるが、2つの敵集団間の相互作用の分析は、あまり研究されていない領域である。
この主題の既存の研究のほとんどは、敵集団の戦略とダイナミクスについて厳しい仮定をすることで戦略を発展させている。
我々の主な貢献は、マルコフ決定プロセスとしてのswarm to swarmのエンゲージメント問題に対するswarmの定式化と、swarmの戦略やダイナミクスを知らずにエンゲージメント戦略を計算できるrlアルゴリズムの開発です。
シミュレーションの結果,開発フレームワークは大規模参加シナリオを効率的に処理できることが判明した。
関連論文リスト
- Hierarchical Reinforcement Learning for Swarm Confrontation with High Uncertainty [12.122881147337505]
未知の相手の戦略、動的な障害、不十分な訓練によって引き起こされる高い不確実性は、アクション空間をハイブリッドな決定プロセスに複雑化する。
本稿では,目標配置層,経路計画層,基礎となる動的相互作用機構からなる新しい階層型強化学習手法を提案する。
両層が導入した不安定なトレーニングプロセスを克服するために,事前学習とクロストレーニングを含む統合トレーニング手法を設計する。
論文 参考訳(メタデータ) (2024-06-12T05:12:10Z) - Decentralized Adversarial Training over Graphs [55.28669771020857]
機械学習モデルの敵攻撃に対する脆弱性は、近年、かなりの注目を集めている。
この研究は、個々のエージェントが様々な強度摂動空間に従属するグラフ上の敵の訓練を研究する。
論文 参考訳(メタデータ) (2023-03-23T15:05:16Z) - Strategy Synthesis in Markov Decision Processes Under Limited Sampling
Access [3.441021278275805]
グレーボックスマルコフ決定プロセス(MDP)によってモデル化された環境において、エージェントの作用の影響は後継状態の点で知られているが、関連する合成は知られていない。
本稿では,区間型MDPを内部モデルとして用いた強化学習により,グレーボックス型MDPの戦略アルゴリズムを考案する。
論文 参考訳(メタデータ) (2023-03-22T16:58:44Z) - Scalable Planning and Learning Framework Development for Swarm-to-Swarm
Engagement Problems [0.0]
本稿では,大規模なSwarmエンゲージメント問題に対処するための強化学習(RL)に基づくフレームワークを提案する。
有限時間キャプチャが一定の条件下で保証される様々なマルチエージェントPEシナリオをシミュレートする。
我々は大規模なSwarm-to-Swarmエンゲージメントシミュレーションにおけるアプローチを検証する。
論文 参考訳(メタデータ) (2022-12-06T12:08:09Z) - Scalable Task-Driven Robotic Swarm Control via Collision Avoidance and
Learning Mean-Field Control [23.494528616672024]
我々は、最先端平均場制御技術を用いて、多くのエージェントSwarm制御を分散の古典的な単一エージェント制御に変換する。
そこで我々は,衝突回避と平均場制御の学習を,知的ロボット群動作を牽引的に設計するための統一的な枠組みに統合する。
論文 参考訳(メタデータ) (2022-09-15T16:15:04Z) - Formation control with connectivity assurance for missile swarm: a
natural co-evolutionary strategy approach [0.0]
本稿では,ミサイル群の形成制御問題を解決するために,自然共進化戦略を活用するメタヒューリスティックアプローチを提案する。
局所的最適と不安定な進化の問題に焦点をあてて、我々は新しいモデルに基づく政策制約を取り入れた。
本稿では,ジェネリックフォーメーション制御問題をマルコフ決定過程(MDP)として扱い,反復学習により解くことが可能であることを示す。
論文 参考訳(メタデータ) (2022-08-24T07:54:06Z) - Improving robustness of jet tagging algorithms with adversarial training [56.79800815519762]
本研究では,フレーバータグ付けアルゴリズムの脆弱性について,敵攻撃による検証を行った。
シミュレーション攻撃の影響を緩和する対人訓練戦略を提案する。
論文 参考訳(メタデータ) (2022-03-25T19:57:19Z) - Improving Robustness of Reinforcement Learning for Power System Control
with Adversarial Training [71.7750435554693]
電力系統制御のために提案された最先端のRLエージェントが敵攻撃に対して脆弱であることを示す。
具体的には、敵のマルコフ決定プロセスを用いて攻撃方針を学習し、攻撃の有効性を実証する。
本稿では,RLエージェントの攻撃に対する堅牢性を高め,実行不可能な運用上の決定を回避するために,敵の訓練を利用することを提案する。
論文 参考訳(メタデータ) (2021-10-18T00:50:34Z) - Model-Agnostic Meta-Attack: Towards Reliable Evaluation of Adversarial
Robustness [53.094682754683255]
モデル非依存型メタアタック(MAMA)アプローチにより,より強力な攻撃アルゴリズムを自動検出する。
本手法は、繰り返しニューラルネットワークによってパラメータ化された逆攻撃を学習する。
本研究では,未知の防御を攻撃した場合の学習能力を向上させるために,モデルに依存しない訓練アルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-10-13T13:54:24Z) - A Hamiltonian Monte Carlo Method for Probabilistic Adversarial Attack
and Learning [122.49765136434353]
本稿では,HMCAM (Acumulated Momentum) を用いたハミルトニアンモンテカルロ法を提案する。
また, 対数的対数的対数的学習(Contrastive Adversarial Training, CAT)と呼ばれる新たな生成法を提案し, 対数的例の平衡分布にアプローチする。
いくつかの自然画像データセットと実用システムに関する定量的および定性的な解析により、提案アルゴリズムの優位性が確認された。
論文 参考訳(メタデータ) (2020-10-15T16:07:26Z) - Discrete Action On-Policy Learning with Action-Value Critic [72.20609919995086]
離散的な行動空間における強化学習(RL)は、実世界の応用では至るところで行われているが、その複雑さは行動空間次元とともに指数関数的に増大する。
我々は,行動値関数を推定し,相関行動に適用し,これらの評価値を組み合わせて勾配推定の分散を制御する。
これらの取り組みにより、分散制御技術に頼って、関連するRLアルゴリズムを実証的に上回る、新たな離散的なRLアルゴリズムが実現される。
論文 参考訳(メタデータ) (2020-02-10T04:23:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。