論文の概要: Decision-making of Emergent Incident based on P-MADDPG
- arxiv url: http://arxiv.org/abs/2203.12673v1
- Date: Sat, 19 Mar 2022 09:48:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-27 05:41:59.003919
- Title: Decision-making of Emergent Incident based on P-MADDPG
- Title(参考訳): P-MADDPGに基づく創発的事象の意思決定
- Authors: Yibo Guo, Lishuo Hou, Mingxin Li, Yue Yuan, Shun Liu, Jingyi Xue,
Yafang Han, Mingliang Xu
- Abstract要約: 本稿では,緊急時の緊急意思決定問題を解決するために,P-MADDPGアルゴリズムを提案する。
P-MADDPGアルゴリズムは,異なるサイズのシナリオにおいて,他のアルゴリズムよりも早く,よりよく収束することを示す。
- 参考スコア(独自算出の注目度): 17.902549412730824
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, human casualties and damage to resources caused by emergent
incidents have become a serious problem worldwide. In this paper, we model the
emergency decision-making problem and use Multi-agent System (MAS) to solve the
problem that the decision speed cannot keep up with the spreading speed. MAS
can play an important role in the automated execution of these tasks to reduce
mission completion time. In this paper, we propose a P-MADDPG algorithm to
solve the emergency decision-making problem of emergent incidents, which
predicts the nodes where an incident may occur in the next time by GRU model
and makes decisions before the incident occurs, thus solving the problem that
the decision speed cannot keep up with the spreading speed. A simulation
environment was established for realistic scenarios, and three scenarios were
selected to test the performance of P-MADDPG in emergency decision-making
problems for emergent incidents: unmanned storage, factory assembly line, and
civil airport baggage transportation. Simulation results using the P-MADDPG
algorithm are compared with the greedy algorithm and the MADDPG algorithm, and
the final experimental results show that the P-MADDPG algorithm converges
faster and better than the other algorithms in scenarios of different sizes.
This shows that the P-MADDP algorithm is effective for emergency
decision-making in emergent incident.
- Abstract(参考訳): 近年,突発的な事故による人的被害や資源被害が世界中で深刻な問題となっている。
本稿では、緊急意思決定問題をモデル化し、マルチエージェントシステム(MAS)を用いて、決定速度が拡散速度に追従できないという問題を解決する。
MASはミッション完了時間を短縮するためにこれらのタスクの自動実行において重要な役割を果たす。
本稿では,次回にインシデントが発生しそうなノードを gru モデルで予測し,インシデント発生前に決定する創発的インシデントの緊急意思決定問題を解決する p-maddpg アルゴリズムを提案する。
現実的なシナリオを対象としたシミュレーション環境を構築し, 緊急時の緊急意思決定問題として, 無人貯蔵, 工場組立ライン, 市民空港荷物輸送の3つのシナリオを選定した。
P-MADDPGアルゴリズムを用いたシミュレーション結果とgreedyアルゴリズムとMADDPGアルゴリズムを比較し,P-MADDPGアルゴリズムは異なるサイズのシナリオにおいて,他のアルゴリズムよりも高速に収束することを示す。
P-MADDPアルゴリズムは緊急時の緊急意思決定に有効であることを示す。
関連論文リスト
- Increasing the Value of Information During Planning in Uncertain Environments [0.0]
我々は,情報収集行動の価値をよりよく反映して,最先端のオンライン計画を改善する新しいアルゴリズムを開発した。
結果,新しいアルゴリズムはPOMCPよりも高い性能を示した。
論文 参考訳(メタデータ) (2024-09-14T22:04:34Z) - Guidance Design for Escape Flight Vehicle Using Evolution Strategy Enhanced Deep Reinforcement Learning [6.037202026682975]
本研究では,DRLに基づく誘導コマンドと,比例航法に基づく追尾航法(PFV)に基づく誘導コマンドを生成するシナリオを考察する。
EFVの場合、誘導設計の目的は、与えられた回避距離によって課される制約を受けながら、残留速度を段階的に最大化することである。
最初のステップでは、近いポリシー最適化(PPO)アルゴリズムを使用して、EFVのガイダンスコマンドを生成する。
第2のステップでは、PPOの結果をモデルとして、進化戦略(ES)に基づくアルゴリズムの実行を提案する。
論文 参考訳(メタデータ) (2024-05-04T06:18:15Z) - Provably Efficient UCB-type Algorithms For Learning Predictive State
Representations [55.00359893021461]
逐次決定問題は、予測状態表現(PSR)によってモデル化された低ランク構造が認められる場合、統計的に学習可能である
本稿では,推定モデルと実モデル間の全変動距離を上限とする新しいボーナス項を特徴とする,PSRに対する最初のUCB型アプローチを提案する。
PSRに対する既存のアプローチとは対照的に、UCB型アルゴリズムは計算的トラクタビリティ、最優先の準最適ポリシー、モデルの精度が保証される。
論文 参考訳(メタデータ) (2023-07-01T18:35:21Z) - Robust Multi-Agent Pickup and Delivery with Delays [5.287544737925232]
MAPD(Multi-Agent Pickup and Delivery)は、エージェント群に対する衝突のない経路の計算の問題である。
MAPDの現在のアルゴリズムは、実際のアプリケーションで遭遇する現実的な問題の多くを考慮していない。
本稿では,不完全な実行の影響を抑える計画経路によって堅牢性を保証する2つの手法を提案する。
論文 参考訳(メタデータ) (2023-03-30T14:42:41Z) - Differentially Private Deep Q-Learning for Pattern Privacy Preservation
in MEC Offloading [76.0572817182483]
攻撃者は、エッジサーバ(ES)のキュー情報とユーザの使用パターンを推測するために、オフロードの決定を盗み取ることができる。
パターンプライバシ(PP)を維持しつつ,レイテンシ,ESのエネルギー消費,タスク削減率を両立させるオフロード戦略を提案する。
そこで我々はDP-DQOアルゴリズムを開発し,PP問題にノイズを注入することでこの問題に対処する。
論文 参考訳(メタデータ) (2023-02-09T12:50:18Z) - An Efficient Approach to the Online Multi-Agent Path Finding Problem by
Using Sustainable Information [10.367412630626834]
多エージェント経路探索(MAPF)は、衝突せずにエージェントをゴールへ移動させる問題である。
本稿では,持続可能な情報を活用したオンラインMAPFの3段階的解決手法を提案する。
我々のアルゴリズムは、エージェント数の設定が異なる場合、平均1.48倍の速度でSOTAより高速である。
論文 参考訳(メタデータ) (2023-01-11T13:04:35Z) - Multi-Objective Policy Gradients with Topological Constraints [108.10241442630289]
本稿では, PPOアルゴリズムの簡単な拡張により, TMDPにおけるポリシー勾配に対する新しいアルゴリズムを提案する。
シミュレーションと実ロボットの両方の目的を任意に並べた実世界の多目的ナビゲーション問題に対して,これを実証する。
論文 参考訳(メタデータ) (2022-09-15T07:22:58Z) - Computation Offloading and Resource Allocation in F-RANs: A Federated
Deep Reinforcement Learning Approach [67.06539298956854]
フォグ無線アクセスネットワーク(フォグ無線アクセスネットワーク、F-RAN)は、ユーザのモバイルデバイス(MD)が計算タスクを近くのフォグアクセスポイント(F-AP)にオフロードできる有望な技術である。
論文 参考訳(メタデータ) (2022-06-13T02:19:20Z) - The Multi-phase spatial meta-heuristic algorithm for public health
emergency transportation [0.0]
本研究では,レシーブ・リロード・ストア問題に対する効率的なアルゴリズムを設計することを目的とする。
我々は, p-median 問題をPOD に基づく緊急対応計画手順に適用する。
我々は,このアルゴリズムが短期・長期の意思決定と緊急計画のプロセスにどのように影響するかを示す。
論文 参考訳(メタデータ) (2021-07-05T22:34:42Z) - Combining Deep Learning and Optimization for Security-Constrained
Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。
SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。
本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-14T12:38:21Z) - Dynamic Multi-Robot Task Allocation under Uncertainty and Temporal
Constraints [52.58352707495122]
本稿では,不確実性およびマルチエージェント協調の下での逐次意思決定における重要な計算課題を分離するマルチロボット割当アルゴリズムを提案する。
都市におけるマルチアームコンベヤベルトピック・アンド・プレイスとマルチドローン配送ディスパッチの2つの異なる領域における広範囲なシミュレーション結果について検証を行った。
論文 参考訳(メタデータ) (2020-05-27T01:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。