論文の概要: A deep Q-Learning based Path Planning and Navigation System for
Firefighting Environments
- arxiv url: http://arxiv.org/abs/2011.06450v1
- Date: Thu, 12 Nov 2020 15:43:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-26 06:33:24.796870
- Title: A deep Q-Learning based Path Planning and Navigation System for
Firefighting Environments
- Title(参考訳): 深層Q-Learningに基づく消防環境の経路計画とナビゲーションシステム
- Authors: Manish Bhattarai and Manel Martinez-Ramon
- Abstract要約: ストレス誘発性不整合と不安に免疫を持つQ-ラーニングに基づく深層エージェントを提案する。
概念実証として、Unreal Engineと呼ばれるゲームエンジンの構造的な火災を模倣する。
体験リプレイを利用して学習プロセスを加速し、エージェントの学習を人間由来の体験で増強する。
- 参考スコア(独自算出の注目度): 3.24890820102255
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Live fire creates a dynamic, rapidly changing environment that presents a
worthy challenge for deep learning and artificial intelligence methodologies to
assist firefighters with scene comprehension in maintaining their situational
awareness, tracking and relay of important features necessary for key decisions
as they tackle these catastrophic events. We propose a deep Q-learning based
agent who is immune to stress induced disorientation and anxiety and thus able
to make clear decisions for navigation based on the observed and stored facts
in live fire environments. As a proof of concept, we imitate structural fire in
a gaming engine called Unreal Engine which enables the interaction of the agent
with the environment. The agent is trained with a deep Q-learning algorithm
based on a set of rewards and penalties as per its actions on the environment.
We exploit experience replay to accelerate the learning process and augment the
learning of the agent with human-derived experiences. The agent trained under
this deep Q-learning approach outperforms agents trained through alternative
path planning systems and demonstrates this methodology as a promising
foundation on which to build a path planning navigation assistant capable of
safely guiding fire fighters through live fire environments.
- Abstract(参考訳): live fireはダイナミックで急速に変化する環境を作り、ディープラーニングと人工知能の方法論が消防士の状況認識の維持、重要な決定に必要な重要な機能を追跡し、リレーする上でのシーン理解を支援する。
そこで本研究では,ストレス誘発性不整合と不安に免疫を持つ深層Q学習エージェントを提案し,実火環境における観測および保存事実に基づくナビゲーションの明確な決定を可能にする。
概念実証として、エージェントと環境との相互作用を可能にするUnreal Engineと呼ばれるゲームエンジンにおける構造火災を模倣する。
エージェントは、環境に対する行動に応じて報酬と罰則のセットに基づいて、深いQ-ラーニングアルゴリズムで訓練される。
経験リプレイを利用して,学習プロセスを加速し,エージェントの学習を人間由来の体験で強化する。
この深層Q-ラーニングアプローチの下で訓練されたエージェントは、代替経路計画システムを通じて訓練されたエージェントよりも優れており、この方法論を、実火環境を安全に誘導できる経路計画ナビゲーションアシスタントを構築するための有望な基盤として実証している。
関連論文リスト
- Advancing Forest Fire Prevention: Deep Reinforcement Learning for Effective Firebreak Placement [2.4594411098435023]
本研究では,特に深層強化学習(Deep Reinforcement Learning)という人工知能技術を用いて,現場の火災発生問題に対処することを提案する。
我々は,森林環境内の火災発生箇所を学習し,良好な結果を得られる計算エージェントの実装に成功した。
提案手法は,40×40セル程度の問題事例の収束性を示し,この重要な問題に強化学習を適用する上で重要なマイルストーンとなる。
論文 参考訳(メタデータ) (2024-04-12T15:10:57Z) - HAZARD Challenge: Embodied Decision Making in Dynamically Changing
Environments [93.94020724735199]
HAZARDは、火災、洪水、風などの3つの予期せぬ災害シナリオで構成されている。
このベンチマークにより、さまざまなパイプラインで自律エージェントの意思決定能力を評価することができる。
論文 参考訳(メタデータ) (2024-01-23T18:59:43Z) - Robot path planning using deep reinforcement learning [0.0]
強化学習法は、地図のないナビゲーションタスクに代わる手段を提供する。
障害物回避と目標指向ナビゲーションタスクの両方に深部強化学習エージェントを実装した。
報酬関数の変更によるエージェントの挙動と性能の変化を解析する。
論文 参考訳(メタデータ) (2023-02-17T20:08:59Z) - Planning for Learning Object Properties [117.27898922118946]
我々は、物体特性を象徴的な計画問題として認識するために、ニューラルネットワークを自動的に訓練する問題を定式化する。
トレーニングデータセット作成と学習プロセスを自動化するための戦略を作成するために,計画手法を使用します。
シミュレーションと実環境の両方で実験的な評価を行う。
論文 参考訳(メタデータ) (2023-01-15T09:37:55Z) - Active Perception Applied To Unmanned Aerial Vehicles Through Deep
Reinforcement Learning [0.5161531917413708]
本研究は,水面構造物の追跡・認識の問題に取り組むことで,UAVのアクティブな認識に寄与することを目的としている。
本稿では,従来の画像処理技術とDeep-RL(Deep Reinforcement Learning, 深層強化学習)エージェントを用いて,環境を知覚し,不確実性に対処できることを示す。
論文 参考訳(メタデータ) (2022-09-13T22:51:34Z) - Automating Privilege Escalation with Deep Reinforcement Learning [71.87228372303453]
本研究では,エージェントの訓練に深層強化学習を用いることで,悪意あるアクターの潜在的な脅威を実証する。
本稿では,最先端の強化学習アルゴリズムを用いて,局所的な特権エスカレーションを行うエージェントを提案する。
我々のエージェントは、実際の攻撃センサーデータを生成し、侵入検知システムの訓練と評価に利用できる。
論文 参考訳(メタデータ) (2021-10-04T12:20:46Z) - Integrating Deep Learning and Augmented Reality to Enhance Situational
Awareness in Firefighting Environments [4.061135251278187]
文献の中では,消防士の状況認識を初めて構築するための,新たな4つのアプローチを提案する。
まず、深層畳み込みニューラルネットワーク(CNN)システムを用いて、熱画像から興味のある物体をリアルタイムで分類、同定した。
次に、オブジェクト検出、追跡、Mask RCNNフレームワークによるセグメンテーション、マルチモーダル自然言語処理(NLP)フレームワークによるシーン記述のためのCNNフレームワークを拡張した。
第3に、ストレスによる不整合と不安に免疫する深いQラーニングに基づくエージェントを構築し、観察結果に基づいて明確なナビゲーション決定を行う。
論文 参考訳(メタデータ) (2021-07-23T06:35:13Z) - Backprop-Free Reinforcement Learning with Active Neural Generative
Coding [84.11376568625353]
動的環境におけるエラー(バックプロップ)のバックプロパゲーションを伴わない行動駆動型生成モデルの学習のための計算フレームワークを提案する。
我々は、まばらな報酬でも機能するインテリジェントエージェントを開発し、推論として計画の認知理論からインスピレーションを得ている。
我々のエージェントの堅牢な性能は、神経推論と学習のためのバックプロップフリーアプローチがゴール指向の行動を促進するという有望な証拠を提供する。
論文 参考訳(メタデータ) (2021-07-10T19:02:27Z) - Adversarial Environment Generation for Learning to Navigate the Web [107.99759923626242]
Webナビゲーションエージェントのトレーニングのボトルネックの1つは、トレーニング環境の学習可能なカリキュラムを提供することです。
AEG(Adversarial Environment Generation)を使用して、強化学習(RL)エージェントを訓練する困難なWeb環境を生成することを提案する。
提案するフレキシブルb-PAIRED技術を用いて訓練したナビゲータエージェントは,競争力のある自動カリキュラム生成ベースラインを著しく上回ることを示す。
論文 参考訳(メタデータ) (2021-03-02T19:19:30Z) - An embedded deep learning system for augmented reality in firefighting
applications [2.750124853532832]
この研究は、ディープラーニング、ポイントクラウド、サーマルイメージング、拡張現実プラットフォームなど、最近の技術の進歩を実践している。
我々は、消防士の個人防護装置(PPE)に組み込まれたカメラからストリームされるデータを利用して、熱、RGB色、深度画像をキャプチャする、プロトタイプの組込みシステムの設計と構築を行った。
組込みシステムは、処理された画像をワイヤレスストリーミングで分析して返却し、拡張現実プラットフォームを使用してリモートで消防士に中継することができる。
論文 参考訳(メタデータ) (2020-09-22T16:55:44Z) - Safe Reinforcement Learning via Curriculum Induction [94.67835258431202]
安全クリティカルなアプリケーションでは、自律エージェントはミスが非常にコストがかかる環境で学ぶ必要がある。
既存の安全な強化学習手法は、エージェントが危険な状況を避けるために、事前にエージェントを頼りにしている。
本稿では,エージェントが自動インストラクターの指導の下で学習する,人間の指導にインスパイアされた代替手法を提案する。
論文 参考訳(メタデータ) (2020-06-22T10:48:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。