論文の概要: Risk-based implementation of COLREGs for autonomous surface vehicles
using deep reinforcement learning
- arxiv url: http://arxiv.org/abs/2112.00115v1
- Date: Tue, 30 Nov 2021 21:32:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-02 15:30:09.279992
- Title: Risk-based implementation of COLREGs for autonomous surface vehicles
using deep reinforcement learning
- Title(参考訳): 深部強化学習を用いた自動車用COLREGのリスクベース実装
- Authors: Thomas Nakken Larsen, Amalie Heiberg, Eivind Meyer, Adil Rasheeda,
Omer San, Damiano Varagnolo
- Abstract要約: 深層強化学習(DRL)は幅広い応用の可能性を示している。
本研究は,海上衝突防止国際規則(COLREG)のサブセットをDRLに基づく経路追従と障害物回避システムに組み込んだものである。
得られた自律エージェントは、訓練シナリオ、孤立した遭遇状況、実世界のシナリオのAISに基づくシミュレーションにおいて、経路追従とCOLREG準拠の衝突回避を動的に補間する。
- 参考スコア(独自算出の注目度): 1.304892050913381
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous systems are becoming ubiquitous and gaining momentum within the
marine sector. Since the electrification of transport is happening
simultaneously, autonomous marine vessels can reduce environmental impact,
lower costs, and increase efficiency. Although close monitoring is still
required to ensure safety, the ultimate goal is full autonomy. One major
milestone is to develop a control system that is versatile enough to handle any
weather and encounter that is also robust and reliable. Additionally, the
control system must adhere to the International Regulations for Preventing
Collisions at Sea (COLREGs) for successful interaction with human sailors.
Since the COLREGs were written for the human mind to interpret, they are
written in ambiguous prose and therefore not machine-readable or verifiable.
Due to these challenges and the wide variety of situations to be tackled,
classical model-based approaches prove complicated to implement and
computationally heavy. Within machine learning (ML), deep reinforcement
learning (DRL) has shown great potential for a wide range of applications. The
model-free and self-learning properties of DRL make it a promising candidate
for autonomous vessels. In this work, a subset of the COLREGs is incorporated
into a DRL-based path following and obstacle avoidance system using collision
risk theory. The resulting autonomous agent dynamically interpolates between
path following and COLREG-compliant collision avoidance in the training
scenario, isolated encounter situations, and AIS-based simulations of
real-world scenarios.
- Abstract(参考訳): 自律システムはユビキタスになり、海洋部門で勢いを増している。
輸送の電化が同時に起きているため、自律型海洋船は環境への影響を低減し、コストを下げ、効率を向上させることができる。
安全性を確保するには厳密な監視が必要であるが、最終的な目標は完全な自律性である。
主要なマイルストーンの1つは、天候や遭遇に十分対応し、堅牢で信頼性の高い制御システムを開発することである。
さらに、コントロールシステムは、人間の水兵との対話を成功させるために、海上での衝突防止国際規則(COLREG)に準拠しなければならない。
コレーグは人間の心が解釈できるように書かれたため、曖昧な散文で書かれており、機械可読性や検証性はない。
これらの課題と対処すべきさまざまな状況のため、古典的なモデルに基づくアプローチは実装が複雑で計算的に重い。
機械学習(ML)において、深層強化学習(DRL)は幅広い応用の可能性を示している。
DRLのモデルフリーおよび自己学習特性は、自律型船舶に有望な候補となる。
本研究では,衝突リスク理論を用いたdrlに基づく経路追従と障害物回避システムにcoregsのサブセットが組み込まれている。
得られた自律エージェントは、訓練シナリオ、孤立した遭遇状況、実世界のシナリオのAISに基づくシミュレーションにおいて、経路追従とCOLREG準拠の衝突回避を動的に補間する。
関連論文リスト
- Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models [60.87795376541144]
World Model(ワールドモデル)は、エージェントの次の状態を予測できるニューラルネットワークである。
エンド・ツー・エンドのトレーニングでは、人間のデモで観察された状態と整合してエラーから回復する方法を学ぶ。
クローズドループ試験における先行技術に有意な改善がみられた定性的,定量的な結果を示す。
論文 参考訳(メタデータ) (2024-09-25T06:48:25Z) - ReGentS: Real-World Safety-Critical Driving Scenario Generation Made Stable [88.08120417169971]
機械学習に基づく自律運転システムは、現実世界のデータでは稀な安全クリティカルなシナリオで課題に直面していることが多い。
この研究は、軌道最適化によって複雑な現実世界の通常のシナリオを変更することによって、安全クリティカルな運転シナリオを生成することを検討する。
提案手法は、頑健なプランナーの訓練には役に立たない非現実的な発散軌道と避けられない衝突シナリオに対処する。
論文 参考訳(メタデータ) (2024-09-12T08:26:33Z) - Aquatic Navigation: A Challenging Benchmark for Deep Reinforcement Learning [53.3760591018817]
ゲームエンジンとDeep Reinforcement Learningの統合の最近の進歩を利用して,水上ナビゲーションのための新しいベンチマーク環境を提案する。
具体的には、最も広く受け入れられているアルゴリズムの一つであるPPOに着目し、先進的なトレーニング手法を提案する。
実験により,これらの成分をうまく組み合わせることで,有望な結果が得られることが示された。
論文 参考訳(メタデータ) (2024-05-30T23:20:23Z) - Variational Autoencoders for exteroceptive perception in reinforcement learning-based collision avoidance [0.0]
Deep Reinforcement Learning (DRL) は有望な制御フレームワークとして登場した。
現在のDRLアルゴリズムは、ほぼ最適ポリシーを見つけるために不均等な計算資源を必要とする。
本稿では,海洋制御システムにおける提案手法の総合的な探索について述べる。
論文 参考訳(メタデータ) (2024-03-31T09:25:28Z) - Spacecraft Autonomous Decision-Planning for Collision Avoidance: a
Reinforcement Learning Approach [0.0]
本研究は、強化学習技術に基づく宇宙船における自律的なCA意思決定機能の実装を提案する。
提案フレームワークは,軌道上の破片の状態を不完全な監視し,正確な衝突回避策(CAM)を実行するためのポリシーをAIシステムが効果的に学習できるようにする。
目的は、CAMを自律的に実施するための意思決定プロセスを、人間の介入なしに宇宙船に委譲することである。
論文 参考訳(メタデータ) (2023-10-29T10:15:33Z) - Aeolus Ocean -- A simulation environment for the autonomous
COLREG-compliant navigation of Unmanned Surface Vehicles using Deep
Reinforcement Learning and Maritime Object Detection [0.0]
海上部門における無人水上機(USV)の航行自律性は、より安全な水と運用コストの削減につながる可能性がある。
本稿では, 現実的な海洋シミュレーション環境において, COLREG 準拠の DRL を用いた衝突回避航法システムの開発について述べる。
論文 参考訳(メタデータ) (2023-07-13T11:20:18Z) - Model-Based Reinforcement Learning with Isolated Imaginations [61.67183143982074]
モデルに基づく強化学習手法であるIso-Dream++を提案する。
我々は、切り離された潜在的想像力に基づいて政策最適化を行う。
これにより、野生の混合力学源を孤立させることで、長い水平振動子制御タスクの恩恵を受けることができる。
論文 参考訳(メタデータ) (2023-03-27T02:55:56Z) - Learned Risk Metric Maps for Kinodynamic Systems [54.49871675894546]
本研究では,高次元力学系のコヒーレントリスクメトリクスをリアルタイムに推定するための学習型リスクメトリクスマップを提案する。
LRMMモデルは設計と訓練が簡単で、障害セットの手続き的生成、状態と制御のサンプリング、および関数近似器の教師付きトレーニングのみを必要とする。
論文 参考訳(メタデータ) (2023-02-28T17:51:43Z) - Isolating and Leveraging Controllable and Noncontrollable Visual
Dynamics in World Models [65.97707691164558]
Iso-DreamはDream-to-Controlフレームワークを2つの側面で改善する。
まず、逆動力学を最適化することにより、世界モデルに制御可能で制御不能な情報源を学習させることを奨励する。
第2に、エージェントの挙動を世界モデルの切り離された潜在的想像力に最適化する。
論文 参考訳(メタデータ) (2022-05-27T08:07:39Z) - Deep Reinforcement Learning Controller for 3D Path-following and
Collision Avoidance by Autonomous Underwater Vehicles [0.0]
自律型水中車両のような複雑なシステムでは、意思決定は簡単ではない。
本稿では,最先端のDeep Reinforcement Learning(DRL)技術を用いた解を提案する。
本研究は,自律走行車システムにおける人間レベルの意思決定に向けた衝突回避と経路追従におけるDRLの実現可能性を示すものである。
論文 参考訳(メタデータ) (2020-06-17T11:54:53Z) - COLREG-Compliant Collision Avoidance for Unmanned Surface Vehicle using
Deep Reinforcement Learning [0.0]
追従と衝突回避は、無人表面船や他の自動運転車にとって、ロボット工学における2つの基本的なガイダンス問題である。
本稿では,連続制御タスクにおける最先端性能を示すDRLアルゴリズムであるPPOの可能性について検討する。
ノルウェー海の入り江であるトロンドハイム・フィヨルド(Trondheim Fjord)の高忠実な標高とAIS追跡データに基づいて、我々は訓練されたエージェントのパフォーマンスを挑戦的でダイナミックな実世界のシナリオで評価した。
論文 参考訳(メタデータ) (2020-06-16T22:05:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。