論文の概要: Risk-based implementation of COLREGs for autonomous surface vehicles
using deep reinforcement learning
- arxiv url: http://arxiv.org/abs/2112.00115v1
- Date: Tue, 30 Nov 2021 21:32:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-02 15:30:09.279992
- Title: Risk-based implementation of COLREGs for autonomous surface vehicles
using deep reinforcement learning
- Title(参考訳): 深部強化学習を用いた自動車用COLREGのリスクベース実装
- Authors: Thomas Nakken Larsen, Amalie Heiberg, Eivind Meyer, Adil Rasheeda,
Omer San, Damiano Varagnolo
- Abstract要約: 深層強化学習(DRL)は幅広い応用の可能性を示している。
本研究は,海上衝突防止国際規則(COLREG)のサブセットをDRLに基づく経路追従と障害物回避システムに組み込んだものである。
得られた自律エージェントは、訓練シナリオ、孤立した遭遇状況、実世界のシナリオのAISに基づくシミュレーションにおいて、経路追従とCOLREG準拠の衝突回避を動的に補間する。
- 参考スコア(独自算出の注目度): 1.304892050913381
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous systems are becoming ubiquitous and gaining momentum within the
marine sector. Since the electrification of transport is happening
simultaneously, autonomous marine vessels can reduce environmental impact,
lower costs, and increase efficiency. Although close monitoring is still
required to ensure safety, the ultimate goal is full autonomy. One major
milestone is to develop a control system that is versatile enough to handle any
weather and encounter that is also robust and reliable. Additionally, the
control system must adhere to the International Regulations for Preventing
Collisions at Sea (COLREGs) for successful interaction with human sailors.
Since the COLREGs were written for the human mind to interpret, they are
written in ambiguous prose and therefore not machine-readable or verifiable.
Due to these challenges and the wide variety of situations to be tackled,
classical model-based approaches prove complicated to implement and
computationally heavy. Within machine learning (ML), deep reinforcement
learning (DRL) has shown great potential for a wide range of applications. The
model-free and self-learning properties of DRL make it a promising candidate
for autonomous vessels. In this work, a subset of the COLREGs is incorporated
into a DRL-based path following and obstacle avoidance system using collision
risk theory. The resulting autonomous agent dynamically interpolates between
path following and COLREG-compliant collision avoidance in the training
scenario, isolated encounter situations, and AIS-based simulations of
real-world scenarios.
- Abstract(参考訳): 自律システムはユビキタスになり、海洋部門で勢いを増している。
輸送の電化が同時に起きているため、自律型海洋船は環境への影響を低減し、コストを下げ、効率を向上させることができる。
安全性を確保するには厳密な監視が必要であるが、最終的な目標は完全な自律性である。
主要なマイルストーンの1つは、天候や遭遇に十分対応し、堅牢で信頼性の高い制御システムを開発することである。
さらに、コントロールシステムは、人間の水兵との対話を成功させるために、海上での衝突防止国際規則(COLREG)に準拠しなければならない。
コレーグは人間の心が解釈できるように書かれたため、曖昧な散文で書かれており、機械可読性や検証性はない。
これらの課題と対処すべきさまざまな状況のため、古典的なモデルに基づくアプローチは実装が複雑で計算的に重い。
機械学習(ML)において、深層強化学習(DRL)は幅広い応用の可能性を示している。
DRLのモデルフリーおよび自己学習特性は、自律型船舶に有望な候補となる。
本研究では,衝突リスク理論を用いたdrlに基づく経路追従と障害物回避システムにcoregsのサブセットが組み込まれている。
得られた自律エージェントは、訓練シナリオ、孤立した遭遇状況、実世界のシナリオのAISに基づくシミュレーションにおいて、経路追従とCOLREG準拠の衝突回避を動的に補間する。
関連論文リスト
- Controllable Safety-Critical Closed-loop Traffic Simulation via Guided
Diffusion [100.4988219600854]
誘導拡散モデルに根ざした新しいクローズドループシミュレーションフレームワークを提案する。
提案手法は, 現実の条件を密にエミュレートする現実的なロングテールシナリオの生成と, 制御性の向上という, 二つの異なる利点をもたらす。
我々はNuScenesデータセットを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - Spacecraft Autonomous Decision-Planning for Collision Avoidance: a
Reinforcement Learning Approach [0.0]
本研究は、強化学習技術に基づく宇宙船における自律的なCA意思決定機能の実装を提案する。
提案フレームワークは,軌道上の破片の状態を不完全な監視し,正確な衝突回避策(CAM)を実行するためのポリシーをAIシステムが効果的に学習できるようにする。
目的は、CAMを自律的に実施するための意思決定プロセスを、人間の介入なしに宇宙船に委譲することである。
論文 参考訳(メタデータ) (2023-10-29T10:15:33Z) - Toward collision-free trajectory for autonomous and pilot-controlled
unmanned aerial vehicles [1.018017727755629]
本研究は、高度衝突管理手法の開発において、PilotAware Ltdが入手した電子情報(EC)をより活用するものである。
DACM手法の利点は、空中衝突を避けるための広範囲なシミュレーションと実世界のフィールドテストによって実証されてきた。
論文 参考訳(メタデータ) (2023-09-18T18:24:31Z) - Aeolus Ocean -- A simulation environment for the autonomous
COLREG-compliant navigation of Unmanned Surface Vehicles using Deep
Reinforcement Learning and Maritime Object Detection [0.0]
海上部門における無人水上機(USV)の航行自律性は、より安全な水と運用コストの削減につながる可能性がある。
本稿では, 現実的な海洋シミュレーション環境において, COLREG 準拠の DRL を用いた衝突回避航法システムの開発について述べる。
論文 参考訳(メタデータ) (2023-07-13T11:20:18Z) - Convergence of Communications, Control, and Machine Learning for Secure
and Autonomous Vehicle Navigation [78.60496411542549]
接続された自動運転車(CAV)は、交通事故におけるヒューマンエラーを低減し、道路効率を向上し、様々なタスクを実行する。これらのメリットを享受するためには、CAVが目標とする目的地へ自律的にナビゲートする必要がある。
本稿では,通信理論,制御理論,機械学習の収束を利用して,効果的なCAVナビゲーションを実現する手法を提案する。
論文 参考訳(メタデータ) (2023-07-05T21:38:36Z) - Model-Based Reinforcement Learning with Isolated Imaginations [61.67183143982074]
モデルに基づく強化学習手法であるIso-Dream++を提案する。
我々は、切り離された潜在的想像力に基づいて政策最適化を行う。
これにより、野生の混合力学源を孤立させることで、長い水平振動子制御タスクの恩恵を受けることができる。
論文 参考訳(メタデータ) (2023-03-27T02:55:56Z) - Learned Risk Metric Maps for Kinodynamic Systems [54.49871675894546]
本研究では,高次元力学系のコヒーレントリスクメトリクスをリアルタイムに推定するための学習型リスクメトリクスマップを提案する。
LRMMモデルは設計と訓練が簡単で、障害セットの手続き的生成、状態と制御のサンプリング、および関数近似器の教師付きトレーニングのみを必要とする。
論文 参考訳(メタデータ) (2023-02-28T17:51:43Z) - Isolating and Leveraging Controllable and Noncontrollable Visual
Dynamics in World Models [65.97707691164558]
Iso-DreamはDream-to-Controlフレームワークを2つの側面で改善する。
まず、逆動力学を最適化することにより、世界モデルに制御可能で制御不能な情報源を学習させることを奨励する。
第2に、エージェントの挙動を世界モデルの切り離された潜在的想像力に最適化する。
論文 参考訳(メタデータ) (2022-05-27T08:07:39Z) - Deep Reinforcement Learning Controller for 3D Path-following and
Collision Avoidance by Autonomous Underwater Vehicles [0.0]
自律型水中車両のような複雑なシステムでは、意思決定は簡単ではない。
本稿では,最先端のDeep Reinforcement Learning(DRL)技術を用いた解を提案する。
本研究は,自律走行車システムにおける人間レベルの意思決定に向けた衝突回避と経路追従におけるDRLの実現可能性を示すものである。
論文 参考訳(メタデータ) (2020-06-17T11:54:53Z) - COLREG-Compliant Collision Avoidance for Unmanned Surface Vehicle using
Deep Reinforcement Learning [0.0]
追従と衝突回避は、無人表面船や他の自動運転車にとって、ロボット工学における2つの基本的なガイダンス問題である。
本稿では,連続制御タスクにおける最先端性能を示すDRLアルゴリズムであるPPOの可能性について検討する。
ノルウェー海の入り江であるトロンドハイム・フィヨルド(Trondheim Fjord)の高忠実な標高とAIS追跡データに基づいて、我々は訓練されたエージェントのパフォーマンスを挑戦的でダイナミックな実世界のシナリオで評価した。
論文 参考訳(メタデータ) (2020-06-16T22:05:58Z) - Intelligent Roundabout Insertion using Deep Reinforcement Learning [68.8204255655161]
本稿では,多忙なラウンドアバウンドの入場を交渉できる演習計画モジュールを提案する。
提案されたモジュールは、トレーニングされたニューラルネットワークに基づいて、操作の全期間にわたって、ラウンドアバウンドに入るタイミングと方法を予測する。
論文 参考訳(メタデータ) (2020-01-03T11:16:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。