論文の概要: MarineFormer: A Transformer-based Navigation Policy Model for Collision Avoidance in Marine Environment
- arxiv url: http://arxiv.org/abs/2410.13973v1
- Date: Thu, 17 Oct 2024 18:57:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-21 14:24:38.083900
- Title: MarineFormer: A Transformer-based Navigation Policy Model for Collision Avoidance in Marine Environment
- Title(参考訳): MarineFormer: 海洋環境における衝突回避のためのトランスフォーマーに基づくナビゲーションポリシーモデル
- Authors: Ehsan Kazemi, Iman Soltani,
- Abstract要約: 本研究では,高強度流路を有する高密度海洋環境における無人表面車両(USV)の航法問題について検討する。
静的および動的障害物から生じる複雑さと、電流の流れによって引き起こされる乱れの力により、既存の航法プロトコルは安全を確保できず、海上での衝突を避けるのに不十分である。
安全かつ効率的なロボットポリシーを学習するために,エージェントの静的・移動障害と環境からの流れの乱れを空間的・時間的に捉えるために,注意機構を活用する手法を提案する。
- 参考スコア(独自算出の注目度): 4.124419946355738
- License:
- Abstract: In this work, we investigate the problem of Unmanned Surface Vehicle (USV) navigation in a dense marine environment with a high-intensity current flow. The complexities arising from static and dynamic obstacles and the disturbance forces caused by current flow render existing navigation protocols inadequate for ensuring safety and avoiding collisions at sea. To learn a safe and efficient robot policy, we propose a novel methodology that leverages attention mechanisms to capture heterogeneous interactions of the agents with the static and moving obstacles and the flow disturbances from the environment in space and time. In particular, we refine a temporal function with MarineFormer, a Transformer navigation policy for spatially variable Marine environment, trained end-to-end with reinforcement learning (RL). MarineFormer uses foundational spatio-temporal graph attention with transformer architecture to process spatial attention and temporal sequences in an environment that simulates a 2D turbulent marine condition. We propose architectural modifications that improve the stability and learning speed of the recurrent models. The flow velocity estimation, which can be derived from flow simulations or sensors, is incorporated into a model-free RL framework to prevent the robot from entering into high-intensity current flow regions including intense vortices, while potentially leveraging the flow to assist in transportation. The investigated 2D marine environment encompasses flow singularities, including vortices, sinks, and sources, representing fundamental planar flow patterns associated with flood or maritime thunderstorms. Our proposed method is trained with a new reward model to deal with static and dynamic obstacles and disturbances from the current flow.
- Abstract(参考訳): 本研究では,高強度流路を有する高密度海洋環境における無人表面車両(USV)の航法問題について検討する。
静的および動的障害物から生じる複雑さと、電流の流れによって引き起こされる乱れの力は、既存のナビゲーションプロトコルを不適切なものにし、安全を確保し、海上での衝突を避ける。
安全かつ効率的なロボットポリシーを学習するために,エージェントと静的かつ移動的な障害物と環境からの流れの乱れを空間的・時間的に捉えるために,アテンション機構を利用した新しい手法を提案する。
特に、空間的に変化する海洋環境のためのトランスフォーマーナビゲーションポリシーであるMarineFormerを用いて、時間関数を洗練し、強化学習(RL)によるエンドツーエンドの訓練を行う。
MarineFormerは、2次元の乱流海洋条件をシミュレートする環境において、空間的注意と時間的シーケンスを処理するために、トランスフォーマーアーキテクチャを備えた基本時空間グラフアテンションを使用する。
本稿では、繰り返しモデルの安定性と学習速度を改善するアーキテクチャ修正を提案する。
フローシミュレーションやセンサから導出されるフロー速度推定をモデルフリーのRLフレームワークに組み込むことにより、ロボットが激しい渦を含む高強度電流領域に入るのを防止し、流動を利用して輸送を支援することができる。
調査した2次元海洋環境は, 渦, 沈み込み, 源泉を含む流れの特異点を含み, 洪水や海洋雷雨に伴う基礎的な平面流パターンを表現している。
提案手法は, 流れの静的および動的障害や乱れに対処する新たな報奨モデルを用いて訓練される。
関連論文リスト
- Evaluating Robustness of Reinforcement Learning Algorithms for Autonomous Shipping [2.9109581496560044]
本稿では,自律型海運シミュレータにおける内陸水路輸送(IWT)のために実装されたベンチマークディープ強化学習(RL)アルゴリズムのロバスト性について検討する。
モデルのないアプローチはシミュレーターで適切なポリシーを達成でき、訓練中に遭遇したことのないポート環境をナビゲートすることに成功した。
論文 参考訳(メタデータ) (2024-11-07T17:55:07Z) - Deep-Sea A*+: An Advanced Path Planning Method Integrating Enhanced A* and Dynamic Window Approach for Autonomous Underwater Vehicles [1.3807821497779342]
深海環境における極度の環境は、水中での作戦に重大な課題をもたらす。
改良されたA*アルゴリズムと動的ウィンドウアプローチ(DWA)を統合した高度な経路計画手法を提案する。
提案手法は,経路の滑らかさ,障害物回避,リアルタイム性能の観点から,従来のA*アルゴリズムを超越した手法である。
論文 参考訳(メタデータ) (2024-10-22T07:29:05Z) - DiffuTraj: A Stochastic Vessel Trajectory Prediction Approach via Guided Diffusion Process [23.42712306116432]
船の操縦は、その固有の複雑さと不確定性によって特徴づけられ、船舶の軌道予測システムを必要とする。
従来の軌道予測法では, 容器運動の多モード性を表現するために潜伏変数を用いる。
我々は,不確実性から確実性への血管運動の遷移を明示的にシミュレートする。
論文 参考訳(メタデータ) (2024-10-12T14:50:18Z) - Model-Based Reinforcement Learning for Control of Strongly-Disturbed Unsteady Aerodynamic Flows [0.0]
本稿では,モデルに基づく強化学習(MBRL)手法を提案する。
モデルの堅牢性と一般化性は、2つの異なる流れ環境で実証される。
そこで本研究では,低次環境下で学んだ政策が,フルCFD環境における効果的な制御戦略に変換されることを実証する。
論文 参考訳(メタデータ) (2024-08-26T23:21:44Z) - TransFlower: An Explainable Transformer-Based Model with Flow-to-Flow
Attention for Commuting Flow Prediction [18.232085070775835]
通勤パターンの予測にフロー・ツー・フロー・アテンションを用いた,説明可能なトランスフォーマーベースのモデルであるTransFlowerを紹介した。
我々のモデルは、既存の手法を最大30.8%のCommon Part of Commutersで上回ります。
論文 参考訳(メタデータ) (2024-02-23T16:00:04Z) - SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - Learned Risk Metric Maps for Kinodynamic Systems [54.49871675894546]
本研究では,高次元力学系のコヒーレントリスクメトリクスをリアルタイムに推定するための学習型リスクメトリクスマップを提案する。
LRMMモデルは設計と訓練が簡単で、障害セットの手続き的生成、状態と制御のサンプリング、および関数近似器の教師付きトレーニングのみを必要とする。
論文 参考訳(メタデータ) (2023-02-28T17:51:43Z) - PDFormer: Propagation Delay-Aware Dynamic Long-Range Transformer for
Traffic Flow Prediction [78.05103666987655]
空間時空間グラフニューラルネットワーク(GNN)モデルは、この問題を解決する最も有望な方法の1つである。
本稿では,交通流の正確な予測を行うために,遅延を意識した動的長距離トランスフォーマー(PDFormer)を提案する。
提案手法は,最先端の性能を達成するだけでなく,計算効率の競争力も発揮できる。
論文 参考訳(メタデータ) (2023-01-19T08:42:40Z) - Manifold Interpolating Optimal-Transport Flows for Trajectory Inference [64.94020639760026]
最適輸送流(MIOFlow)を補間するマニフォールド補間法を提案する。
MIOFlowは、散発的なタイムポイントで撮影された静的スナップショットサンプルから、連続的な人口動態を学習する。
本手法は, 胚体分化および急性骨髄性白血病の治療から得られたscRNA-seqデータとともに, 分岐とマージによるシミュレーションデータについて検討した。
論文 参考訳(メタデータ) (2022-06-29T22:19:03Z) - Learning Robust Policy against Disturbance in Transition Dynamics via
State-Conservative Policy Optimization [63.75188254377202]
深層強化学習アルゴリズムは、ソースとターゲット環境の相違により、現実世界のタスクでは不十分な処理を行うことができる。
本研究では,前もって乱れをモデル化せずにロバストなポリシーを学習するための,モデルフリーなアクター批判アルゴリズムを提案する。
いくつかのロボット制御タスクの実験では、SCPOは遷移力学の乱れに対する堅牢なポリシーを学習している。
論文 参考訳(メタデータ) (2021-12-20T13:13:05Z) - Robust Reinforcement Learning with Wasserstein Constraint [49.86490922809473]
最適なロバストなポリシーの存在を示し、摂動に対する感度分析を行い、新しいロバストな学習アルゴリズムを設計する。
提案アルゴリズムの有効性はCart-Pole環境で検証する。
論文 参考訳(メタデータ) (2020-06-01T13:48:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。