論文の概要: MarineFormer: A Spatio-Temporal Attention Model for USV Navigation in Dynamic Marine Environments
- arxiv url: http://arxiv.org/abs/2410.13973v3
- Date: Tue, 17 Dec 2024 22:20:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-19 13:23:32.066404
- Title: MarineFormer: A Spatio-Temporal Attention Model for USV Navigation in Dynamic Marine Environments
- Title(参考訳): MarineFormer: 動的海洋環境におけるUSVナビゲーションのための時空間注意モデル
- Authors: Ehsan Kazemi, Iman Soltani,
- Abstract要約: 海洋環境における自律的な航行は、アメリカ合衆国にとって大きな課題となっている。
本研究では,空間的注意と時間的注意という2つのタイプの注意を利用する新しい手法を提案する。
我々のアプローチは、エピソード完了の成功率で最先端の状態を20%近く上回ります。
- 参考スコア(独自算出の注目度): 4.124419946355738
- License:
- Abstract: Navigating autonomously in marine environments including dynamic and static obstacles, and strong flow disturbances, such as in high-flow rivers, poses significant challenges for USVs. To address these challenges, we propose a novel methodology that leverages two types of attention: spatial attention, which learns to integrate diverse environmental factors and sensory information into navigation decisions, and temporal attention within a transformer framework to account for the dynamic, continuously changing nature of the environment. We devise MarineFormer, a Trans${\bf \text{former}}$-based navigation policy for dynamic ${\bf \text{Marine}}$ environments, trained end-to-end through reinforcement learning (RL). At its core, MarineFormer uses graph attention to capture spatial information and a transformer architecture to process temporal sequences in an environment that simulates a 2D turbulent marine condition involving multiple static and dynamic obstacles. We extensively evaluate the performance of the proposed method versus the state-of-the-art methods, as well as other classical planners. Our approach outperforms the state-of-the-art by nearly $20\%$ in episode completion success rate and additionally enhances the USV's path length efficiency.
- Abstract(参考訳): 動的および静的な障害物を含む海洋環境や、高流量河川などの強い流れの乱れなど、自律的に航行することは、USVにとって大きな課題となっている。
これらの課題に対処するために, 多様な環境要因や感覚情報をナビゲーション決定に統合することを学ぶ空間的注意と, 環境の動的かつ継続的な変化を考慮に入れたトランスフォーマー・フレームワーク内の時間的注意という, 2つのタイプの注意を生かした方法論を提案する。
Trans${\bf \text{former}}$-based navigation policy for dynamic ${\bf \text{Marine}}$ environment, training end-to-end through reinforcement learning (RL。
MarineFormerのコアとなるのは、空間情報をキャプチャするグラフアテンションと、複数の静的および動的障害物を含む2次元乱流海洋条件をシミュレートする環境における時間的シーケンスを処理するトランスフォーマーアーキテクチャである。
我々は,提案手法と最先端手法,および他の古典的プランナの性能を広範囲に評価した。
提案手法は, エピソード完了成功率を20 %近く向上させ, さらにUSV のパス長効率を向上させる。
関連論文リスト
- Evaluating Robustness of Reinforcement Learning Algorithms for Autonomous Shipping [2.9109581496560044]
本稿では,自律型海運シミュレータにおける内陸水路輸送(IWT)のために実装されたベンチマークディープ強化学習(RL)アルゴリズムのロバスト性について検討する。
モデルのないアプローチはシミュレーターで適切なポリシーを達成でき、訓練中に遭遇したことのないポート環境をナビゲートすることに成功した。
論文 参考訳(メタデータ) (2024-11-07T17:55:07Z) - Deep-Sea A*+: An Advanced Path Planning Method Integrating Enhanced A* and Dynamic Window Approach for Autonomous Underwater Vehicles [1.3807821497779342]
深海環境における極度の環境は、水中での作戦に重大な課題をもたらす。
改良されたA*アルゴリズムと動的ウィンドウアプローチ(DWA)を統合した高度な経路計画手法を提案する。
提案手法は,経路の滑らかさ,障害物回避,リアルタイム性能の観点から,従来のA*アルゴリズムを超越した手法である。
論文 参考訳(メタデータ) (2024-10-22T07:29:05Z) - DiffuTraj: A Stochastic Vessel Trajectory Prediction Approach via Guided Diffusion Process [23.42712306116432]
船の操縦は、その固有の複雑さと不確定性によって特徴づけられ、船舶の軌道予測システムを必要とする。
従来の軌道予測法では, 容器運動の多モード性を表現するために潜伏変数を用いる。
我々は,不確実性から確実性への血管運動の遷移を明示的にシミュレートする。
論文 参考訳(メタデータ) (2024-10-12T14:50:18Z) - Model-Based Reinforcement Learning for Control of Strongly-Disturbed Unsteady Aerodynamic Flows [0.0]
本稿では,モデルに基づく強化学習(MBRL)手法を提案する。
モデルの堅牢性と一般化性は、2つの異なる流れ環境で実証される。
そこで本研究では,低次環境下で学んだ政策が,フルCFD環境における効果的な制御戦略に変換されることを実証する。
論文 参考訳(メタデータ) (2024-08-26T23:21:44Z) - TransFlower: An Explainable Transformer-Based Model with Flow-to-Flow
Attention for Commuting Flow Prediction [18.232085070775835]
通勤パターンの予測にフロー・ツー・フロー・アテンションを用いた,説明可能なトランスフォーマーベースのモデルであるTransFlowerを紹介した。
我々のモデルは、既存の手法を最大30.8%のCommon Part of Commutersで上回ります。
論文 参考訳(メタデータ) (2024-02-23T16:00:04Z) - SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - Learned Risk Metric Maps for Kinodynamic Systems [54.49871675894546]
本研究では,高次元力学系のコヒーレントリスクメトリクスをリアルタイムに推定するための学習型リスクメトリクスマップを提案する。
LRMMモデルは設計と訓練が簡単で、障害セットの手続き的生成、状態と制御のサンプリング、および関数近似器の教師付きトレーニングのみを必要とする。
論文 参考訳(メタデータ) (2023-02-28T17:51:43Z) - PDFormer: Propagation Delay-Aware Dynamic Long-Range Transformer for
Traffic Flow Prediction [78.05103666987655]
空間時空間グラフニューラルネットワーク(GNN)モデルは、この問題を解決する最も有望な方法の1つである。
本稿では,交通流の正確な予測を行うために,遅延を意識した動的長距離トランスフォーマー(PDFormer)を提案する。
提案手法は,最先端の性能を達成するだけでなく,計算効率の競争力も発揮できる。
論文 参考訳(メタデータ) (2023-01-19T08:42:40Z) - Manifold Interpolating Optimal-Transport Flows for Trajectory Inference [64.94020639760026]
最適輸送流(MIOFlow)を補間するマニフォールド補間法を提案する。
MIOFlowは、散発的なタイムポイントで撮影された静的スナップショットサンプルから、連続的な人口動態を学習する。
本手法は, 胚体分化および急性骨髄性白血病の治療から得られたscRNA-seqデータとともに, 分岐とマージによるシミュレーションデータについて検討した。
論文 参考訳(メタデータ) (2022-06-29T22:19:03Z) - Learning Robust Policy against Disturbance in Transition Dynamics via
State-Conservative Policy Optimization [63.75188254377202]
深層強化学習アルゴリズムは、ソースとターゲット環境の相違により、現実世界のタスクでは不十分な処理を行うことができる。
本研究では,前もって乱れをモデル化せずにロバストなポリシーを学習するための,モデルフリーなアクター批判アルゴリズムを提案する。
いくつかのロボット制御タスクの実験では、SCPOは遷移力学の乱れに対する堅牢なポリシーを学習している。
論文 参考訳(メタデータ) (2021-12-20T13:13:05Z) - Robust Reinforcement Learning with Wasserstein Constraint [49.86490922809473]
最適なロバストなポリシーの存在を示し、摂動に対する感度分析を行い、新しいロバストな学習アルゴリズムを設計する。
提案アルゴリズムの有効性はCart-Pole環境で検証する。
論文 参考訳(メタデータ) (2020-06-01T13:48:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。