論文の概要: MarineFormer: A Transformer-based Navigation Policy Model for Collision Avoidance in Marine Environment
- arxiv url: http://arxiv.org/abs/2410.13973v1
- Date: Thu, 17 Oct 2024 18:57:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-21 14:24:38.083900
- Title: MarineFormer: A Transformer-based Navigation Policy Model for Collision Avoidance in Marine Environment
- Title(参考訳): MarineFormer: 海洋環境における衝突回避のためのトランスフォーマーに基づくナビゲーションポリシーモデル
- Authors: Ehsan Kazemi, Iman Soltani,
- Abstract要約: 本研究では,高強度流路を有する高密度海洋環境における無人表面車両(USV)の航法問題について検討する。
静的および動的障害物から生じる複雑さと、電流の流れによって引き起こされる乱れの力により、既存の航法プロトコルは安全を確保できず、海上での衝突を避けるのに不十分である。
安全かつ効率的なロボットポリシーを学習するために,エージェントの静的・移動障害と環境からの流れの乱れを空間的・時間的に捉えるために,注意機構を活用する手法を提案する。
- 参考スコア(独自算出の注目度): 4.124419946355738
- License:
- Abstract: In this work, we investigate the problem of Unmanned Surface Vehicle (USV) navigation in a dense marine environment with a high-intensity current flow. The complexities arising from static and dynamic obstacles and the disturbance forces caused by current flow render existing navigation protocols inadequate for ensuring safety and avoiding collisions at sea. To learn a safe and efficient robot policy, we propose a novel methodology that leverages attention mechanisms to capture heterogeneous interactions of the agents with the static and moving obstacles and the flow disturbances from the environment in space and time. In particular, we refine a temporal function with MarineFormer, a Transformer navigation policy for spatially variable Marine environment, trained end-to-end with reinforcement learning (RL). MarineFormer uses foundational spatio-temporal graph attention with transformer architecture to process spatial attention and temporal sequences in an environment that simulates a 2D turbulent marine condition. We propose architectural modifications that improve the stability and learning speed of the recurrent models. The flow velocity estimation, which can be derived from flow simulations or sensors, is incorporated into a model-free RL framework to prevent the robot from entering into high-intensity current flow regions including intense vortices, while potentially leveraging the flow to assist in transportation. The investigated 2D marine environment encompasses flow singularities, including vortices, sinks, and sources, representing fundamental planar flow patterns associated with flood or maritime thunderstorms. Our proposed method is trained with a new reward model to deal with static and dynamic obstacles and disturbances from the current flow.
- Abstract(参考訳): 本研究では,高強度流路を有する高密度海洋環境における無人表面車両(USV)の航法問題について検討する。
静的および動的障害物から生じる複雑さと、電流の流れによって引き起こされる乱れの力は、既存のナビゲーションプロトコルを不適切なものにし、安全を確保し、海上での衝突を避ける。
安全かつ効率的なロボットポリシーを学習するために,エージェントと静的かつ移動的な障害物と環境からの流れの乱れを空間的・時間的に捉えるために,アテンション機構を利用した新しい手法を提案する。
特に、空間的に変化する海洋環境のためのトランスフォーマーナビゲーションポリシーであるMarineFormerを用いて、時間関数を洗練し、強化学習(RL)によるエンドツーエンドの訓練を行う。
MarineFormerは、2次元の乱流海洋条件をシミュレートする環境において、空間的注意と時間的シーケンスを処理するために、トランスフォーマーアーキテクチャを備えた基本時空間グラフアテンションを使用する。
本稿では、繰り返しモデルの安定性と学習速度を改善するアーキテクチャ修正を提案する。
フローシミュレーションやセンサから導出されるフロー速度推定をモデルフリーのRLフレームワークに組み込むことにより、ロボットが激しい渦を含む高強度電流領域に入るのを防止し、流動を利用して輸送を支援することができる。
調査した2次元海洋環境は, 渦, 沈み込み, 源泉を含む流れの特異点を含み, 洪水や海洋雷雨に伴う基礎的な平面流パターンを表現している。
提案手法は, 流れの静的および動的障害や乱れに対処する新たな報奨モデルを用いて訓練される。
関連論文リスト
- Monte Carlo Tree Search with Velocity Obstacles for safe and efficient motion planning in dynamic environments [49.30744329170107]
本稿では,動的障害物に関する情報を最小限に抑えた最適オンライン動作計画手法を提案する。
提案手法は,モデルシミュレーションによるオンライン最適計画のためのモンテカルロ木探索 (MCTS) と障害物回避のためのVelocity Obstacles (VO) を組み合わせた。
我々は,非線形モデル予測制御(NMPC)を含む最先端のプランナーに対して,衝突速度,計算,タスク性能の向上の観点から,我々の方法論の優位性を示す。
論文 参考訳(メタデータ) (2025-01-16T16:45:08Z) - Navigation World Models [68.58459393846461]
本稿では,過去の観測とナビゲーション行動に基づいて,将来の視覚観測を予測できる制御可能な映像生成モデルを提案する。
慣れ親しんだ環境では、NWMはナビゲーションの軌道をシミュレートし、目的を達成するかどうかを評価することで計画することができる。
実験は、スクラッチからの軌道計画や、外部ポリシーからサンプリングされた軌道のランク付けにおいて、その効果を実証する。
論文 参考訳(メタデータ) (2024-12-04T18:59:45Z) - Evaluating Robustness of Reinforcement Learning Algorithms for Autonomous Shipping [2.9109581496560044]
本稿では,自律型海運シミュレータにおける内陸水路輸送(IWT)のために実装されたベンチマークディープ強化学習(RL)アルゴリズムのロバスト性について検討する。
モデルのないアプローチはシミュレーターで適切なポリシーを達成でき、訓練中に遭遇したことのないポート環境をナビゲートすることに成功した。
論文 参考訳(メタデータ) (2024-11-07T17:55:07Z) - Deep-Sea A*+: An Advanced Path Planning Method Integrating Enhanced A* and Dynamic Window Approach for Autonomous Underwater Vehicles [1.3807821497779342]
深海環境における極度の環境は、水中での作戦に重大な課題をもたらす。
改良されたA*アルゴリズムと動的ウィンドウアプローチ(DWA)を統合した高度な経路計画手法を提案する。
提案手法は,経路の滑らかさ,障害物回避,リアルタイム性能の観点から,従来のA*アルゴリズムを超越した手法である。
論文 参考訳(メタデータ) (2024-10-22T07:29:05Z) - DiffuTraj: A Stochastic Vessel Trajectory Prediction Approach via Guided Diffusion Process [23.42712306116432]
船の操縦は、その固有の複雑さと不確定性によって特徴づけられ、船舶の軌道予測システムを必要とする。
従来の軌道予測法では, 容器運動の多モード性を表現するために潜伏変数を用いる。
我々は,不確実性から確実性への血管運動の遷移を明示的にシミュレートする。
論文 参考訳(メタデータ) (2024-10-12T14:50:18Z) - Model-Based Reinforcement Learning for Control of Strongly-Disturbed Unsteady Aerodynamic Flows [0.0]
本稿では,モデルに基づく強化学習(MBRL)手法を提案する。
モデルの堅牢性と一般化性は、2つの異なる流れ環境で実証される。
そこで本研究では,低次環境下で学んだ政策が,フルCFD環境における効果的な制御戦略に変換されることを実証する。
論文 参考訳(メタデータ) (2024-08-26T23:21:44Z) - HAZARD Challenge: Embodied Decision Making in Dynamically Changing
Environments [93.94020724735199]
HAZARDは、火災、洪水、風などの3つの予期せぬ災害シナリオで構成されている。
このベンチマークにより、さまざまなパイプラインで自律エージェントの意思決定能力を評価することができる。
論文 参考訳(メタデータ) (2024-01-23T18:59:43Z) - Alignment-free HDR Deghosting with Semantics Consistent Transformer [76.91669741684173]
高ダイナミックレンジイメージングは、複数の低ダイナミックレンジ入力から情報を取得し、リアルな出力を生成することを目的としている。
既存の手法では、前景やカメラの動きによって引き起こされる入力フレーム間の空間的ずれに焦点を当てることが多い。
本研究では,SCTNet(Semantics Consistent Transformer)を用いたアライメントフリーネットワークを提案する。
論文 参考訳(メタデータ) (2023-05-29T15:03:23Z) - ETPNav: Evolving Topological Planning for Vision-Language Navigation in
Continuous Environments [56.194988818341976]
視覚言語ナビゲーションは、エージェントが環境中をナビゲートするための指示に従う必要があるタスクである。
本研究では,1)環境を抽象化し,長距離航法計画を生成する能力,2)連続環境における障害物回避制御能力の2つの重要なスキルに焦点を当てたETPNavを提案する。
ETPNavは、R2R-CEとRxR-CEデータセットの先行技術よりも10%以上、20%改善されている。
論文 参考訳(メタデータ) (2023-04-06T13:07:17Z) - STVGFormer: Spatio-Temporal Video Grounding with Static-Dynamic
Cross-Modal Understanding [68.96574451918458]
静的分岐と動的分岐を用いて視覚言語依存をモデル化するSTVGというフレームワークを提案する。
静的分岐と動的分岐は、クロスモーダルトランスとして設計されている。
提案手法は39.6%のvIoUを達成し,HC-STVGの第1位を獲得した。
論文 参考訳(メタデータ) (2022-07-06T15:48:58Z) - DPMPC-Planner: A real-time UAV trajectory planning framework for complex
static environments with dynamic obstacles [0.9462808515258462]
安全なUAVナビゲーションは、複雑な環境構造、動的障害物、計測ノイズによる不確実性、予測不可能な移動障害物の挙動のために困難である。
本稿では,動的障害物を伴う複雑な静的環境を考慮した安全なナビゲーションを実現するための軌道計画フレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-14T23:51:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。