Fugu-MT 論文翻訳(概要): MarineFormer: A Spatio-Temporal Attention Model for USV Navigation in Dynamic Marine Environments

論文の概要: MarineFormer: A Spatio-Temporal Attention Model for USV Navigation in Dynamic Marine Environments

arxiv url: http://arxiv.org/abs/2410.13973v3
Date: Tue, 17 Dec 2024 22:20:22 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-19 21:15:21.286327
Title: MarineFormer: A Spatio-Temporal Attention Model for USV Navigation in Dynamic Marine Environments
Title（参考訳）: MarineFormer: 動的海洋環境におけるUSVナビゲーションのための時空間注意モデル
Authors: Ehsan Kazemi, Iman Soltani,
Abstract要約: 海洋環境における自律的な航行は、アメリカ合衆国にとって大きな課題となっている。本研究では,空間的注意と時間的注意という2つのタイプの注意を利用する新しい手法を提案する。我々のアプローチは、エピソード完了の成功率で最先端の状態を20%近く上回ります。
参考スコア（独自算出の注目度）: 4.124419946355738
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Navigating autonomously in marine environments including dynamic and static obstacles, and strong flow disturbances, such as in high-flow rivers, poses significant challenges for USVs. To address these challenges, we propose a novel methodology that leverages two types of attention: spatial attention, which learns to integrate diverse environmental factors and sensory information into navigation decisions, and temporal attention within a transformer framework to account for the dynamic, continuously changing nature of the environment. We devise MarineFormer, a Trans${\bf \text{former}}$-based navigation policy for dynamic ${\bf \text{Marine}}$ environments, trained end-to-end through reinforcement learning (RL). At its core, MarineFormer uses graph attention to capture spatial information and a transformer architecture to process temporal sequences in an environment that simulates a 2D turbulent marine condition involving multiple static and dynamic obstacles. We extensively evaluate the performance of the proposed method versus the state-of-the-art methods, as well as other classical planners. Our approach outperforms the state-of-the-art by nearly $20\%$ in episode completion success rate and additionally enhances the USV's path length efficiency.
Abstract（参考訳）: 動的および静的な障害物を含む海洋環境や、高流量河川などの強い流れの乱れなど、自律的に航行することは、USVにとって大きな課題となっている。これらの課題に対処するために, 多様な環境要因や感覚情報をナビゲーション決定に統合することを学ぶ空間的注意と, 環境の動的かつ継続的な変化を考慮に入れたトランスフォーマー・フレームワーク内の時間的注意という, 2つのタイプの注意を生かした方法論を提案する。 Trans${\bf \text{former}}$-based navigation policy for dynamic ${\bf \text{Marine}}$ environment, training end-to-end through reinforcement learning (RL。 MarineFormerのコアとなるのは、空間情報をキャプチャするグラフアテンションと、複数の静的および動的障害物を含む2次元乱流海洋条件をシミュレートする環境における時間的シーケンスを処理するトランスフォーマーアーキテクチャである。我々は,提案手法と最先端手法,および他の古典的プランナの性能を広範囲に評価した。提案手法は, エピソード完了成功率を20 %近く向上させ, さらにUSV のパス長効率を向上させる。

関連論文リスト

Digital Twin Supervised Reinforcement Learning Framework for Autonomous Underwater Navigation [0.0]
本稿では,科学実験に広く利用されているオープンプラットフォームであるBlueROV2の事例を通して,課題を考察する。本稿では,PPOアルゴリズムに基づく深層強化学習手法を提案する。以上の結果から, PPO政策は高度に乱雑な環境でのDWAを一貫して上回っていることが示唆された。
論文参考訳（メタデータ） (2025-12-11T18:52:42Z)
IndustryNav: Exploring Spatial Reasoning of Embodied Agents in Dynamic Industrial Navigation [56.43007596544299]
IndustryNavは、アクティブな空間推論のための最初の動的産業用ナビゲーションベンチマークである。 9つの最先端のVisual Large Language Modelsの研究によると、クローズドソースモデルは一貫した優位性を維持している。
論文参考訳（メタデータ） (2025-11-21T16:48:49Z)
Unified Multimodal Vessel Trajectory Prediction with Explainable Navigation Intention [18.699213433572996]
船舶軌道予測は、インテリジェント海洋システムの基本である。既存の船舶軌道予測手法は、限られたシナリオ適用性と説明性に乏しい。本稿では,説明可能なナビゲーション意図を取り入れた統合型船舶軌道予測フレームワークを提案する。
論文参考訳（メタデータ） (2025-11-18T08:56:30Z)
Secure Low-altitude Maritime Communications via Intelligent Jamming [53.42658269206017]
低高度無線ネットワーク (LAWN) は海上通信の有効なソリューションとして登場している。オープンで明確なUAV通信チャネルは、海上のLAWNを盗聴攻撃に対して脆弱にする。本稿では,動的盗難対策にインテリジェントジャミングを用いた低高度海上通信システムを提案する。
論文参考訳（メタデータ） (2025-11-10T03:16:19Z)
E-MoFlow: Learning Egomotion and Optical Flow from Event Data via Implicit Regularization [38.46024197872764]
オプティカルフローと6-DoFエゴモーションの推定は、通常独立して対処されてきた。ニューロモルフィック・ビジョンでは、ロバストなデータアソシエーションが欠如しているため、この2つの問題を別々に解決することは不十分な課題である。本研究では,暗黙の空間的時間的・幾何学的正則化を通じて,運動と光の流れを協調的に最適化する,教師なしのフレームワークを提案する。
論文参考訳（メタデータ） (2025-10-14T17:33:44Z)
DUViN: Diffusion-Based Underwater Visual Navigation via Knowledge-Transferred Depth Features [47.88998580611257]
本研究では,知識伝達深度特性を用いた拡散型水中ビジュアルナビゲーションポリシーDUViNを提案する。 DuViNは、事前に構築された地図に頼ることなく、障害物を回避し、地形に対して安全かつ認識の高い高度を維持するよう車両を誘導する。シミュレーションおよび実世界の水中環境における実験は、我々のアプローチの有効性と一般化を実証している。
論文参考訳（メタデータ） (2025-09-03T03:43:12Z)
Forecasting Continuous Non-Conservative Dynamical Systems in SO(3) [51.510040541600176]
コンピュータビジョンにおける移動物体の回転をモデル化するための新しい手法を提案する。我々のアプローチは、入力ノイズに対して頑健でありながら、エネルギーと運動量保存に非依存である。トレーニング中の雑音状態から物体のダイナミクスを近似させることで、シミュレーションや様々な現実世界の設定において頑健な外挿能力が得られる。
論文参考訳（メタデータ） (2025-08-11T09:03:10Z)
From Seeing to Experiencing: Scaling Navigation Foundation Models with Reinforcement Learning [59.88543114325153]
本稿では,航法基礎モデルの強化学習能力を高めるためのSeeing-to-Experiencingフレームワークを提案する。 S2Eは、ビデオの事前トレーニングとRLによるポストトレーニングの長所を組み合わせたものだ。実世界のシーンを3DGSで再現した3D画像に基づく総合的なエンドツーエンド評価ベンチマークであるNavBench-GSを構築した。
論文参考訳（メタデータ） (2025-07-29T17:26:10Z)
Situationally-Aware Dynamics Learning [57.698553219660376]
隠れ状態表現のオンライン学習のための新しいフレームワークを提案する。提案手法は、非観測パラメータが遷移力学と報酬構造の両方に与える影響を明示的にモデル化する。シミュレーションと実世界の両方の実験は、データ効率、ポリシー性能、安全で適応的なナビゲーション戦略の出現を著しく改善した。
論文参考訳（メタデータ） (2025-05-26T06:40:11Z)
Depth-Constrained ASV Navigation with Deep RL and Limited Sensing [45.77464360746532]
本研究では,深度制約下でのASVナビゲーションのための強化学習フレームワークを提案する。環境意識を高めるため,GPレグレッションをRLフレームワークに統合する。我々は,実世界の水環境に対して,訓練された政策が適切に一般化されることを保証する効果的なシミュレート・トゥ・リアル・トランスファーを実証する。
論文参考訳（メタデータ） (2025-04-25T10:56:56Z)
Learning Underwater Active Perception in Simulation [51.205673783866146]
タービディティは、検査された構造物の正確な視覚的記録を阻止する可能性があるため、ミッション全体を危険に晒す可能性がある。従来の研究は、濁度や後方散乱に適応する手法を導入してきた。本研究では, 広範囲の水環境下での高品質な画像取得を実現するための, 単純かつ効率的なアプローチを提案する。
論文参考訳（メタデータ） (2025-04-23T06:48:38Z)
Image-Based Relocalization and Alignment for Long-Term Monitoring of Dynamic Underwater Environments [57.59857784298534]
本稿では,視覚的位置認識(VPR),特徴マッチング,画像分割を組み合わせた統合パイプラインを提案する。本手法は, 再検討領域のロバスト同定, 剛性変換の推定, 生態系変化の下流解析を可能にする。
論文参考訳（メタデータ） (2025-03-06T05:13:19Z)
Monte Carlo Tree Search with Velocity Obstacles for safe and efficient motion planning in dynamic environments [49.30744329170107]
本稿では,動的障害物に関する情報を最小限に抑えた最適オンライン動作計画手法を提案する。提案手法は,モデルシミュレーションによるオンライン最適計画のためのモンテカルロ木探索 (MCTS) と障害物回避のためのVelocity Obstacles (VO) を組み合わせた。我々は,非線形モデル予測制御(NMPC)を含む最先端のプランナーに対して,衝突速度,計算,タスク性能の向上の観点から,我々の方法論の優位性を示す。
論文参考訳（メタデータ） (2025-01-16T16:45:08Z)
Navigation World Models [68.58459393846461]
本稿では,過去の観測とナビゲーション行動に基づいて,将来の視覚観測を予測できる制御可能な映像生成モデルを提案する。慣れ親しんだ環境では、NWMはナビゲーションの軌道をシミュレートし、目的を達成するかどうかを評価することで計画することができる。実験は、スクラッチからの軌道計画や、外部ポリシーからサンプリングされた軌道のランク付けにおいて、その効果を実証する。
論文参考訳（メタデータ） (2024-12-04T18:59:45Z)
Evaluating Robustness of Reinforcement Learning Algorithms for Autonomous Shipping [2.9109581496560044]
本稿では,自律型海運シミュレータにおける内陸水路輸送(IWT)のために実装されたベンチマークディープ強化学習(RL)アルゴリズムのロバスト性について検討する。モデルのないアプローチはシミュレーターで適切なポリシーを達成でき、訓練中に遭遇したことのないポート環境をナビゲートすることに成功した。
論文参考訳（メタデータ） (2024-11-07T17:55:07Z)
Deep-Sea A*+: An Advanced Path Planning Method Integrating Enhanced A* and Dynamic Window Approach for Autonomous Underwater Vehicles [1.3807821497779342]
深海環境における極度の環境は、水中での作戦に重大な課題をもたらす。改良されたA*アルゴリズムと動的ウィンドウアプローチ(DWA)を統合した高度な経路計画手法を提案する。提案手法は,経路の滑らかさ,障害物回避,リアルタイム性能の観点から,従来のA*アルゴリズムを超越した手法である。
論文参考訳（メタデータ） (2024-10-22T07:29:05Z)
DiffuTraj: A Stochastic Vessel Trajectory Prediction Approach via Guided Diffusion Process [23.42712306116432]
船の操縦は、その固有の複雑さと不確定性によって特徴づけられ、船舶の軌道予測システムを必要とする。従来の軌道予測法では, 容器運動の多モード性を表現するために潜伏変数を用いる。我々は,不確実性から確実性への血管運動の遷移を明示的にシミュレートする。
論文参考訳（メタデータ） (2024-10-12T14:50:18Z)
FAFA: Frequency-Aware Flow-Aided Self-Supervision for Underwater Object Pose Estimation [65.01601309903971]
無人水中車両(UUV)の6次元ポーズ推定のための周波数認識フロー支援フレームワークであるFAFAを紹介する。我々のフレームワークは、3DモデルとRGB画像のみに依存しており、実際のポーズアノテーションや奥行きのような非モダリティデータの必要性を軽減しています。本研究では,一般的な水中オブジェクトポーズベンチマークにおけるFAFAの有効性を評価し,最先端手法と比較して顕著な性能向上を示した。
論文参考訳（メタデータ） (2024-09-25T03:54:01Z)
Model-Based Reinforcement Learning for Control of Strongly-Disturbed Unsteady Aerodynamic Flows [0.0]
本稿では,モデルに基づく強化学習(MBRL)手法を提案する。モデルの堅牢性と一般化性は、2つの異なる流れ環境で実証される。そこで本研究では,低次環境下で学んだ政策が,フルCFD環境における効果的な制御戦略に変換されることを実証する。
論文参考訳（メタデータ） (2024-08-26T23:21:44Z)
TransFlower: An Explainable Transformer-Based Model with Flow-to-Flow Attention for Commuting Flow Prediction [18.232085070775835]
通勤パターンの予測にフロー・ツー・フロー・アテンションを用いた,説明可能なトランスフォーマーベースのモデルであるTransFlowerを紹介した。我々のモデルは、既存の手法を最大30.8%のCommon Part of Commutersで上回ります。
論文参考訳（メタデータ） (2024-02-23T16:00:04Z)
SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文参考訳（メタデータ） (2023-12-31T04:14:43Z)
Two-step dynamic obstacle avoidance [0.0]
本稿では、教師付きおよび強化学習(RL)を組み合わせることにより、動的障害物回避(DOA)タスクを扱うための2段階アーキテクチャを提案する。最初のステップでは、リカレントニューラルネットワークを用いて障害物の衝突リスク(CR)を推定するデータ駆動アプローチを導入する。第2ステップでは、これらのCR推定値をRLエージェントの観察空間に含め、その状況意識を高める。
論文参考訳（メタデータ） (2023-11-28T14:55:50Z)
Alignment-free HDR Deghosting with Semantics Consistent Transformer [76.91669741684173]
高ダイナミックレンジイメージングは、複数の低ダイナミックレンジ入力から情報を取得し、リアルな出力を生成することを目的としている。既存の手法では、前景やカメラの動きによって引き起こされる入力フレーム間の空間的ずれに焦点を当てることが多い。本研究では,SCTNet(Semantics Consistent Transformer)を用いたアライメントフリーネットワークを提案する。
論文参考訳（メタデータ） (2023-05-29T15:03:23Z)
Learned Risk Metric Maps for Kinodynamic Systems [54.49871675894546]
本研究では,高次元力学系のコヒーレントリスクメトリクスをリアルタイムに推定するための学習型リスクメトリクスマップを提案する。 LRMMモデルは設計と訓練が簡単で、障害セットの手続き的生成、状態と制御のサンプリング、および関数近似器の教師付きトレーニングのみを必要とする。
論文参考訳（メタデータ） (2023-02-28T17:51:43Z)
PDFormer: Propagation Delay-Aware Dynamic Long-Range Transformer for Traffic Flow Prediction [78.05103666987655]
空間時空間グラフニューラルネットワーク(GNN)モデルは、この問題を解決する最も有望な方法の1つである。本稿では,交通流の正確な予測を行うために,遅延を意識した動的長距離トランスフォーマー(PDFormer)を提案する。提案手法は,最先端の性能を達成するだけでなく,計算効率の競争力も発揮できる。
論文参考訳（メタデータ） (2023-01-19T08:42:40Z)
STVGFormer: Spatio-Temporal Video Grounding with Static-Dynamic Cross-Modal Understanding [68.96574451918458]
静的分岐と動的分岐を用いて視覚言語依存をモデル化するSTVGというフレームワークを提案する。静的分岐と動的分岐は、クロスモーダルトランスとして設計されている。提案手法は39.6%のvIoUを達成し,HC-STVGの第1位を獲得した。
論文参考訳（メタデータ） (2022-07-06T15:48:58Z)
Manifold Interpolating Optimal-Transport Flows for Trajectory Inference [64.94020639760026]
最適輸送流(MIOFlow)を補間するマニフォールド補間法を提案する。 MIOFlowは、散発的なタイムポイントで撮影された静的スナップショットサンプルから、連続的な人口動態を学習する。本手法は, 胚体分化および急性骨髄性白血病の治療から得られたscRNA-seqデータとともに, 分岐とマージによるシミュレーションデータについて検討した。
論文参考訳（メタデータ） (2022-06-29T22:19:03Z)
Learning Robust Policy against Disturbance in Transition Dynamics via State-Conservative Policy Optimization [63.75188254377202]
深層強化学習アルゴリズムは、ソースとターゲット環境の相違により、現実世界のタスクでは不十分な処理を行うことができる。本研究では,前もって乱れをモデル化せずにロバストなポリシーを学習するための,モデルフリーなアクター批判アルゴリズムを提案する。いくつかのロボット制御タスクの実験では、SCPOは遷移力学の乱れに対する堅牢なポリシーを学習している。
論文参考訳（メタデータ） (2021-12-20T13:13:05Z)
DPMPC-Planner: A real-time UAV trajectory planning framework for complex static environments with dynamic obstacles [0.9462808515258462]
安全なUAVナビゲーションは、複雑な環境構造、動的障害物、計測ノイズによる不確実性、予測不可能な移動障害物の挙動のために困難である。本稿では,動的障害物を伴う複雑な静的環境を考慮した安全なナビゲーションを実現するための軌道計画フレームワークを提案する。
論文参考訳（メタデータ） (2021-09-14T23:51:02Z)
Robust Reinforcement Learning with Wasserstein Constraint [49.86490922809473]
最適なロバストなポリシーの存在を示し、摂動に対する感度分析を行い、新しいロバストな学習アルゴリズムを設計する。提案アルゴリズムの有効性はCart-Pole環境で検証する。
論文参考訳（メタデータ） (2020-06-01T13:48:59Z)
Counterfactual Vision-and-Language Navigation via Adversarial Path Sampling [65.99956848461915]
VLN(Vision-and-Language Navigation)は、エージェントが目標を達成するために3D環境を移動する方法を決定するタスクである。 VLNタスクの問題点の1つは、対話型環境において、人間に注釈を付けた指示で十分なナビゲーションパスを収集することは困難であるため、データの不足である。本稿では,低品質な拡張データではなく,効果的な条件を考慮可能な,対向駆動の反実的推論モデルを提案する。
論文参考訳（メタデータ） (2019-11-17T18:02:51Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。