Fugu-MT 論文翻訳(概要): Mapless Navigation of a Hybrid Aerial Underwater Vehicle with Deep Reinforcement Learning Through Environmental Generalization

論文の概要: Mapless Navigation of a Hybrid Aerial Underwater Vehicle with Deep Reinforcement Learning Through Environmental Generalization

arxiv url: http://arxiv.org/abs/2209.06332v1
Date: Tue, 13 Sep 2022 22:35:33 GMT
ステータス: 翻訳完了
システム内更新日: 2022-09-15 13:51:11.229120
Title: Mapless Navigation of a Hybrid Aerial Underwater Vehicle with Deep Reinforcement Learning Through Environmental Generalization
Title（参考訳）: 環境一般化による深部強化学習によるハイブリッド航空水中車両のマップレスナビゲーション
Authors: Ricardo B. Grando, Junior C. de Jesus, Victor A. Kich, Alisson H. Kolling, Rodrigo S. Guerra, Paulo L. J. Drews-Jr
Abstract要約: 本稿では、リカレントニューラルネットワークを用いたDeep-RLの二重批判により、HUAUVの航法性能が向上することを示す。我々のDeep-RLアプローチは、異なるシミュレートされたシナリオを通して学習をしっかりと一般化し、より優れたナビゲーションとトランジション機能を実現した。
参考スコア（独自算出の注目度）: 0.41562334038629606
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Previous works showed that Deep-RL can be applied to perform mapless navigation, including the medium transition of Hybrid Unmanned Aerial Underwater Vehicles (HUAUVs). This paper presents new approaches based on the state-of-the-art actor-critic algorithms to address the navigation and medium transition problems for a HUAUV. We show that a double critic Deep-RL with Recurrent Neural Networks improves the navigation performance of HUAUVs using solely range data and relative localization. Our Deep-RL approaches achieved better navigation and transitioning capabilities with a solid generalization of learning through distinct simulated scenarios, outperforming previous approaches.
Abstract（参考訳）: 以前の研究では、HUAUV(Hybrid Unmanned Aerial Underwater Vehicles)の中間移行を含む、Deep-RLがマップレスナビゲーションに応用できることが示されている。本稿では,HUAUVのナビゲーションと媒体遷移問題に対処する,最先端アクター批判アルゴリズムに基づく新しいアプローチを提案する。本稿では、リカレントニューラルネットワークを用いたDeep-RLの二重批判により、HUAUVの航法性能が向上することを示す。我々のdeep-rlアプローチは、異なるシミュレーションシナリオを通して学習をしっかり一般化し、より優れたナビゲーションとトランジッション能力を達成しました。

関連論文リスト

Depth-Constrained ASV Navigation with Deep RL and Limited Sensing [45.77464360746532]
本研究では,深度制約下でのASVナビゲーションのための強化学習フレームワークを提案する。環境意識を高めるため,GPレグレッションをRLフレームワークに統合する。我々は,実世界の水環境に対して,訓練された政策が適切に一般化されることを保証する効果的なシミュレート・トゥ・リアル・トランスファーを実証する。
論文参考訳（メタデータ） (2025-04-25T10:56:56Z)
FlexDrive: Toward Trajectory Flexibility in Driving Scene Reconstruction and Rendering [79.39246982782717]
経路外ビューの再構築の監督として,コンパクトで高品質な画像を作成するために,逆ビューワーピング技術を導入する。提案手法は,広く使用されているOpenデータセット上で,経路内および経路外再構成およびレンダリング性能を向上する。
論文参考訳（メタデータ） (2025-02-28T14:32:04Z)
Gaussian Process Regression for Improved Underwater Navigation [13.221163846643607]
ドップラー速度ログ(DVL)は通常、速度測定によってこのドリフトを緩和するために使用される。本稿では、DVL速度推定を改善するために、多出力ガウス過程回帰(MOGPR)に基づくデータ駆動方式を提案する。提案手法を実世界のAUVデータを用いて評価し,LSと最先端のディープラーニングモデルであるBeamsNetと比較した。
論文参考訳（メタデータ） (2025-02-23T09:13:41Z)
Bootstrapping Language-Guided Navigation Learning with Self-Refining Data Flywheel [83.7466618084902]
本稿では,高品質かつ大規模な航法軌道対を生成する自己精製型データフライホイール(SRDF)を提案する。実験により, 数回のフライホイールラウンドの後, ナビゲータは従来のR2Rテストセットにおいて, 70%から78%のSPLの性能境界を上昇させることを示した。このプロセスは、以前のVLN命令生成方法よりも23.5から26.2へのSPICE増加によって証明された優れたジェネレータをもたらす。
論文参考訳（メタデータ） (2024-12-11T15:32:24Z)
Vision-Based Deep Reinforcement Learning of UAV Autonomous Navigation Using Privileged Information [6.371251946803415]
DPRLは、部分的に観測可能な環境下での高速無人無人飛行の課題に対処するために設計されたエンドツーエンドのポリシーである。非対称なアクター・クライブアーキテクチャを利用して、トレーニング中にエージェントに特権情報を提供する。我々は、DPRLアルゴリズムを最先端のナビゲーションアルゴリズムと比較し、様々なシナリオにまたがって広範なシミュレーションを行う。
論文参考訳（メタデータ） (2024-12-09T09:05:52Z)
UnitedVLN: Generalizable Gaussian Splatting for Continuous Vision-Language Navigation [71.97405667493477]
我々は,UnitedVLNと呼ばれる,新しい汎用3DGSベースの事前学習パラダイムを導入する。エージェントは、高忠実度360度ビジュアルイメージとセマンティック特徴を統一してレンダリングすることで、将来の環境をよりよく探索することができる。 UnitedVLNは既存のVLN-CEベンチマークで最先端の手法より優れている。
論文参考訳（メタデータ） (2024-11-25T02:44:59Z)
Long-distance Geomagnetic Navigation in GNSS-denied Environments with Deep Reinforcement Learning [62.186340267690824]
既存の地磁気航法の研究は、事前保存された地図や広範囲な探索に依存しており、探索されていない地域での適用性や航法効率の低下に繋がる。本稿では,特に長距離地磁気航法における深部強化学習(DRL)に基づくメカニズムについて述べる。設計されたメカニズムは、プリストアドマップや広範囲で高価な探索アプローチではなく、地磁気ナビゲーションのための磁気受容能力を学ぶようにエージェントを訓練する。
論文参考訳（メタデータ） (2024-10-21T09:57:42Z)
NavCoT: Boosting LLM-Based Vision-and-Language Navigation via Learning Disentangled Reasoning [101.56342075720588]
Embodied AIの重要な研究課題であるVision-and-Language Navigation (VLN)は、自然言語の指示に従って複雑な3D環境をナビゲートするために、エンボディエージェントを必要とする。近年の研究では、ナビゲーションの推論精度と解釈可能性を改善することにより、VLNにおける大きな言語モデル(LLM)の有望な能力を強調している。本稿では,自己誘導型ナビゲーション決定を実現するために,パラメータ効率の高いドメイン内トレーニングを実現する,Navigational Chain-of-Thought (NavCoT) という新しい戦略を提案する。
論文参考訳（メタデータ） (2024-03-12T07:27:02Z)
Angle Robustness Unmanned Aerial Vehicle Navigation in GNSS-Denied Scenarios [66.05091704671503]
本稿では、ポイントツーポイントナビゲーションタスクにおける飛行偏差に対処する新しい角度ナビゲーションパラダイムを提案する。また、Adaptive Feature Enhance Module、Cross-knowledge Attention-guided Module、Robust Task-oriented Head Moduleを含むモデルを提案する。
論文参考訳（メタデータ） (2024-02-04T08:41:20Z)
Avoidance Navigation Based on Offline Pre-Training Reinforcement Learning [0.0]
本稿では,移動ロボットの地図を使わずに回避ナビゲーションを行うための,事前学習型深部強化学習(DRL)を提案する。早期の非効率なランダム探索を高速化するために,効率的なオフライン学習戦略を提案する。 DRLモデルは, 異なる環境下で普遍的な汎用能力を有することを示した。
論文参考訳（メタデータ） (2023-08-03T06:19:46Z)
Scaling Data Generation in Vision-and-Language Navigation [116.95534559103788]
本稿では,学習のための大規模データ生成に有効なパラダイムを提案する。我々は、HM3DとGibsonのデータセットから1200以上のフォトリアリスティック環境を適用し、490万の命令軌道対を合成する。我々の大規模データセットのおかげで、既存のエージェントの性能は(以前のSoTAでは+11%絶対)、単純な模倣学習によってR2Rテストの分割で80%の単ラン成功率で大幅に向上できる。
論文参考訳（メタデータ） (2023-07-28T16:03:28Z)
Robust Path Following on Rivers Using Bootstrapped Reinforcement Learning [0.0]
本稿では,内陸海域における自律型表面容器(ASV)の航行制御のための深層強化学習(DRL)エージェントを開発した。最先端のブートストラップ付きQ-ラーニングアルゴリズムと多用途のトレーニング環境ジェネレータを組み合わせることで、堅牢で正確な舵制御を実現する。
論文参考訳（メタデータ） (2023-03-24T07:21:27Z)
Holistic Deep-Reinforcement-Learning-based Training of Autonomous Navigation Systems [4.409836695738518]
Deep Reinforcement Learningは、地上車両の自律的なナビゲーションのための有望なアプローチとして登場した。本稿では,ナビゲーションスタックの全要素を含む総合的な深層強化学習手法を提案する。
論文参考訳（メタデータ） (2023-02-06T16:52:15Z)
Using Deep Reinforcement Learning with Automatic Curriculum earning for Mapless Navigation in Intralogistics [0.7633618497843278]
本稿では,倉庫シナリオにおけるマップレスナビゲーション問題を解決するための深層強化学習手法を提案する。自動誘導車両は、LiDARと前頭RGBセンサーを備え、目標のドームの下に到達することを学ぶ。 NavACL-Qは、学習プロセス全体を大幅に促進し、事前訓練された特徴抽出器は、トレーニング速度を顕著に向上させる。
論文参考訳（メタデータ） (2022-02-23T13:50:01Z)
COLREG-Compliant Collision Avoidance for Unmanned Surface Vehicle using Deep Reinforcement Learning [0.0]
追従と衝突回避は、無人表面船や他の自動運転車にとって、ロボット工学における2つの基本的なガイダンス問題である。本稿では,連続制御タスクにおける最先端性能を示すDRLアルゴリズムであるPPOの可能性について検討する。ノルウェー海の入り江であるトロンドハイム・フィヨルド(Trondheim Fjord)の高忠実な標高とAIS追跡データに基づいて、我々は訓練されたエージェントのパフォーマンスを挑戦的でダイナミックな実世界のシナリオで評価した。
論文参考訳（メタデータ） (2020-06-16T22:05:58Z)
Data Freshness and Energy-Efficient UAV Navigation Optimization: A Deep Reinforcement Learning Approach [88.45509934702913]
我々は、移動基地局(BS)が配備される複数の無人航空機(UAV)のナビゲーションポリシーを設計する。我々は、地上BSにおけるデータの鮮度を確保するために、エネルギーや情報年齢(AoI)の制約などの異なる文脈情報を組み込んだ。提案したトレーニングモデルを適用することで、UAV-BSに対する効果的なリアルタイム軌道ポリシーは、時間とともに観測可能なネットワーク状態をキャプチャする。
論文参考訳（メタデータ） (2020-02-21T07:29:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。