論文の概要: MarineGym: A High-Performance Reinforcement Learning Platform for Underwater Robotics
- arxiv url: http://arxiv.org/abs/2503.09203v1
- Date: Wed, 12 Mar 2025 09:47:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-13 15:38:23.958262
- Title: MarineGym: A High-Performance Reinforcement Learning Platform for Underwater Robotics
- Title(参考訳): MarineGym:水中ロボットのための高性能強化学習プラットフォーム
- Authors: Shuguang Chu, Zebin Huang, Yutong Li, Mingwei Lin, Ignacio Carlucho, Yvan R. Petillot, Canjun Yang,
- Abstract要約: MarineGymは、水中ロボット工学に特化した高性能強化学習(RL)プラットフォームである。
MarineGymはIsaac SimをベースとしたGPUアクセラレーション型動的プラグインを統合している。
また、無人水中車両(UUV)の5つのモデル、複数の推進システム、事前定義された一連のタスクも提供する。
- 参考スコア(独自算出の注目度): 9.015814050369107
- License:
- Abstract: This work presents the MarineGym, a high-performance reinforcement learning (RL) platform specifically designed for underwater robotics. It aims to address the limitations of existing underwater simulation environments in terms of RL compatibility, training efficiency, and standardized benchmarking. MarineGym integrates a proposed GPU-accelerated hydrodynamic plugin based on Isaac Sim, achieving a rollout speed of 250,000 frames per second on a single NVIDIA RTX 3060 GPU. It also provides five models of unmanned underwater vehicles (UUVs), multiple propulsion systems, and a set of predefined tasks covering core underwater control challenges. Additionally, the DR toolkit allows flexible adjustments of simulation and task parameters during training to improve Sim2Real transfer. Further benchmark experiments demonstrate that MarineGym improves training efficiency over existing platforms and supports robust policy adaptation under various perturbations. We expect this platform could drive further advancements in RL research for underwater robotics. For more details about MarineGym and its applications, please visit our project page: https://marine-gym.com/.
- Abstract(参考訳): この研究は、水中ロボティクス用に特別に設計された高性能強化学習(RL)プラットフォームであるMarineGymを提示する。
RLの互換性、トレーニング効率、標準化されたベンチマークの観点から、既存の水中シミュレーション環境の限界に対処することを目的としている。
MarineGymはIsaac SimをベースとしたGPUアクセラレーション型動的プラグインをベースとして,単一のNVIDIA RTX 3060 GPU上で毎秒25万フレームのロールアウト速度を実現している。
また、無人水中車両(UUV)の5つのモデル、複数の推進システム、および中核的な水中制御課題をカバーする一連の事前定義されたタスクも提供する。
さらに、DRツールキットは、トレーニング中のシミュレーションとタスクパラメータの柔軟な調整を可能にし、Sim2Real転送を改善する。
さらなるベンチマーク実験により、MarineGymは既存のプラットフォーム上でのトレーニング効率を改善し、様々な摂動下でのロバストなポリシー適応をサポートすることが示されている。
このプラットホームは、水中ロボットのためのRL研究のさらなる進歩を後押しすることを期待している。
MarineGymとそのアプリケーションの詳細については、プロジェクトのページを参照してください。
関連論文リスト
- Stonefish: Supporting Machine Learning Research in Marine Robotics [5.021710505685786]
本稿では,海洋ロボティクスソリューションの開発とテストを支援するオープンソースプラットフォームであるStonefishシミュレータの最近の拡張を強調した。
主なアップデートには、視覚光通信、テザリング操作のサポート、スラスタモデリングの改善、より柔軟な流体力学、ソナー精度の向上などが含まれる。
論文 参考訳(メタデータ) (2025-02-17T15:13:41Z) - UGSim: Autonomous Buoyancy-Driven Underwater Glider Simulator with LQR Control Strategy and Recursive Guidance System [3.8632181427836945]
本稿では,浮力駆動グライダーのシミュレータであるUGSimについて述べる。
浮力駆動グライダーに対する複雑な流体力学と静水圧の影響から生じる、ユニークな課題に対処するために設計された。
シミュレーターは、海における高価な時間を要するアルゴリズムの開発と評価を加速するために提供される。
論文 参考訳(メタデータ) (2025-01-29T18:50:41Z) - Gaussian Splatting to Real World Flight Navigation Transfer with Liquid Networks [93.38375271826202]
本研究では,シミュレート・トゥ・リアルな視覚四重項ナビゲーションタスクにおける分布シフトに対する一般化とロバスト性を改善する手法を提案する。
まず,擬似飛行力学とガウススプラッティングを統合してシミュレータを構築し,その後,液状ニューラルネットワークを用いてロバストなナビゲーションポリシーを訓練する。
このようにして、我々は3次元ガウススプラッティングラディアンス場レンダリング、専門家による実演訓練データのプログラミング、およびLiquid Networkのタスク理解能力の進歩を組み合わせたフルスタックの模倣学習プロトコルを得る。
論文 参考訳(メタデータ) (2024-06-21T13:48:37Z) - Aquatic Navigation: A Challenging Benchmark for Deep Reinforcement Learning [53.3760591018817]
ゲームエンジンとDeep Reinforcement Learningの統合の最近の進歩を利用して,水上ナビゲーションのための新しいベンチマーク環境を提案する。
具体的には、最も広く受け入れられているアルゴリズムの一つであるPPOに着目し、先進的なトレーニング手法を提案する。
実験により,これらの成分をうまく組み合わせることで,有望な結果が得られることが示された。
論文 参考訳(メタデータ) (2024-05-30T23:20:23Z) - An Efficient Detection and Control System for Underwater Docking using
Machine Learning and Realistic Simulation: A Comprehensive Approach [5.039813366558306]
この研究は、水中ドッキングの検出と分類を行うために異なるディープラーニングアーキテクチャと比較する。
GAN(Generative Adversarial Network)は画像から画像への変換に用いられ、ガゼボのシミュレーション画像を水中画像に変換する。
その結果,水中の潮流によらず,高濁度シナリオでは20%の改善が見られた。
論文 参考訳(メタデータ) (2023-11-02T18:10:20Z) - DRIFT: Deep Reinforcement Learning for Intelligent Floating Platforms Trajectories [18.420795137038677]
フローティングプラットフォームは、地球上の微小重力環境をエミュレートするための多用途テストベッドとして機能する。
私たちのスイートは、シミュレーションから現実への堅牢性、適応性、優れた転送性を実現します。
論文 参考訳(メタデータ) (2023-10-06T14:11:35Z) - OSCAR: Data-Driven Operational Space Control for Adaptive and Robust
Robot Manipulation [50.59541802645156]
オペレーショナル・スペース・コントロール(OSC)は、操作のための効果的なタスクスペース・コントローラとして使われてきた。
本稿では,データ駆動型OSCのモデル誤差を補償するOSC for Adaptation and Robustness (OSCAR)を提案する。
本手法は,様々なシミュレーション操作問題に対して評価し,制御器のベースラインの配列よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2021-10-02T01:21:38Z) - PlasticineLab: A Soft-Body Manipulation Benchmark with Differentiable
Physics [89.81550748680245]
PasticineLabと呼ばれる新しい微分可能な物理ベンチマークを導入する。
各タスクにおいて、エージェントはマニピュレータを使用して、プラスチックを所望の構成に変形させる。
本稿では,既存の強化学習(RL)手法と勾配に基づく手法について評価する。
論文 参考訳(メタデータ) (2021-04-07T17:59:23Z) - Large Batch Simulation for Deep Reinforcement Learning [101.01408262583378]
我々は,視覚複雑な3次元環境における深層強化学習に基づく学習を,事前作業よりも2桁高速化する。
単一のGPUマシンで1秒間に19,000フレーム以上の経験と最大72,000フレーム/秒のエンドツーエンドのトレーニング速度を実現します。
バッチシミュレーションと性能最適化を組み合わせることで、1つのGPU上の複雑な3D環境において、従来の最先端システムでトレーニングされたエージェントの精度の97%から97%まで、ポイントナビゲーションエージェントをトレーニングできることを実証する。
論文 参考訳(メタデータ) (2021-03-12T00:22:50Z) - ReLMoGen: Leveraging Motion Generation in Reinforcement Learning for
Mobile Manipulation [99.2543521972137]
ReLMoGenは、サブゴールを予測するための学習されたポリシーと、これらのサブゴールに到達するために必要な動作を計画し実行するためのモーションジェネレータを組み合わせたフレームワークである。
本手法は,フォトリアリスティック・シミュレーション環境における7つのロボットタスクの多種多様なセットをベンチマークする。
ReLMoGenは、テスト時に異なるモーションジェネレータ間で顕著な転送可能性を示し、実際のロボットに転送する大きな可能性を示している。
論文 参考訳(メタデータ) (2020-08-18T08:05:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。