論文の概要: Sim2Swim: Zero-Shot Velocity Control for Agile AUV Maneuvering in 3 Minutes
- arxiv url: http://arxiv.org/abs/2512.08656v1
- Date: Tue, 09 Dec 2025 14:42:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:40.234639
- Title: Sim2Swim: Zero-Shot Velocity Control for Agile AUV Maneuvering in 3 Minutes
- Title(参考訳): Sim2Swim: アジャイル AUV を3分で行うためのゼロショット速度制御
- Authors: Lauritz Rismark Fosso, Herman Biørn Amundsen, Marios Xanthidis, Sveinung Johan Ohrem,
- Abstract要約: ホロノミック・自律型水中車両(AUV)は、翻訳的および回転的自由度(DOF)の両方において、アジャイル操作のハードウェア能力を有する
本報告では, 訓練期間をわずか3分で行うことにより, 経路追従とアジャイル6DOF操作を可能にする, 汎用ゼロショット・シム2リアル深部強化学習(DRL)速度制御器について述べる。
- 参考スコア(独自算出の注目度): 2.6511518230332753
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Holonomic autonomous underwater vehicles (AUVs) have the hardware ability for agile maneuvering in both translational and rotational degrees of freedom (DOFs). However, due to challenges inherent to underwater vehicles, such as complex hydrostatics and hydrodynamics, parametric uncertainties, and frequent changes in dynamics due to payload changes, control is challenging. Performance typically relies on carefully tuned controllers targeting unique platform configurations, and a need for re-tuning for deployment under varying payloads and hydrodynamic conditions. As a consequence, agile maneuvering with simultaneous tracking of time-varying references in both translational and rotational DOFs is rarely utilized in practice. To the best of our knowledge, this paper presents the first general zero-shot sim2real deep reinforcement learning-based (DRL) velocity controller enabling path following and agile 6DOF maneuvering with a training duration of just 3 minutes. Sim2Swim, the proposed approach, inspired by state-of-the-art DRL-based position control, leverages domain randomization and massively parallelized training to converge to field-deployable control policies for AUVs of variable characteristics without post-processing or tuning. Sim2Swim is extensively validated in pool trials for a variety of configurations, showcasing robust control for highly agile motions.
- Abstract(参考訳): ホロノミック・自律型水中車両(AUV)は、翻訳的および回転的自由度(DOF)の両方でアジャイル操作を行うハードウェア能力を有する。
しかし, 複雑な静水圧や流体力学, パラメトリック不確実性, ペイロードの変化による動的変化など, 水中車両固有の課題のため, 制御は困難である。
パフォーマンスは一般的に、ユニークなプラットフォーム構成をターゲットとした、注意深く調整されたコントローラに依存している。
その結果、翻訳と回転の両DOFにおける時間変化参照の同時追跡によるアジャイルな操作は、実際にはほとんど利用されない。
我々の知る限り、本研究では、訓練期間がわずか3分で、経路追従とアジャイル6DOF操作を可能にする、最初の一般ゼロショットSIM2real Deep reinforcement Learning-based (DRL)ベロシティコントローラを提案する。
Sim2Swimは、最先端のDRLベースの位置制御にインスパイアされた提案手法であり、ドメインランダム化と大規模並列化トレーニングを活用して、後処理やチューニングなしに可変特性のAUVに対するフィールド展開可能な制御ポリシーに収束する。
Sim2Swimは様々な構成のプールトライアルで広く検証されており、高度にアジャイルな動きに対する堅牢な制御を示している。
関連論文リスト
- Sim-to-reality adaptation for Deep Reinforcement Learning applied to an underwater docking application [0.0]
Deep Reinforcement Learning (DRL)は、自律的な水中ドッキングのための従来の制御方法に代わる堅牢な代替手段を提供する。
本稿では,高忠実なディジタル双生児環境を活用することで,ジローナ自律水中車両(AUV)を用いた自律ドッキングの体系的アプローチを提案する。
論文 参考訳(メタデータ) (2026-03-12T15:01:25Z) - Fast Policy Learning for 6-DOF Position Control of Underwater Vehicles [1.4883782513177095]
強化学習(Reinforcement Learning, RL)は強力な代替手段を提供するが、訓練は通常は遅く、シミュレートから現実への移行は難しいままである。
JAX と MuJoCo-XLA (MJX) で構築された GPU アクセラレーションによる RL トレーニングパイプラインを導入する。
大規模並列物理シミュレーションと学習更新を共同でJITコンパイルすることにより,2分以内のトレーニング時間を達成できる。
論文 参考訳(メタデータ) (2025-12-15T14:12:32Z) - Forecasting Continuous Non-Conservative Dynamical Systems in SO(3) [51.510040541600176]
コンピュータビジョンにおける移動物体の回転をモデル化するための新しい手法を提案する。
我々のアプローチは、入力ノイズに対して頑健でありながら、エネルギーと運動量保存に非依存である。
トレーニング中の雑音状態から物体のダイナミクスを近似させることで、シミュレーションや様々な現実世界の設定において頑健な外挿能力が得られる。
論文 参考訳(メタデータ) (2025-08-11T09:03:10Z) - SuperFlow++: Enhanced Spatiotemporal Consistency for Cross-Modal Data Pretraining [62.433137130087445]
SuperFlow++は、連続するカメラペアを使用して事前トレーニングと下流タスクを統合する新しいフレームワークである。
SuperFlow++は様々なタスクや運転条件で最先端のメソッドよりも優れています。
強力な一般化性と計算効率により、SuperFlow++は、自動運転におけるデータ効率の高いLiDARベースの認識のための新しいベンチマークを確立する。
論文 参考訳(メタデータ) (2025-03-25T17:59:57Z) - Autonomous Vehicle Controllers From End-to-End Differentiable Simulation [57.278726604424556]
そこで我々は,AVコントローラのトレーニングにAPG(analytic Policy gradients)アプローチを適用可能なシミュレータを提案し,その設計を行う。
提案するフレームワークは, エージェントがより根底的なポリシーを学ぶのを助けるために, 環境力学の勾配を役立てる, エンド・ツー・エンドの訓練ループに, 微分可能シミュレータを組み込む。
ダイナミクスにおけるパフォーマンスとノイズに対する堅牢性の大幅な改善と、全体としてより直感的なヒューマンライクな処理が見られます。
論文 参考訳(メタデータ) (2024-09-12T11:50:06Z) - Learning to Fly in Seconds [7.259696592534715]
カリキュラム学習と高度に最適化されたシミュレータが,サンプルの複雑さを増し,学習時間の短縮につながることを示す。
我々のフレームワークは、コンシューマ級ラップトップで18秒のトレーニングをした後、直接制御するためのSimulation-to-Real(Sim2Real)転送を可能にする。
論文 参考訳(メタデータ) (2023-11-22T01:06:45Z) - How to Control Hydrodynamic Force on Fluidic Pinball via Deep
Reinforcement Learning [3.1635451288803638]
流体ピンボールの流体力を制御するためのDRLに基づくリアルタイムフィードバック戦略を提案する。
報酬関数を適切に設計し、歴史的観測を符号化することにより、DRLに基づく制御が合理的かつ有効な制御決定を行うことを示した。
これらの結果の1つは、力追跡プロセスの意思決定と物理的メカニズムに基づいて光を放つことができる機械学習モデルによって分析された。
論文 参考訳(メタデータ) (2023-04-23T03:39:50Z) - Neural-Fly Enables Rapid Learning for Agile Flight in Strong Winds [96.74836678572582]
本稿では,ディープラーニングを通じて事前学習した表現を組み込むことで,オンラインでの迅速な適応を可能にする学習ベースのアプローチを提案する。
Neural-Flyは、最先端の非線形かつ適応的なコントローラよりもかなり少ないトラッキングエラーで正確な飛行制御を実現する。
論文 参考訳(メタデータ) (2022-05-13T21:55:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。