論文の概要: Realistic Curriculum Reinforcement Learning for Autonomous and Sustainable Marine Vessel Navigation
- arxiv url: http://arxiv.org/abs/2601.10911v1
- Date: Thu, 15 Jan 2026 23:51:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-19 20:21:50.309984
- Title: Realistic Curriculum Reinforcement Learning for Autonomous and Sustainable Marine Vessel Navigation
- Title(参考訳): 自律・持続可能な船舶航行のための現実的なカリキュラム強化学習
- Authors: Zhang Xiaocai, Xiao Zhe, Liang Maohan, Liu Tao, Li Haijiang, Zhang Wenbin,
- Abstract要約: 本稿では,現実的なデータ駆動型海洋シミュレーション環境と統合したカリキュラム強化学習フレームワークを提案する。
船舶の燃料消費は、歴史的運用データと学習に基づく回帰を用いて推定される。
我々は,安全,エミッション,タイムライン,ゴール完了を考慮した包括的報酬機構を備えた軽量でポリシーベースのCRLエージェントを設計する。
- 参考スコア(独自算出の注目度): 0.5439021491474986
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Sustainability is becoming increasingly critical in the maritime transport, encompassing both environmental and social impacts, such as Greenhouse Gas (GHG) emissions and navigational safety. Traditional vessel navigation heavily relies on human experience, often lacking autonomy and emission awareness, and is prone to human errors that may compromise safety. In this paper, we propose a Curriculum Reinforcement Learning (CRL) framework integrated with a realistic, data-driven marine simulation environment and a machine learning-based fuel consumption prediction module. The simulation environment is constructed using real-world vessel movement data and enhanced with a Diffusion Model to simulate dynamic maritime conditions. Vessel fuel consumption is estimated using historical operational data and learning-based regression. The surrounding environment is represented as image-based inputs to capture spatial complexity. We design a lightweight, policy-based CRL agent with a comprehensive reward mechanism that considers safety, emissions, timeliness, and goal completion. This framework effectively handles complex tasks progressively while ensuring stable and efficient learning in continuous action spaces. We validate the proposed approach in a sea area of the Indian Ocean, demonstrating its efficacy in enabling sustainable and safe vessel navigation.
- Abstract(参考訳): 持続可能な環境は、温室効果ガス(GHG)の排出や航行安全といった環境と社会への影響を包含し、海上輸送においてますます重要になっている。
従来の船舶航法は人間の経験に大きく依存しており、しばしば自律性やエミッションの認識が欠如しており、安全性を損なう可能性がある。
本稿では,リアルでデータ駆動型海洋シミュレーション環境と機械学習による燃料消費予測モジュールを統合したCRLフレームワークを提案する。
シミュレーション環境は, 実世界の船舶移動データを用いて構築され, 動的海洋条件をシミュレートする拡散モデルにより拡張されている。
船舶の燃料消費は、歴史的運用データと学習に基づく回帰を用いて推定される。
周囲の環境は空間的複雑さを捉えるためのイメージベースの入力として表現される。
我々は,安全,エミッション,タイムライン,ゴール完了を考慮した包括的報酬機構を備えた軽量でポリシーベースのCRLエージェントを設計する。
このフレームワークは、連続的なアクション空間における安定的で効率的な学習を確保しながら、複雑なタスクを効果的に処理する。
インド洋の海域で提案されたアプローチを検証し,持続的で安全な船舶航行の実現に有効であることを実証した。
関連論文リスト
- IndustryNav: Exploring Spatial Reasoning of Embodied Agents in Dynamic Industrial Navigation [56.43007596544299]
IndustryNavは、アクティブな空間推論のための最初の動的産業用ナビゲーションベンチマークである。
9つの最先端のVisual Large Language Modelsの研究によると、クローズドソースモデルは一貫した優位性を維持している。
論文 参考訳(メタデータ) (2025-11-21T16:48:49Z) - From Seeing to Experiencing: Scaling Navigation Foundation Models with Reinforcement Learning [59.88543114325153]
本稿では,航法基礎モデルの強化学習能力を高めるためのSeeing-to-Experiencingフレームワークを提案する。
S2Eは、ビデオの事前トレーニングとRLによるポストトレーニングの長所を組み合わせたものだ。
実世界のシーンを3DGSで再現した3D画像に基づく総合的なエンドツーエンド評価ベンチマークであるNavBench-GSを構築した。
論文 参考訳(メタデータ) (2025-07-29T17:26:10Z) - Depth-Constrained ASV Navigation with Deep RL and Limited Sensing [43.785833390490446]
本研究では,深度制約下でのASVナビゲーションのための強化学習フレームワークを提案する。
環境意識を高めるため,GPレグレッションをRLフレームワークに統合する。
我々は,実世界の水環境に対して,訓練された政策が適切に一般化されることを保証する効果的なシミュレート・トゥ・リアル・トランスファーを実証する。
論文 参考訳(メタデータ) (2025-04-25T10:56:56Z) - Evaluating Robustness of Reinforcement Learning Algorithms for Autonomous Shipping [2.9109581496560044]
本稿では,自律型海運シミュレータにおける内陸水路輸送(IWT)のために実装されたベンチマークディープ強化学習(RL)アルゴリズムのロバスト性について検討する。
モデルのないアプローチはシミュレーターで適切なポリシーを達成でき、訓練中に遭遇したことのないポート環境をナビゲートすることに成功した。
論文 参考訳(メタデータ) (2024-11-07T17:55:07Z) - Aquatic Navigation: A Challenging Benchmark for Deep Reinforcement Learning [53.3760591018817]
ゲームエンジンとDeep Reinforcement Learningの統合の最近の進歩を利用して,水上ナビゲーションのための新しいベンチマーク環境を提案する。
具体的には、最も広く受け入れられているアルゴリズムの一つであるPPOに着目し、先進的なトレーニング手法を提案する。
実験により,これらの成分をうまく組み合わせることで,有望な結果が得られることが示された。
論文 参考訳(メタデータ) (2024-05-30T23:20:23Z) - Vessel-following model for inland waterways based on deep reinforcement
learning [0.0]
本研究の目的は、複雑な車両動特性と環境障害に対するRLに基づく車両追従の実現可能性を検討することである。
そこで本研究では,現実的な船舶力学に基づく内陸水路の船体追従モデルを構築した。
モデルでは,すべてのシナリオにおいて安全で快適な運転が示され,優れた一般化能力が証明された。
論文 参考訳(メタデータ) (2022-07-07T12:19:03Z) - Cautious Adaptation For Reinforcement Learning in Safety-Critical
Settings [129.80279257258098]
都市運転のような現実の安全クリティカルな目標設定における強化学習(RL)は危険である。
非安全クリティカルな「ソース」環境でエージェントが最初に訓練する「安全クリティカル適応」タスクセットを提案する。
多様な環境における事前経験がリスクを見積もるためにエージェントに装備するという直感に基づくソリューションアプローチであるCARLを提案する。
論文 参考訳(メタデータ) (2020-08-15T01:40:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。