論文の概要: Falsification-Driven Reinforcement Learning for Maritime Motion Planning
- arxiv url: http://arxiv.org/abs/2510.06970v1
- Date: Wed, 08 Oct 2025 12:56:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-09 16:41:20.497807
- Title: Falsification-Driven Reinforcement Learning for Maritime Motion Planning
- Title(参考訳): Falsification-Driven Reinforcement Learning for Maritime Motion Planning
- Authors: Marlon Müller, Florian Finkeldei, Hanna Krasowski, Murat Arcak, Matthias Althoff,
- Abstract要約: 船舶の安全運用には海上交通規則の遵守が不可欠である。
強化学習(RL)エージェントを定着させる訓練は困難である。
本稿では, 船体が海上交通規則に違反する敵の訓練シナリオを生成する, ファルシフィケーション駆動型RL手法を提案する。
- 参考スコア(独自算出の注目度): 10.405737384575334
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Compliance with maritime traffic rules is essential for the safe operation of autonomous vessels, yet training reinforcement learning (RL) agents to adhere to them is challenging. The behavior of RL agents is shaped by the training scenarios they encounter, but creating scenarios that capture the complexity of maritime navigation is non-trivial, and real-world data alone is insufficient. To address this, we propose a falsification-driven RL approach that generates adversarial training scenarios in which the vessel under test violates maritime traffic rules, which are expressed as signal temporal logic specifications. Our experiments on open-sea navigation with two vessels demonstrate that the proposed approach provides more relevant training scenarios and achieves more consistent rule compliance.
- Abstract(参考訳): 自律型船舶の安全運用には海上交通規則の遵守が不可欠であるが、それに従うための強化学習(RL)エージェントの訓練は困難である。
RLエージェントの振る舞いは、彼らが遭遇するトレーニングシナリオによって形成されるが、海洋航行の複雑さを捉えたシナリオを作成することは簡単ではなく、現実世界のデータだけでは不十分である。
そこで本研究では,信号時論理仕様として表現される海上交通規則に違反する対角的訓練シナリオを生成するファルシフィケーション駆動型RL手法を提案する。
2つの船体を用いたオープンシーナビゲーション実験により、提案手法がより関連するトレーニングシナリオを提供し、より一貫性のあるルールコンプライアンスを実現することを示す。
関連論文リスト
- Discrete Diffusion for Reflective Vision-Language-Action Models in Autonomous Driving [55.13109926181247]
離散拡散による安全な軌道生成のためのリフレクション機構を統合した学習ベースのフレームワークであるReflectDriveを紹介する。
我々のアプローチの中心は、勾配のない反復的な自己補正を行う、安全を意識した反射機構である。
本手法は目標条件付き軌道生成から始まり,マルチモーダル運転動作をモデル化する。
論文 参考訳(メタデータ) (2025-09-24T13:35:15Z) - FLP-XR: Future Location Prediction on Extreme Scale Maritime Data in Real-time [0.8937169040399775]
本稿では,海上移動データを活用するモデルであるFLP-XRを紹介し,高精度な予測を行うロバストなフレームワークを構築する。
3つの実世界のAISデータセットを用いた大規模な実験により,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2025-03-10T13:31:42Z) - Sea-cret Agents: Maritime Abduction for Region Generation to Expose Dark Vessel Trajectories [0.6037276428689637]
船舶の自動識別システム(AIS)を無効にした後、海上産業の悪役が違法行為を行う
機械学習のアプローチは、近い将来、これらの暗黒船の位置を特定することにしか成功しない。
我々は、誘拐、論理プログラミング、ルール学習の概念を組み合わせて、暗い容器の完全なリコールにアプローチする効率的な方法を作成します。
論文 参考訳(メタデータ) (2025-02-03T16:36:26Z) - Towards Deviation-Robust Agent Navigation via Perturbation-Aware
Contrastive Learning [125.61772424068903]
視覚言語ナビゲーション(VLN)は、エージェントに与えられた言語命令に従って実際の3D環境をナビゲートするように要求する。
本稿では,既存のVLNエージェントの一般化能力を高めるために,PROPER(Progressive Perturbation-aware Contrastive Learning)と呼ばれるモデルに依存しない学習パラダイムを提案する。
論文 参考訳(メタデータ) (2024-03-09T02:34:13Z) - Provable Traffic Rule Compliance in Safe Reinforcement Learning on the Open Sea [8.017543518311196]
強化学習(Reinforcement Learning, RL)は、自動運転車の運動計画を見つけるための有望な方法である。
提案手法は,時間論理仕様をRLに組み込むことにより,規則遵守の保証を実現する。
重要な海上交通状況に関する数値的な評価では、我々のエージェントは常に形式化された法規に準拠し、決して衝突しない。
論文 参考訳(メタデータ) (2024-02-13T14:59:19Z) - SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - Two-step dynamic obstacle avoidance [0.0]
本稿では、教師付きおよび強化学習(RL)を組み合わせることにより、動的障害物回避(DOA)タスクを扱うための2段階アーキテクチャを提案する。
最初のステップでは、リカレントニューラルネットワークを用いて障害物の衝突リスク(CR)を推定するデータ駆動アプローチを導入する。
第2ステップでは、これらのCR推定値をRLエージェントの観察空間に含め、その状況意識を高める。
論文 参考訳(メタデータ) (2023-11-28T14:55:50Z) - Learning to Sail Dynamic Networks: The MARLIN Reinforcement Learning
Framework for Congestion Control in Tactical Environments [53.08686495706487]
本稿では, 正確な並列化可能なエミュレーション環境を利用して, 戦術ネットワークの環境を再現するRLフレームワークを提案する。
衛星通信(SATCOM)とUHFワイドバンド(UHF)の無線リンク間のボトルネックリンク遷移を再現した条件下で、MARLINエージェントを訓練することにより、我々のRL学習フレームワークを評価する。
論文 参考訳(メタデータ) (2023-06-27T16:15:15Z) - Vessel-following model for inland waterways based on deep reinforcement
learning [0.0]
本研究の目的は、複雑な車両動特性と環境障害に対するRLに基づく車両追従の実現可能性を検討することである。
そこで本研究では,現実的な船舶力学に基づく内陸水路の船体追従モデルを構築した。
モデルでは,すべてのシナリオにおいて安全で快適な運転が示され,優れた一般化能力が証明された。
論文 参考訳(メタデータ) (2022-07-07T12:19:03Z) - Benchmarking Safe Deep Reinforcement Learning in Aquatic Navigation [78.17108227614928]
本研究では,水文ナビゲーションに着目した安全強化学習のためのベンチマーク環境を提案する。
価値に基づく政策段階の深層強化学習(DRL)について考察する。
また,学習したモデルの振る舞いを所望の特性の集合上で検証する検証戦略を提案する。
論文 参考訳(メタデータ) (2021-12-16T16:53:56Z) - Deep Structured Reactive Planning [94.92994828905984]
自動運転のための新しいデータ駆動型リアクティブ計画目標を提案する。
本モデルは,非常に複雑な操作を成功させる上で,非反応性変種よりも優れることを示す。
論文 参考訳(メタデータ) (2021-01-18T01:43:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。