論文の概要: Falsification-Driven Reinforcement Learning for Maritime Motion Planning
- arxiv url: http://arxiv.org/abs/2510.06970v1
- Date: Wed, 08 Oct 2025 12:56:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-09 16:41:20.497807
- Title: Falsification-Driven Reinforcement Learning for Maritime Motion Planning
- Title(参考訳): Falsification-Driven Reinforcement Learning for Maritime Motion Planning
- Authors: Marlon Müller, Florian Finkeldei, Hanna Krasowski, Murat Arcak, Matthias Althoff,
- Abstract要約: 船舶の安全運用には海上交通規則の遵守が不可欠である。
強化学習(RL)エージェントを定着させる訓練は困難である。
本稿では, 船体が海上交通規則に違反する敵の訓練シナリオを生成する, ファルシフィケーション駆動型RL手法を提案する。
- 参考スコア(独自算出の注目度): 10.405737384575334
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Compliance with maritime traffic rules is essential for the safe operation of autonomous vessels, yet training reinforcement learning (RL) agents to adhere to them is challenging. The behavior of RL agents is shaped by the training scenarios they encounter, but creating scenarios that capture the complexity of maritime navigation is non-trivial, and real-world data alone is insufficient. To address this, we propose a falsification-driven RL approach that generates adversarial training scenarios in which the vessel under test violates maritime traffic rules, which are expressed as signal temporal logic specifications. Our experiments on open-sea navigation with two vessels demonstrate that the proposed approach provides more relevant training scenarios and achieves more consistent rule compliance.
- Abstract(参考訳): 自律型船舶の安全運用には海上交通規則の遵守が不可欠であるが、それに従うための強化学習(RL)エージェントの訓練は困難である。
RLエージェントの振る舞いは、彼らが遭遇するトレーニングシナリオによって形成されるが、海洋航行の複雑さを捉えたシナリオを作成することは簡単ではなく、現実世界のデータだけでは不十分である。
そこで本研究では,信号時論理仕様として表現される海上交通規則に違反する対角的訓練シナリオを生成するファルシフィケーション駆動型RL手法を提案する。
2つの船体を用いたオープンシーナビゲーション実験により、提案手法がより関連するトレーニングシナリオを提供し、より一貫性のあるルールコンプライアンスを実現することを示す。
関連論文リスト
- Discrete Diffusion for Reflective Vision-Language-Action Models in Autonomous Driving [55.13109926181247]
離散拡散による安全な軌道生成のためのリフレクション機構を統合した学習ベースのフレームワークであるReflectDriveを紹介する。
我々のアプローチの中心は、勾配のない反復的な自己補正を行う、安全を意識した反射機構である。
本手法は目標条件付き軌道生成から始まり,マルチモーダル運転動作をモデル化する。
論文 参考訳(メタデータ) (2025-09-24T13:35:15Z) - FLP-XR: Future Location Prediction on Extreme Scale Maritime Data in Real-time [0.8937169040399775]
本稿では,海上移動データを活用するモデルであるFLP-XRを紹介し,高精度な予測を行うロバストなフレームワークを構築する。
3つの実世界のAISデータセットを用いた大規模な実験により,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2025-03-10T13:31:42Z) - Sea-cret Agents: Maritime Abduction for Region Generation to Expose Dark Vessel Trajectories [0.6037276428689637]
船舶の自動識別システム(AIS)を無効にした後、海上産業の悪役が違法行為を行う
機械学習のアプローチは、近い将来、これらの暗黒船の位置を特定することにしか成功しない。
我々は、誘拐、論理プログラミング、ルール学習の概念を組み合わせて、暗い容器の完全なリコールにアプローチする効率的な方法を作成します。
論文 参考訳(メタデータ) (2025-02-03T16:36:26Z) - Towards Deviation-Robust Agent Navigation via Perturbation-Aware
Contrastive Learning [125.61772424068903]
視覚言語ナビゲーション(VLN)は、エージェントに与えられた言語命令に従って実際の3D環境をナビゲートするように要求する。
本稿では,既存のVLNエージェントの一般化能力を高めるために,PROPER(Progressive Perturbation-aware Contrastive Learning)と呼ばれるモデルに依存しない学習パラダイムを提案する。
論文 参考訳(メタデータ) (2024-03-09T02:34:13Z) - Provable Traffic Rule Compliance in Safe Reinforcement Learning on the Open Sea [8.017543518311196]
強化学習(Reinforcement Learning, RL)は、自動運転車の運動計画を見つけるための有望な方法である。
提案手法は,時間論理仕様をRLに組み込むことにより,規則遵守の保証を実現する。
重要な海上交通状況に関する数値的な評価では、我々のエージェントは常に形式化された法規に準拠し、決して衝突しない。
論文 参考訳(メタデータ) (2024-02-13T14:59:19Z) - SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - Benchmarking Safe Deep Reinforcement Learning in Aquatic Navigation [78.17108227614928]
本研究では,水文ナビゲーションに着目した安全強化学習のためのベンチマーク環境を提案する。
価値に基づく政策段階の深層強化学習(DRL)について考察する。
また,学習したモデルの振る舞いを所望の特性の集合上で検証する検証戦略を提案する。
論文 参考訳(メタデータ) (2021-12-16T16:53:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。