論文の概要: Sim-to-Real Transfer and Robustness Evaluation of Reinforcement Learning Control with Integrated Perception on an ASV for Floating Waste Capture
- arxiv url: http://arxiv.org/abs/2605.02529v1
- Date: Mon, 04 May 2026 12:29:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.283692
- Title: Sim-to-Real Transfer and Robustness Evaluation of Reinforcement Learning Control with Integrated Perception on an ASV for Floating Waste Capture
- Title(参考訳): 浮きゴミ捕獲用ASVへの統合認識による強化学習制御の同時移動とロバスト性評価
- Authors: Luis F. W. Batista, Stéphanie Aravecchia, Cédric Pradalier,
- Abstract要約: 本稿では,カメラによる偏光認識と,浮き汚れ検出・捕捉のための軽量DRL制御器を組み合わせたフィールド検証システムを提案する。
カメラ検出は水面のターゲットポイントに変換され、完全にシミュレーションで訓練されたコントローラによって追跡され、改造されたAVSプラットフォームに直接展開される。
- 参考スコア(独自算出の注目度): 4.05330458826742
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autonomous surface vessels for floating-waste removal operate under varying hydrodynamics, external disturbances, and challenging water-surface perception. We present a field-validated system that combines camera-based polarimetric perception with a lightweight DRL-based controller for floating-waste detection and capture. Camera detections are converted into water-surface target points and tracked by a controller trained entirely in simulation and deployed directly on a retrofitted ASV platform. Our main contribution is a sim-to-real testing methodology that combines a two-stage simulation protocol with a perception abstraction module designed to mimic real camera behavior, enabling reproducible field trials and explicit evaluation of the sim-to-real gap. We apply this framework in matched simulation and field experiments across 14 disturbance regimes to expose failure modes and evaluate robustness. The results show centimeter-level terminal accuracy and indicate robust control performance under the evaluated perturbation regimes. The main source of degradation is insufficient actuation-model fidelity. We also demonstrate the system in a search-and-capture application using real camera detections in real-world conditions over areas of up to $450~m^2$. The study distills practical lessons for reliable transfer, including improved actuation-model fidelity, targeted domain randomization, and careful management of latency and timestamps across modules, while highlighting remaining challenges.
- Abstract(参考訳): 浮き汚れ除去のための自律的な表面容器は、様々な流体力学、外乱、水面の知覚に挑戦して機能する。
本稿では,カメラによる偏光認識と,浮き汚れ検出・捕捉のための軽量DRL制御器を組み合わせたフィールド検証システムを提案する。
カメラ検出は水面のターゲットポイントに変換され、完全にシミュレーションで訓練されたコントローラによって追跡され、改造されたAVSプラットフォームに直接展開される。
本研究の主な貢献は,2段階のシミュレーションプロトコルと実際のカメラ動作を模倣する知覚抽象化モジュールを組み合わせ,再現性のあるフィールドトライアルと,sim-to-realギャップの明示的な評価を可能にするsim-to-realテスト手法である。
この枠組みを14の乱れ状態における整合シミュレーションおよびフィールド実験に適用し、障害モードを露呈し、ロバスト性を評価する。
その結果, 摂動条件下では, センチメートルレベルの終端精度を示し, 頑健な制御性能を示した。
主な劣化源は、アクチュレーションモデルの忠実度が不十分である。
また,本システムは,450〜m^2$の領域における実環境下でのリアルタイムカメラ検出を用いて,検索・キャプチャーアプリケーションで実演する。
この研究は、アクティベーションモデルの忠実度の向上、ドメインランダム化のターゲット化、モジュール間の遅延とタイムスタンプの慎重な管理など、信頼性の高い転送のための実践的なレッスンを精査し、残りの課題を強調した。
関連論文リスト
- Instantaneous Planning, Control and Safety for Navigation in Unknown Underwater Spaces [0.21108097398435333]
未知の環境で自律型水中車両(AUV)を航行することは極めて困難である。
これらの要因は、正確なグローバルローカライゼーション、信頼性の高い通信、障害物回避において課題を提起する。
本研究では,実時間センサデータを利用して閉ループAUV軌道を動的に誘導する統合計画制御フレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-07T01:32:29Z) - Compressive sensing inspired self-supervised single-pixel imaging [48.79613794195208]
SISTA-Netは、単画素イメージングのための圧縮センシングインスパイアされた自己教師方式である。
我々は、適応スパース変換と学習可能なソフトスレッショルド演算子を組み合わせることで、潜伏領域に明示的な物理的間隔を課すために、ディープ非線形ネットワークを利用する。
複数のシミュレーションシナリオの実験では、SISTA-NetはPSNRの2.6dBで最先端の手法より優れていた。
論文 参考訳(メタデータ) (2026-03-31T13:31:43Z) - ARTIS: Agentic Risk-Aware Test-Time Scaling via Iterative Simulation [72.78362530982109]
ARTIS(Agenic Risk-Aware Test-Time Scaling via Iterative Simulation)は、コミットメントから探索を分離するフレームワークである。
LLMをベースとした簡易シミュレータは, 希少かつ高インパクトな障害モードの捕捉に苦慮していることを示す。
本稿では,障害発生行動の忠実度を強調するリスク認識ツールシミュレータを提案する。
論文 参考訳(メタデータ) (2026-02-02T06:33:22Z) - Towards reliable subsea object recovery: a simulation study of an auv with a suction-actuated end effector [1.1984905847118061]
本稿では,ハダル小型車両(HSV)を用いた完全自律海底物体回収ミッションのシミュレーションに基づく研究について述べる。
ストーンフィッシュシミュレーターは、現実的な車両力学、流体力学の障害、センシング、およびハダルのような条件下での標的物体との相互作用をモデル化するために使用される。
HSVは海面から6000mまで自律的に降下し、構造的な海底被覆を行い、対象物を検出し、吸引による回復を行う。
論文 参考訳(メタデータ) (2026-01-03T07:55:23Z) - A2VISR: An Active and Adaptive Ground-Aerial Localization System Using Visual Inertial and Single-Range Fusion [17.59898575353575]
これは、地上と航空の協調システムを用いて、散在した環境下での飛行ロボットのロケライズロバスト性を高めるための実践的なアプローチである。
我々は、アクティブビジョン、単一配列、慣性計測、光学フローを統合した地上局地化フレームワークをより包括的に改善する。
提案手法は、平均根平均平方誤差が約0.09mであり、損失とセンサ故障を捕捉するためのレジリエンスを維持しながら、ロバストなオンラインローカライゼーションを実現する。
論文 参考訳(メタデータ) (2025-12-18T10:07:06Z) - A Sensor-Aware Phenomenological Framework for Lidar Degradation Simulation and SLAM Robustness Evaluation [1.9228699691035367]
ライダーベースのSLAMシステムは、ノイズや視野分解(FoV)などの悪条件に非常に敏感である。
本稿では,実点雲上で直接解釈可能なライダー劣化をシミュレーションするためのセンサ・アウェア・フレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-09T14:41:20Z) - DARTH: Holistic Test-time Adaptation for Multiple Object Tracking [87.72019733473562]
複数物体追跡(MOT)は、自律運転における知覚システムの基本的構成要素である。
運転システムの安全性の追求にもかかわらず、テスト時間条件における領域シフトに対するMOT適応問題に対する解決策は提案されていない。
我々はMOTの総合的なテスト時間適応フレームワークであるDARTHを紹介する。
論文 参考訳(メタデータ) (2023-10-03T10:10:42Z) - Testing Rare Downstream Safety Violations via Upstream Adaptive Sampling
of Perception Error Models [20.815131169609316]
本稿では,センサベース検出システムにおける知覚誤差モデルと,状態依存適応的重要度サンプリングを組み合わせる。
RGB障害物検出器を備えた自律制動システムを用いた実験により, 精度の高い故障確率を算出できることが判明した。
論文 参考訳(メタデータ) (2022-09-20T12:26:06Z) - Visual-tactile sensing for Real-time liquid Volume Estimation in
Grasping [58.50342759993186]
変形性容器内の液体をリアルタイムに推定するためのビジュオ触覚モデルを提案する。
我々は、RGBカメラからの生の視覚入力と、特定の触覚センサーからの触覚手がかりの2つの感覚モードを融合する。
ロボットシステムは、推定モデルに基づいて、リアルタイムで適切に制御され、調整される。
論文 参考訳(メタデータ) (2022-02-23T13:38:31Z) - Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。
連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。
我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文 参考訳(メタデータ) (2021-11-15T18:50:04Z) - Transferable Active Grasping and Real Embodied Dataset [48.887567134129306]
ハンドマウント型RGB-Dカメラを用いて把握可能な視点を探索する方法を示す。
現実的な3段階の移動可能な能動把握パイプラインを開発し、未確認のクラッタシーンに適応する。
本研究のパイプラインでは,カテゴリ非関連行動の把握と確保において,スパース報酬問題を克服するために,新しいマスク誘導報酬を提案する。
論文 参考訳(メタデータ) (2020-04-28T08:15:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。