論文の概要: Sim2Dust: Mastering Dynamic Waypoint Tracking on Granular Media
- arxiv url: http://arxiv.org/abs/2508.11503v1
- Date: Fri, 15 Aug 2025 14:30:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-18 14:51:24.048291
- Title: Sim2Dust: Mastering Dynamic Waypoint Tracking on Granular Media
- Title(参考訳): Sim2Dust: グラニュラーメディア上での動的ウェイポイントトラッキングのマスタリング
- Authors: Andrej Orsula, Matthieu Geist, Miguel Olivares-Mendez, Carol Martinez,
- Abstract要約: 本研究は,挑戦面上での動的ウェイポイントトラッキングのためのロバストな制御ポリシを開発するための,完全なsim-to-realフレームワークを提案する。
我々は超並列シミュレーションを利用して、プロシージャ生成環境の広範囲にわたる強化学習エージェントを訓練する。
本実験は,複数の強化学習アルゴリズムと動作平滑化フィルタを体系的に比較し,実世界の展開において最も効果的な組み合わせを同定する。
- 参考スコア(独自算出の注目度): 19.76267553432585
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reliable autonomous navigation across the unstructured terrains of distant planetary surfaces is a critical enabler for future space exploration. However, the deployment of learning-based controllers is hindered by the inherent sim-to-real gap, particularly for the complex dynamics of wheel interactions with granular media. This work presents a complete sim-to-real framework for developing and validating robust control policies for dynamic waypoint tracking on such challenging surfaces. We leverage massively parallel simulation to train reinforcement learning agents across a vast distribution of procedurally generated environments with randomized physics. These policies are then transferred zero-shot to a physical wheeled rover operating in a lunar-analogue facility. Our experiments systematically compare multiple reinforcement learning algorithms and action smoothing filters to identify the most effective combinations for real-world deployment. Crucially, we provide strong empirical evidence that agents trained with procedural diversity achieve superior zero-shot performance compared to those trained on static scenarios. We also analyze the trade-offs of fine-tuning with high-fidelity particle physics, which offers minor gains in low-speed precision at a significant computational cost. Together, these contributions establish a validated workflow for creating reliable learning-based navigation systems, marking a critical step towards deploying autonomous robots in the final frontier.
- Abstract(参考訳): 遠い惑星表面の非構造地形を横断する信頼性の高い自律航法は、将来の宇宙探査にとって重要な手段である。
しかし、学習ベースのコントローラの展開は、特に粒状媒体との車輪相互作用の複雑なダイナミクスのために、固有のsim-to-realギャップによって妨げられている。
本研究は,このような困難面上での動的ウェイポイントトラッキングのためのロバストな制御ポリシの開発と検証のための,完全なsim-to-realフレームワークを提案する。
我々は、超並列シミュレーションを利用して、ランダム化物理学を用いた手続き的に生成された膨大な環境を横断する強化学習エージェントを訓練する。
これらのポリシーは、月面アナローグ施設で運用されている物理的車輪付きのローバーにゼロショットで転送される。
本実験は,複数の強化学習アルゴリズムと動作平滑化フィルタを体系的に比較し,実世界の展開において最も効果的な組み合わせを同定する。
重要なことは、手続き的多様性で訓練されたエージェントが静的シナリオで訓練されたエージェントよりも優れたゼロショット性能を達成するという、強力な実証的証拠を提供する。
また,高忠実度粒子物理学による微調整のトレードオフを解析し,低速精度で計算コストが大幅に向上することを示した。
これらのコントリビューションは、信頼性の高い学習ベースのナビゲーションシステムを構築するための検証済みワークフローを確立し、最終フロンティアで自律ロボットをデプロイするための重要なステップをマークする。
関連論文リスト
- A General Infrastructure and Workflow for Quadrotor Deep Reinforcement Learning and Reality Deployment [48.90852123901697]
本稿では, エンドツーエンドの深層強化学習(DRL)ポリシーを四元数へシームレスに移行できるプラットフォームを提案する。
本プラットフォームは, ホバリング, 動的障害物回避, 軌道追尾, 気球打上げ, 未知環境における計画など, 多様な環境を提供する。
論文 参考訳(メタデータ) (2025-04-21T14:25:23Z) - Real-time Spatial-temporal Traversability Assessment via Feature-based Sparse Gaussian Process [14.428139979659395]
地上移動ロボットを現実のタスクに応用するためには,地形解析が重要である。
本研究では,自律型ロボットが複雑な地形を移動できるようにすることを目的とした,空間的時間的トラバーサビリティ評価手法を提案する。
本研究では,移動可能性マップと統合された自律ナビゲーションフレームワークを開発し,複雑な屋外環境での微分駆動車による検証を行う。
論文 参考訳(メタデータ) (2025-03-06T06:26:57Z) - Autonomous Vehicle Controllers From End-to-End Differentiable Simulation [60.05963742334746]
そこで我々は,AVコントローラのトレーニングにAPG(analytic Policy gradients)アプローチを適用可能なシミュレータを提案し,その設計を行う。
提案するフレームワークは, エージェントがより根底的なポリシーを学ぶのを助けるために, 環境力学の勾配を役立てる, エンド・ツー・エンドの訓練ループに, 微分可能シミュレータを組み込む。
ダイナミクスにおけるパフォーマンスとノイズに対する堅牢性の大幅な改善と、全体としてより直感的なヒューマンライクな処理が見られます。
論文 参考訳(メタデータ) (2024-09-12T11:50:06Z) - Gaussian Splatting to Real World Flight Navigation Transfer with Liquid Networks [93.38375271826202]
本研究では,シミュレート・トゥ・リアルな視覚四重項ナビゲーションタスクにおける分布シフトに対する一般化とロバスト性を改善する手法を提案する。
まず,擬似飛行力学とガウススプラッティングを統合してシミュレータを構築し,その後,液状ニューラルネットワークを用いてロバストなナビゲーションポリシーを訓練する。
このようにして、我々は3次元ガウススプラッティングラディアンス場レンダリング、専門家による実演訓練データのプログラミング、およびLiquid Networkのタスク理解能力の進歩を組み合わせたフルスタックの模倣学習プロトコルを得る。
論文 参考訳(メタデータ) (2024-06-21T13:48:37Z) - Residual Physics Learning and System Identification for Sim-to-real
Transfer of Policies on Buoyancy Assisted Legged Robots [14.760426243769308]
本研究では,BALLUロボットのシステム識別による制御ポリシのロバストなシミュレートを実演する。
標準的な教師あり学習の定式化に頼るのではなく、深層強化学習を利用して外部力政策を訓練する。
シミュレーショントラジェクトリと実世界のトラジェクトリを比較することで,改良されたシミュレーション忠実度を解析する。
論文 参考訳(メタデータ) (2023-03-16T18:49:05Z) - Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。
連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。
我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文 参考訳(メタデータ) (2021-11-15T18:50:04Z) - Point Cloud Based Reinforcement Learning for Sim-to-Real and Partial
Observability in Visual Navigation [62.22058066456076]
強化学習(Reinforcement Learning, RL)は、複雑なロボットタスクを解決する強力なツールである。
RL は sim-to-real transfer problem として知られる現実世界では直接作用しない。
本稿では,点雲と環境ランダム化によって構築された観測空間を学習する手法を提案する。
論文 参考訳(メタデータ) (2020-07-27T17:46:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。