論文の概要: DRIFT: Deep Reinforcement Learning for Intelligent Floating Platforms
Trajectories
- arxiv url: http://arxiv.org/abs/2310.04266v1
- Date: Fri, 6 Oct 2023 14:11:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-09 16:09:02.885008
- Title: DRIFT: Deep Reinforcement Learning for Intelligent Floating Platforms
Trajectories
- Title(参考訳): DRIFT:Intelligent Floating Platforms Trajectoriesのための深層強化学習
- Authors: Matteo El-Hariry, Antoine Richard, Vivek Muralidharan, Baris Can
Yalcin, Matthieu Geist, Miguel Olivares-Mendez
- Abstract要約: フローティングプラットフォームは、地球上の微小重力環境をエミュレートするための多用途テストベッドとして機能する。
私たちのスイートは、シミュレーションから現実への堅牢性、適応性、優れた転送性を実現します。
- 参考スコア(独自算出の注目度): 18.420795137038677
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This investigation introduces a novel deep reinforcement learning-based suite
to control floating platforms in both simulated and real-world environments.
Floating platforms serve as versatile test-beds to emulate microgravity
environments on Earth. Our approach addresses the system and environmental
uncertainties in controlling such platforms by training policies capable of
precise maneuvers amid dynamic and unpredictable conditions. Leveraging
state-of-the-art deep reinforcement learning techniques, our suite achieves
robustness, adaptability, and good transferability from simulation to reality.
Our Deep Reinforcement Learning (DRL) framework provides advantages such as
fast training times, large-scale testing capabilities, rich visualization
options, and ROS bindings for integration with real-world robotic systems.
Beyond policy development, our suite provides a comprehensive platform for
researchers, offering open-access at
https://github.com/elharirymatteo/RANS/tree/ICRA24.
- Abstract(参考訳): 本研究は,シミュレーション環境と実環境の両方において浮遊プラットフォームを制御するための,新しい深層強化学習ベーススイートを提案する。
フローティングプラットフォームは、地球上の微小重力環境をエミュレートするための多用途テストベッドとして機能する。
本手法は,動的かつ予測不能な状況下で正確な操作が可能な政策を訓練することにより,プラットフォーム制御におけるシステムと環境の不確実性に対処する。
最先端の深層強化学習技術を活用して,シミュレーションから現実へのロバスト性,適応性,良好な伝達性を実現する。
私たちのDeep Reinforcement Learning (DRL)フレームワークは、高速トレーニング時間、大規模テスト機能、リッチな可視化オプション、実世界のロボットシステムとの統合のためのROSバインディングといった利点を提供します。
ポリシー開発以外にも、我々のスイートは研究者のための包括的なプラットフォームを提供し、https://github.com/elharirymatteo/RANS/tree/ICRA24でオープンアクセスを提供します。
関連論文リスト
- Learning to Fly in Seconds [8.159171440455824]
カリキュラム学習と高度に最適化されたシミュレータが,サンプルの複雑さを増し,学習時間の短縮につながることを示す。
我々のフレームワークは、コンシューマ級ラップトップで18秒のトレーニングをした後、直接制御するためのSimulation-to-Real(Sim2Real)転送を可能にする。
論文 参考訳(メタデータ) (2023-11-22T01:06:45Z) - Drive Anywhere: Generalizable End-to-end Autonomous Driving with
Multi-modal Foundation Models [114.69732301904419]
本稿では、画像とテキストで検索可能な表現から、運転決定を提供することができる、エンドツーエンドのオープンセット(環境/シーン)自律運転を適用するアプローチを提案する。
当社のアプローチでは, 多様なテストにおいて非並列的な結果を示すと同時に, アウト・オブ・ディストリビューションの状況において, はるかに高いロバスト性を実現している。
論文 参考訳(メタデータ) (2023-10-26T17:56:35Z) - Learning and Adapting Agile Locomotion Skills by Transferring Experience [71.8926510772552]
本稿では,既存のコントローラから新しいタスクを学習するために経験を移譲することで,複雑なロボティクススキルを訓練するためのフレームワークを提案する。
提案手法は,複雑なアジャイルジャンプ行動の学習,後肢を歩いたまま目標地点への移動,新しい環境への適応を可能にする。
論文 参考訳(メタデータ) (2023-04-19T17:37:54Z) - Residual Physics Learning and System Identification for Sim-to-real
Transfer of Policies on Buoyancy Assisted Legged Robots [14.760426243769308]
本研究では,BALLUロボットのシステム識別による制御ポリシのロバストなシミュレートを実演する。
標準的な教師あり学習の定式化に頼るのではなく、深層強化学習を利用して外部力政策を訓練する。
シミュレーショントラジェクトリと実世界のトラジェクトリを比較することで,改良されたシミュレーション忠実度を解析する。
論文 参考訳(メタデータ) (2023-03-16T18:49:05Z) - The SwaNNFlight System: On-the-Fly Sim-to-Real Adaptation via Anchored
Learning [40.99371018933319]
私たちは、市販のハードウェアで作られた四脚のエージェントを訓練し、適応します。
SwaNNFlightは,エージェントの観察を無線で取得・転送できる,オープンソースのファームウェアである。
また、SwaNNFlight System(SwaNNFS)を設計し、類似システム上での学習エージェントのトレーニングと実地適応に関する新たな研究を可能にする。
論文 参考訳(メタデータ) (2023-01-17T16:16:53Z) - PIC4rl-gym: a ROS2 modular framework for Robots Autonomous Navigation
with Deep Reinforcement Learning [0.4588028371034407]
この研究は、ナビゲーションと学習の研究を強化するための基本的なモジュラーフレームワークであるtextitPIC4rl-gymを導入している。
本稿では、DRLエージェントのトレーニングとテストを完全に統合したPIC4rl-gymの全体構造について述べる。
モジュラーアプローチは、新しいプラットフォーム、センサー、モデルを選択することで、シミュレーションを簡単にカスタマイズするために採用されている。
論文 参考訳(メタデータ) (2022-11-19T14:58:57Z) - DeXtreme: Transfer of Agile In-hand Manipulation from Simulation to
Reality [64.51295032956118]
我々は人型ロボットの手で頑健な操作を行える政策を訓練する。
本研究は,各種ハードウェアおよびシミュレータのデクスタラス操作におけるsim-to-real転送の可能性を再確認する。
論文 参考訳(メタデータ) (2022-10-25T01:51:36Z) - A Walk in the Park: Learning to Walk in 20 Minutes With Model-Free
Reinforcement Learning [86.06110576808824]
深層強化学習は、制御されていない環境での学習ポリシーに対する有望なアプローチである。
機械学習アルゴリズムとライブラリの最近の進歩と、慎重に調整されたロボットコントローラを組み合わせることで、現実世界では4分で学習できる。
論文 参考訳(メタデータ) (2022-08-16T17:37:36Z) - VISTA 2.0: An Open, Data-driven Simulator for Multimodal Sensing and
Policy Learning for Autonomous Vehicles [131.2240621036954]
VISTAはオープンソースのデータ駆動シミュレータで、複数のタイプのセンサーを自律走行車に組み込む。
高忠実で実世界のデータセットを使用して、VISTAはRGBカメラ、3D LiDAR、イベントベースのカメラを表現し、シミュレートする。
センサタイプ毎に知覚制御ポリシーをトレーニングし,テストする能力を示し,フルスケールの自律走行車への展開を通じて,このアプローチのパワーを示す。
論文 参考訳(メタデータ) (2021-11-23T18:58:10Z) - Multi-Robot Deep Reinforcement Learning for Mobile Navigation [82.62621210336881]
階層的統合モデル(HInt)を用いた深層強化学習アルゴリズムを提案する。
トレーニング時には、HIntは別々の知覚モデルとダイナミクスモデルを学び、テスト時には、HIntは2つのモデルを階層的な方法で統合し、統合モデルとアクションを計画する。
我々のモバイルナビゲーション実験は、HIntが従来の階層的ポリシーや単一ソースアプローチよりも優れていることを示している。
論文 参考訳(メタデータ) (2021-06-24T19:07:40Z) - Learning to Fly -- a Gym Environment with PyBullet Physics for
Reinforcement Learning of Multi-agent Quadcopter Control [0.0]
本稿では,Bullet物理エンジンに基づく複数クワッドコプターのオープンソース環境を提案する。
マルチエージェントおよびビジョンベースの強化学習インターフェース、および現実的な衝突と空力効果のサポートは、私たちの知識の最高に、その種の最初のものにします。
論文 参考訳(メタデータ) (2021-03-03T02:47:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。