論文の概要: Residual Physics Learning and System Identification for Sim-to-real
Transfer of Policies on Buoyancy Assisted Legged Robots
- arxiv url: http://arxiv.org/abs/2303.09597v1
- Date: Thu, 16 Mar 2023 18:49:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-20 16:34:27.209507
- Title: Residual Physics Learning and System Identification for Sim-to-real
Transfer of Policies on Buoyancy Assisted Legged Robots
- Title(参考訳): 浮動小数点支援ロボットの残差物理学習と実物移動のためのシステム同定
- Authors: Nitish Sontakke, Hosik Chae, Sangjoon Lee, Tianle Huang, Dennis W.
Hong, Sehoon Ha
- Abstract要約: 本研究では,BALLUロボットのシステム識別による制御ポリシのロバストなシミュレートを実演する。
標準的な教師あり学習の定式化に頼るのではなく、深層強化学習を利用して外部力政策を訓練する。
シミュレーショントラジェクトリと実世界のトラジェクトリを比較することで,改良されたシミュレーション忠実度を解析する。
- 参考スコア(独自算出の注目度): 14.760426243769308
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The light and soft characteristics of Buoyancy Assisted Lightweight Legged
Unit (BALLU) robots have a great potential to provide intrinsically safe
interactions in environments involving humans, unlike many heavy and rigid
robots. However, their unique and sensitive dynamics impose challenges to
obtaining robust control policies in the real world. In this work, we
demonstrate robust sim-to-real transfer of control policies on the BALLU robots
via system identification and our novel residual physics learning method,
Environment Mimic (EnvMimic). First, we model the nonlinear dynamics of the
actuators by collecting hardware data and optimizing the simulation parameters.
Rather than relying on standard supervised learning formulations, we utilize
deep reinforcement learning to train an external force policy to match
real-world trajectories, which enables us to model residual physics with
greater fidelity. We analyze the improved simulation fidelity by comparing the
simulation trajectories against the real-world ones. We finally demonstrate
that the improved simulator allows us to learn better walking and turning
policies that can be successfully deployed on the hardware of BALLU.
- Abstract(参考訳): Buoyancy Assisted Lightweight Legged Unit(BALLU)ロボットの軽量で柔らかい特性は、重くて頑丈なロボットとは異なり、人間を含む環境において本質的に安全な相互作用を提供する大きな可能性を秘めている。
しかし、その独特で繊細なダイナミクスは、現実世界で堅牢な制御ポリシーを得るための課題を課す。
本研究では,BALLUロボットの制御ポリシを,システム識別と新しい物理学習手法である環境ミミック(EnvMimic)を用いて,ロバストなシミュレートと現実的な伝達を示す。
まず,ハードウェアデータの収集とシミュレーションパラメータの最適化により,アクチュエータの非線形ダイナミクスをモデル化する。
標準的な教師付き学習形式に頼るのではなく、深層強化学習を用いて実世界の軌道にマッチする外部力政策を訓練し、残留物理学をより忠実にモデル化する。
シミュレーショントラジェクトリと実世界のトラジェクトリを比較することで,改良されたシミュレーション忠実度を解析する。
最終的に、改良されたシミュレータにより、BALLUのハードウェアにうまくデプロイできる歩行および旋回ポリシーを学習できることを示した。
関連論文リスト
- LoopSR: Looping Sim-and-Real for Lifelong Policy Adaptation of Legged Robots [20.715834172041763]
本稿では,生涯にわたるポリシー適応フレームワークであるLoopSRを提案する。
さらなる改善のためにシミュレーションで現実世界の環境を再構築する。
継続的なトレーニングを活用することで、LoopSRは強力なベースラインに比べて優れたデータ効率を達成する。
論文 参考訳(メタデータ) (2024-09-26T16:02:25Z) - Gaussian Splatting to Real World Flight Navigation Transfer with Liquid Networks [93.38375271826202]
本研究では,シミュレート・トゥ・リアルな視覚四重項ナビゲーションタスクにおける分布シフトに対する一般化とロバスト性を改善する手法を提案する。
まず,擬似飛行力学とガウススプラッティングを統合してシミュレータを構築し,その後,液状ニューラルネットワークを用いてロバストなナビゲーションポリシーを訓練する。
このようにして、我々は3次元ガウススプラッティングラディアンス場レンダリング、専門家による実演訓練データのプログラミング、およびLiquid Networkのタスク理解能力の進歩を組み合わせたフルスタックの模倣学習プロトコルを得る。
論文 参考訳(メタデータ) (2024-06-21T13:48:37Z) - DrEureka: Language Model Guided Sim-To-Real Transfer [64.14314476811806]
シミュレーションで学んだ政策を現実世界に伝達することは、ロボットのスキルを大規模に獲得する上で有望な戦略である。
本稿では,Large Language Models (LLMs) を用いてシム・トゥ・リアル設計の自動化と高速化を行う。
本手法では,ヨガボールの上を歩行する四足歩行や四足歩行など,新しいロボットタスクを解くことができる。
論文 参考訳(メタデータ) (2024-06-04T04:53:05Z) - Towards Transferring Tactile-based Continuous Force Control Policies
from Simulation to Robot [19.789369416528604]
グリップフォースコントロールは、物体に作用する力の量を制限することによって、物体を安全に操作することを目的としている。
以前の作品では、手動制御器、モデルベースのアプローチ、あるいはsim-to-realトランスファーを示さなかった。
シミュレーションで訓練されたモデルなしの深層強化学習手法を提案し,さらに微調整を行わずにロボットに移行した。
論文 参考訳(メタデータ) (2023-11-13T11:29:06Z) - DeXtreme: Transfer of Agile In-hand Manipulation from Simulation to
Reality [64.51295032956118]
我々は人型ロボットの手で頑健な操作を行える政策を訓練する。
本研究は,各種ハードウェアおよびシミュレータのデクスタラス操作におけるsim-to-real転送の可能性を再確認する。
論文 参考訳(メタデータ) (2022-10-25T01:51:36Z) - Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。
連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。
我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文 参考訳(メタデータ) (2021-11-15T18:50:04Z) - TrafficSim: Learning to Simulate Realistic Multi-Agent Behaviors [74.67698916175614]
リアル交通シミュレーションのためのマルチエージェント行動モデルであるTrafficSimを提案する。
特に、暗黙の潜在変数モデルを利用して、共同アクターポリシーをパラメータ化する。
TrafficSimは、多様なベースラインと比較して、より現実的で多様なトラフィックシナリオを生成します。
論文 参考訳(メタデータ) (2021-01-17T00:29:30Z) - Point Cloud Based Reinforcement Learning for Sim-to-Real and Partial
Observability in Visual Navigation [62.22058066456076]
強化学習(Reinforcement Learning, RL)は、複雑なロボットタスクを解決する強力なツールである。
RL は sim-to-real transfer problem として知られる現実世界では直接作用しない。
本稿では,点雲と環境ランダム化によって構築された観測空間を学習する手法を提案する。
論文 参考訳(メタデータ) (2020-07-27T17:46:59Z) - Sim2Real Transfer for Reinforcement Learning without Dynamics
Randomization [0.0]
カーデシアン空間における強化学習において,作業空間制御フレームワーク(OSC)を協調的およびカルデシアン的制約下で利用する方法について述べる。
提案手法は,動的ランダム化を伴わずにポリシーを伝達できる一方で,高速かつ調整可能な自由度で学習することができる。
論文 参考訳(メタデータ) (2020-02-19T11:10:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。