論文の概要: Sim2Sim Evaluation of a Novel Data-Efficient Differentiable Physics
Engine for Tensegrity Robots
- arxiv url: http://arxiv.org/abs/2011.04929v2
- Date: Fri, 23 Jul 2021 23:08:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-27 07:13:21.029738
- Title: Sim2Sim Evaluation of a Novel Data-Efficient Differentiable Physics
Engine for Tensegrity Robots
- Title(参考訳): テンサイグロボットのためのデータ効率の良い微分可能物理エンジンのSim2Sim評価
- Authors: Kun Wang, Mridul Aanjaneya and Kostas Bekris
- Abstract要約: シミュレーションにおける学習ポリシーは、ロボットコントローラーを訓練する際の人間の労力を減らすことを約束している。
Sim2realのギャップは、シミュレーションから本物のロボットへのポリシーの転送に成功するための主要な障壁である。
この研究は、データ駆動のエンドツーエンドの微分可能シミュレータを提案する。
- 参考スコア(独自算出の注目度): 10.226310620727942
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning policies in simulation is promising for reducing human effort when
training robot controllers. This is especially true for soft robots that are
more adaptive and safe but also more difficult to accurately model and control.
The sim2real gap is the main barrier to successfully transfer policies from
simulation to a real robot. System identification can be applied to reduce this
gap but traditional identification methods require a lot of manual tuning.
Data-driven alternatives can tune dynamical models directly from data but are
often data hungry, which also incorporates human effort in collecting data.
This work proposes a data-driven, end-to-end differentiable simulator focused
on the exciting but challenging domain of tensegrity robots. To the best of the
authors' knowledge, this is the first differentiable physics engine for
tensegrity robots that supports cable, contact, and actuation modeling. The aim
is to develop a reasonably simplified, data-driven simulation, which can learn
approximate dynamics with limited ground truth data. The dynamics must be
accurate enough to generate policies that can be transferred back to the
ground-truth system. As a first step in this direction, the current work
demonstrates sim2sim transfer, where the unknown physical model of MuJoCo acts
as a ground truth system. Two different tensegrity robots are used for
evaluation and learning of locomotion policies, a 6-bar and a 3-bar tensegrity.
The results indicate that only 0.25\% of ground truth data are needed to train
a policy that works on the ground truth system when the differentiable engine
is used for training against training the policy directly on the ground truth
system.
- Abstract(参考訳): シミュレーションにおける学習方針は、ロボットコントローラのトレーニングにおける人間の労力を減らすことに有望である。
これは、より適応的で安全でありながら、正確にモデル化と制御が難しいソフトロボットに特に当てはまる。
sim2real gapは、シミュレーションから実際のロボットへポリシーをうまく移行するための主要な障壁である。
システム識別は、このギャップを減らすために応用できるが、従来の識別方法は、多くの手動チューニングを必要とする。
データ駆動の代替手段は、データから直接動的モデルをチューニングできるが、しばしばデータに飢えている。
この研究は、テンセグリティロボットのエキサイティングだが挑戦的な領域に焦点を当てたデータ駆動、エンドツーエンドの微分可能シミュレータを提案する。
著者たちの知る限りでは、これはケーブル、接触、アクチベーションモデリングをサポートするtensegrityロボットにとって、最初の微分可能な物理エンジンである。
目的は、限定された基底真理データで近似力学を学習できる、合理的に単純化されたデータ駆動シミュレーションを開発することである。
ダイナミクスは、地上システムに戻ることができるポリシーを生成するのに十分正確でなければなりません。
この方向への第一歩として、現在の研究は、無名の MuJoCo の物理モデルが基底真理系として機能するsim2sim 転送を実証している。
2つの異なるtensegrityロボットがロコモーションポリシーの評価と学習に使用され、6バーと3バーのtensegrityである。
この結果から, 基本真理システム上での政策訓練に異種エンジンを用いる場合, 基本真理システム上で機能する政策の訓練には, 0.25 % のグラウンド真理データしか必要とされないことがわかった。
関連論文リスト
- Dynamics as Prompts: In-Context Learning for Sim-to-Real System Identifications [23.94013806312391]
そこで本研究では,テキスト内学習を用いてシミュレーション環境パラメータを動的に調整する手法を提案する。
オブジェクトスクーピングとテーブルエアホッケーという2つのタスクにまたがるアプローチを検証する。
提案手法は,ロボットの動的現実シナリオへの展開を推し進め,効率的かつスムーズなシステム識別を実現する。
論文 参考訳(メタデータ) (2024-10-27T07:13:38Z) - Bridging the Sim-to-Real Gap with Bayesian Inference [53.61496586090384]
データからロボットダイナミクスを学習するためのSIM-FSVGDを提案する。
我々は、ニューラルネットワークモデルのトレーニングを規則化するために、低忠実度物理プリエンスを使用します。
高性能RCレースカーシステムにおけるSIM-to-realギャップのブリッジ化におけるSIM-FSVGDの有効性を実証する。
論文 参考訳(メタデータ) (2024-03-25T11:29:32Z) - Learning to navigate efficiently and precisely in real environments [14.52507964172957]
Embodied AIの文献は、HabitatやAI-Thorといったシミュレータで訓練されたエンドツーエンドエージェントに焦点を当てている。
本研究では,sim2realのギャップを最小限に抑えたシミュレーションにおけるエージェントのエンドツーエンドトレーニングについて検討する。
論文 参考訳(メタデータ) (2024-01-25T17:50:05Z) - Robot Fine-Tuning Made Easy: Pre-Training Rewards and Policies for
Autonomous Real-World Reinforcement Learning [58.3994826169858]
ロボット強化学習のためのリセット不要な微調整システムであるRoboFuMEを紹介する。
我々の洞察は、オフラインの強化学習技術を利用して、事前訓練されたポリシーの効率的なオンライン微調整を確保することである。
提案手法では,既存のロボットデータセットからのデータを組み込んで,目標タスクを3時間以内の自律現実体験で改善することができる。
論文 参考訳(メタデータ) (2023-10-23T17:50:08Z) - Robust Visual Sim-to-Real Transfer for Robotic Manipulation [79.66851068682779]
シミュレーションにおけるビジュモータポリシーの学習は、現実世界よりも安全で安価である。
しかし、シミュレーションデータと実データとの相違により、シミュレータ訓練されたポリシーは実際のロボットに転送されると失敗することが多い。
視覚的なsim-to-real領域ギャップを埋める一般的なアプローチは、ドメインランダム化(DR)である。
論文 参考訳(メタデータ) (2023-07-28T05:47:24Z) - Real2Sim2Real Transfer for Control of Cable-driven Robots via a
Differentiable Physics Engine [9.268539775233346]
テンセグリティロボットは、高い強度と重量比と大きな変形を示す。
しかし、それらは高次元性、複雑な力学、結合アーキテクチャのために制御が難しい。
本稿では,Real2Sim2Real(R2S2R)戦略について述べる。
論文 参考訳(メタデータ) (2022-09-13T18:51:26Z) - Real-to-Sim: Predicting Residual Errors of Robotic Systems with Sparse
Data using a Learning-based Unscented Kalman Filter [65.93205328894608]
我々は,動的・シミュレータモデルと実ロボット間の残差を学習する。
学習した残差誤差により、動的モデル、シミュレーション、および実際のハードウェア間の現実的ギャップをさらに埋めることができることを示す。
論文 参考訳(メタデータ) (2022-09-07T15:15:12Z) - A Recurrent Differentiable Engine for Modeling Tensegrity Robots
Trainable with Low-Frequency Data [10.226310620727942]
複雑な力学と多数のDoFが存在するため、テンセグリティロボットを正確にモデル化し、制御することは困難である。
微分可能な物理エンジンは、そのような複雑なロボットシステムのモデル同定のためのデータ駆動型アプローチとして最近提案されている。
微分可能なエンジンを訓練するための地上の真理軌道は通常、現実世界のセンサーの限界のためにそのような高周波数では利用できない。
論文 参考訳(メタデータ) (2022-02-28T19:14:27Z) - Towards Optimal Strategies for Training Self-Driving Perception Models
in Simulation [98.51313127382937]
合成ドメインのみにおけるラベルの使用に焦点を当てる。
提案手法では,ニューラル不変表現の学習方法と,シミュレータからデータをサンプリングする方法に関する理論的にインスピレーションを得た視点を導入する。
マルチセンサーデータを用いた鳥眼視車両分割作業におけるアプローチについて紹介する。
論文 参考訳(メタデータ) (2021-11-15T18:37:43Z) - Robot Learning from Randomized Simulations: A Review [59.992761565399185]
ディープラーニングがロボティクス研究のパラダイムシフトを引き起こし、大量のデータを必要とする方法が好まれている。
最先端のアプローチは、データ生成が高速かつ安価であるシミュレーションで学ぶ。
本稿では,ランダム化シミュレーションから学習する手法である「領域ランダム化」に焦点をあてる。
論文 参考訳(メタデータ) (2021-11-01T13:55:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。