論文の概要: TamedPUMA: safe and stable imitation learning with geometric fabrics
- arxiv url: http://arxiv.org/abs/2503.17432v1
- Date: Fri, 21 Mar 2025 13:13:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-25 14:33:21.201834
- Title: TamedPUMA: safe and stable imitation learning with geometric fabrics
- Title(参考訳): 為馬:幾何学的布地による安全で安定した模倣学習
- Authors: Saray Bakker, Rodrigo Pérez-Dattari, Cosimo Della Santina, Wendelin Böhmer, Javier Alonso-Mora,
- Abstract要約: イミテーション学習(IL)は、目標収束を伴うロボットに安定したタスク空間の動きを教えるための直感的で効果的な方法を提供する。
本研究では,この課題を,幾何学的ファブリックと呼ばれる動き生成の最近の発展にともなうILアルゴリズムであるTyodPUMAを用いて解決する。
その結果、衝突回避や関節リミットといった幾何学的制約をシームレスにブレンドできる安定した模倣学習戦略が得られた。
- 参考スコア(独自算出の注目度): 14.885339698387991
- License:
- Abstract: Using the language of dynamical systems, Imitation learning (IL) provides an intuitive and effective way of teaching stable task-space motions to robots with goal convergence. Yet, IL techniques are affected by serious limitations when it comes to ensuring safety and fulfillment of physical constraints. With this work, we solve this challenge via TamedPUMA, an IL algorithm augmented with a recent development in motion generation called geometric fabrics. As both the IL policy and geometric fabrics describe motions as artificial second-order dynamical systems, we propose two variations where IL provides a navigation policy for geometric fabrics. The result is a stable imitation learning strategy within which we can seamlessly blend geometrical constraints like collision avoidance and joint limits. Beyond providing a theoretical analysis, we demonstrate TamedPUMA with simulated and real-world tasks, including a 7-DoF manipulator.
- Abstract(参考訳): 動的システムの言語を用いて、Imitation Learning (IL)は、目標収束を伴うロボットに安定したタスク空間の動きを教えるための直感的で効果的な方法を提供する。
しかし、IL技術は、物理的な制約の安全性と履行の確保に関して、深刻な制限によって影響を受ける。
本研究では,この課題を,幾何学的ファブリックと呼ばれる動き生成の最近の発展にともなうILアルゴリズムであるTyodPUMAを用いて解決する。
ILポリシと幾何学的ファブリックの両方が、動きを人工的な二次力学系として記述するので、ILが幾何学的ファブリックのナビゲーションポリシーを提供する2つのバリエーションを提案する。
その結果、衝突回避や関節リミットといった幾何学的制約をシームレスにブレンドできる安定した模倣学習戦略が得られた。
理論解析の他に,7-DoFマニピュレータを含む実世界のタスクを模擬して,TyodPUMAを実証する。
関連論文リスト
- Residual Physics Learning and System Identification for Sim-to-real
Transfer of Policies on Buoyancy Assisted Legged Robots [14.760426243769308]
本研究では,BALLUロボットのシステム識別による制御ポリシのロバストなシミュレートを実演する。
標準的な教師あり学習の定式化に頼るのではなく、深層強化学習を利用して外部力政策を訓練する。
シミュレーショントラジェクトリと実世界のトラジェクトリを比較することで,改良されたシミュレーション忠実度を解析する。
論文 参考訳(メタデータ) (2023-03-16T18:49:05Z) - Smoothed Online Learning for Prediction in Piecewise Affine Systems [43.64498536409903]
本稿では,最近開発されたスムーズなオンライン学習フレームワークに基づく。
これは、断片的なアフィン系における予測とシミュレーションのための最初のアルゴリズムを提供する。
論文 参考訳(メタデータ) (2023-01-26T15:54:14Z) - Efficient Representations of Object Geometry for Reinforcement Learning
of Interactive Grasping Policies [29.998917158604694]
本稿では,様々な幾何学的に異なる実世界の物体の対話的把握を学習する強化学習フレームワークを提案する。
学習したインタラクティブなポリシーのビデオはhttps://maltemosbach.org/io/geometry_aware_grasping_policiesで公開されている。
論文 参考訳(メタデータ) (2022-11-20T11:47:33Z) - Learning Riemannian Stable Dynamical Systems via Diffeomorphisms [0.23204178451683263]
有害で自律的なロボットは、精巧な動的動作を巧みに実行できなければならない。
学習技術は、このようなダイナミックスキルのモデルを構築するために利用することができる。
これを実現するために、学習モデルは、所望の運動力学に類似した安定したベクトル場を符号化する必要がある。
論文 参考訳(メタデータ) (2022-11-06T16:28:45Z) - Guaranteed Conservation of Momentum for Learning Particle-based Fluid
Dynamics [96.9177297872723]
本稿では,学習物理シミュレーションにおける線形運動量を保証する新しい手法を提案する。
我々は、強い制約で運動量の保存を強制し、反対称的な連続的な畳み込み層を通して実現する。
提案手法により,学習シミュレータの物理的精度を大幅に向上させることができる。
論文 参考訳(メタデータ) (2022-10-12T09:12:59Z) - Differentiable Simulation of Soft Multi-body Systems [99.4302215142673]
我々は、Projective Dynamics内でトップダウン行列アセンブリアルゴリズムを開発する。
筋肉,関節トルク,空気圧管によって駆動される軟口蓋体に対して,異なる制御機構を導出する。
論文 参考訳(メタデータ) (2022-05-03T20:03:22Z) - Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。
連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。
我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文 参考訳(メタデータ) (2021-11-15T18:50:04Z) - DeepPhysics: a physics aware deep learning framework for real-time
simulation [0.0]
データ駆動手法を用いて超弾性材料をシミュレートする手法を提案する。
ニューラルネットワークは、境界条件と結果の変位場との間の非線形関係を学習するために訓練される。
その結果, 限られたデータ量でトレーニングしたネットワークアーキテクチャは, 1ミリ秒未満で変位場を予測できることがわかった。
論文 参考訳(メタデータ) (2021-09-17T12:15:47Z) - PlasticineLab: A Soft-Body Manipulation Benchmark with Differentiable
Physics [89.81550748680245]
PasticineLabと呼ばれる新しい微分可能な物理ベンチマークを導入する。
各タスクにおいて、エージェントはマニピュレータを使用して、プラスチックを所望の構成に変形させる。
本稿では,既存の強化学習(RL)手法と勾配に基づく手法について評価する。
論文 参考訳(メタデータ) (2021-04-07T17:59:23Z) - Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。
軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。
NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文 参考訳(メタデータ) (2020-12-04T18:59:32Z) - Scalable Differentiable Physics for Learning and Control [99.4302215142673]
微分物理学は、物理的対象や環境を含む問題を学習し、制御するための強力なアプローチである。
我々は、多数のオブジェクトとその相互作用をサポートすることができる微分可能物理学のためのスケーラブルなフレームワークを開発する。
論文 参考訳(メタデータ) (2020-07-04T19:07:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。