論文の概要: Safe Imitation Learning of Nonlinear Model Predictive Control for Flexible Robots
- arxiv url: http://arxiv.org/abs/2212.02941v3
- Date: Wed, 14 Aug 2024 20:40:17 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-16 19:30:50.009355
- Title: Safe Imitation Learning of Nonlinear Model Predictive Control for Flexible Robots
- Title(参考訳): フレキシブルロボットにおける非線形モデル予測制御の安全な模倣学習
- Authors: Shamil Mamedov, Rudolf Reiter, Seyed Mahdi Basiri Azad, Ruan Viljoen, Joschka Boedecker, Moritz Diehl, Jan Swevers,
- Abstract要約: 模擬学習と予測安全フィルタを用いたモデル予測制御(NMPC)の安全な近似のためのフレームワークを提案する。
NMPCと比較して、シミュレーションにおいて3次元フレキシブルロボットアームを制御する場合、計算時間は8倍以上改善されている。
高速で安全な近似NMPCの開発は、産業における柔軟なロボットの採用を加速する可能性を秘めている。
- 参考スコア(独自算出の注目度): 6.501150406218775
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Flexible robots may overcome some of the industry's major challenges, such as enabling intrinsically safe human-robot collaboration and achieving a higher payload-to-mass ratio. However, controlling flexible robots is complicated due to their complex dynamics, which include oscillatory behavior and a high-dimensional state space. Nonlinear model predictive control (NMPC) offers an effective means to control such robots, but its significant computational demand often limits its application in real-time scenarios. To enable fast control of flexible robots, we propose a framework for a safe approximation of NMPC using imitation learning and a predictive safety filter. Our framework significantly reduces computation time while incurring a slight loss in performance. Compared to NMPC, our framework shows more than an eightfold improvement in computation time when controlling a three-dimensional flexible robot arm in simulation, all while guaranteeing safety constraints. Notably, our approach outperforms state-of-the-art reinforcement learning methods. The development of fast and safe approximate NMPC holds the potential to accelerate the adoption of flexible robots in industry. The project code is available at: tinyurl.com/anmpc4fr
- Abstract(参考訳): フレキシブルロボットは、本質的に安全な人間とロボットのコラボレーションを可能にし、より高いペイロードと質量の比率を達成するなど、業界の主要な課題を克服する可能性がある。
しかし、振動挙動や高次元状態空間を含む複雑な力学のため、柔軟ロボットの制御は複雑である。
非線形モデル予測制御(NMPC)は、そのようなロボットを制御する効果的な手段を提供するが、その大きな計算要求は、しばしばリアルタイムシナリオでの応用を制限する。
フレキシブルロボットの高速制御を実現するために,模倣学習と予測安全フィルタを用いたNMPCの安全な近似のためのフレームワークを提案する。
我々のフレームワークは、性能をわずかに損なうことなく、計算時間を著しく短縮する。
NMPCと比較して、我々のフレームワークは3次元フレキシブルロボットアームをシミュレーションで制御する際の計算時間を8倍以上改善し、安全性の制約を保証している。
特に,本手法は最先端の強化学習法より優れている。
高速で安全な近似NMPCの開発は、産業における柔軟なロボットの採用を加速する可能性を秘めている。
プロジェクトのコードは以下の通り。 littleurl.com/anmpc4fr
関連論文リスト
- MAGICS: Adversarial RL with Minimax Actors Guided by Implicit Critic Stackelberg for Convergent Neural Synthesis of Robot Safety [1.3353672155935326]
Inlicit Critic Stackelberg (MAGICS)により導かれるMinimaxアクターは、最小値平衡解への局所収束を保証する新しい逆強化学習(RL)アルゴリズムである。
我々は、MAGICSが最先端のニューラルセーフティ合成法よりも優れたロバスト制御ポリシーを実現できることを示す。
論文 参考訳(メタデータ) (2024-09-20T19:45:48Z) - ABNet: Attention BarrierNet for Safe and Scalable Robot Learning [58.4951884593569]
バリアベースの手法は、安全なロボット学習における主要なアプローチの1つである。
本稿では,より大規模な基本安全モデルを段階的に構築するスケーラブルなAttention BarrierNet(ABNet)を提案する。
2次元ロボット障害物回避、安全なロボット操作、視覚に基づくエンドツーエンド自動運転におけるABNetの強みを実証する。
論文 参考訳(メタデータ) (2024-06-18T19:37:44Z) - Domain Randomization for Robust, Affordable and Effective Closed-loop
Control of Soft Robots [10.977130974626668]
ソフトロボットは、コンタクトや適応性に対する本質的な安全性によって人気を集めている。
本稿では、ソフトロボットのRLポリシーを強化することにより、ドメインランダム化(DR)がこの問題を解決する方法を示す。
本稿では,変形可能なオブジェクトに対する動的パラメータの自動推論のための,従来の適応的領域ランダム化手法に対する新しいアルゴリズム拡張を提案する。
論文 参考訳(メタデータ) (2023-03-07T18:50:00Z) - Learning Bipedal Walking for Humanoids with Current Feedback [5.429166905724048]
アクチュエータレベルでの不正確なトルクトラッキングから生じるヒューマノイドロボットのシム2リアルギャップ問題を克服するためのアプローチを提案する。
提案手法は、実際のHRP-5Pヒューマノイドロボットに展開して二足歩行を実現するシミュレーションにおいて、一貫したエンドツーエンドのポリシーをトレーニングする。
論文 参考訳(メタデータ) (2023-03-07T08:16:46Z) - Constrained Dynamic Movement Primitives for Safe Learning of Motor
Skills [25.06692536893836]
ロボット作業空間における制約満足度を実現するための制約付き動的運動プリミティブ(CDMP)を提案する。
異なる環境における異なるマニピュレータを用いた提案アルゴリズムの実装を示すビデオがここにある。
論文 参考訳(メタデータ) (2022-09-28T22:59:33Z) - Active Predicting Coding: Brain-Inspired Reinforcement Learning for
Sparse Reward Robotic Control Problems [79.07468367923619]
ニューラルジェネレーティブ・コーディング(NGC)の神経認知計算フレームワークによるロボット制御へのバックプロパゲーションフリーアプローチを提案する。
我々は、スパース報酬から動的オンライン学習を容易にする強力な予測符号化/処理回路から完全に構築されたエージェントを設計する。
提案するActPCエージェントは,スパース(外部)報酬信号に対して良好に動作し,複数の強力なバックプロップベースのRLアプローチと競合し,性能が優れていることを示す。
論文 参考訳(メタデータ) (2022-09-19T16:49:32Z) - High-Speed Accurate Robot Control using Learned Forward Kinodynamics and
Non-linear Least Squares Optimization [42.92648945058518]
ロボットの動きのキノダイナミックな相互作用への依存は、高速でより顕著になる。
従来の研究から,逆キノダイナミックモデルの学習がロボットの高速制御に有効であることが示唆された。
本稿では,FKDモデルと非線形最小二乗最適化を併用した,高精度かつ高速なロボット制御のための新しい定式化を提案する。
論文 参考訳(メタデータ) (2022-06-16T23:52:01Z) - Model Predictive Control for Fluid Human-to-Robot Handovers [50.72520769938633]
人間の快適さを考慮に入れた計画運動は、人間ロボットのハンドオーバプロセスの一部ではない。
本稿では,効率的なモデル予測制御フレームワークを用いてスムーズな動きを生成することを提案する。
ユーザ数名の多様なオブジェクトに対して,人間とロボットのハンドオーバ実験を行う。
論文 参考訳(メタデータ) (2022-03-31T23:08:20Z) - Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。
連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。
我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文 参考訳(メタデータ) (2021-11-15T18:50:04Z) - SABER: Data-Driven Motion Planner for Autonomously Navigating
Heterogeneous Robots [112.2491765424719]
我々は、データ駆動型アプローチを用いて、異種ロボットチームをグローバルな目標に向けてナビゲートする、エンドツーエンドのオンラインモーションプランニングフレームワークを提案する。
モデル予測制御(SMPC)を用いて,ロボット力学を満たす制御入力を計算し,障害物回避時の不確実性を考慮した。
リカレントニューラルネットワークは、SMPC有限時間地平線解における将来の状態の不確かさを素早く推定するために用いられる。
ディープQ学習エージェントがハイレベルパスプランナーとして機能し、SMPCにロボットを望ましいグローバルな目標に向けて移動させる目標位置を提供する。
論文 参考訳(メタデータ) (2021-08-03T02:56:21Z) - Improving Input-Output Linearizing Controllers for Bipedal Robots via
Reinforcement Learning [85.13138591433635]
入力出力線形化コントローラの主な欠点は、正確な力学モデルが必要であり、入力制約を考慮できないことである。
本稿では,強化学習技術を用いた二足歩行ロボット制御の具体例について,両課題に対処する。
論文 参考訳(メタデータ) (2020-04-15T18:15:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。