論文の概要: Safe Imitation Learning of Nonlinear Model Predictive Control for
Flexible Robots
- arxiv url: http://arxiv.org/abs/2212.02941v1
- Date: Tue, 6 Dec 2022 12:54:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-07 18:12:06.881689
- Title: Safe Imitation Learning of Nonlinear Model Predictive Control for
Flexible Robots
- Title(参考訳): 柔軟ロボットのための非線形モデル予測制御の安全模倣学習
- Authors: Shamil Mamedov, Rudolf Reiter, Moritz Diehl, Jan Swevers
- Abstract要約: フレキシブルロボットは、安全な人間とロボットのコラボレーションと、負荷と質量比の増加という業界の大きな問題を克服する可能性がある。
本研究では, フレキシブルロボットの非線形モデル予測制御(NMPC)について検討した。
ニューラルネットワークを関数近似器として用いたNMPCの模倣学習は,制御器の計算時間を大幅に改善できることを示す。
- 参考スコア(独自算出の注目度): 2.380039717474099
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Flexible robots may overcome the industry's major problems: safe human-robot
collaboration and increased load-to-mass ratio. However, oscillations and high
dimensional state space complicate the control of flexible robots. This work
investigates nonlinear model predictive control (NMPC) of flexible robots --
for simultaneous planning and control -- modeled via the rigid finite element
method. Although NMPC performs well in simulation, computational complexity
prevents its deployment in practice. We show that imitation learning of NMPC
with neural networks as function approximator can massively improve the
computation time of the controller at the cost of slight performance loss and,
more critically, loss of safety guarantees. We leverage a safety filter
formulated as a simpler NMPC to recover safety guarantees. Experiments on a
simulated three degrees of freedom flexible robot manipulator demonstrate that
the average computational time of the proposed safe approximate NMPC controller
is 3.6 ms while of the original NMPC is 11.8 ms. Fast and safe approximate NMPC
might facilitate the industry's adoption of flexible robots and new solutions
for similar problems, e.g., deformable object manipulation and soft robot
control.
- Abstract(参考訳): 柔軟なロボットは、安全な人間とロボットのコラボレーションと負荷対質量比の増加という業界の大きな問題を克服する可能性がある。
しかし、振動と高次元状態空間は柔軟ロボットの制御を複雑にする。
本研究では, 柔軟ロボットの非線形モデル予測制御(NMPC)を, 剛有限要素法を用いてモデル化した。
NMPCはシミュレーションでよく機能するが、計算の複雑さは実際の展開を妨げている。
機能近似器としてニューラルネットワークを用いたNMPCの模倣学習は、わずかな性能損失とより重大な安全保証の損失を犠牲にして、コントローラの計算時間を大幅に改善できることを示す。
我々は,より単純なnmpcとして定式化した安全フィルタを用いて安全保証を回復する。
シミュレーションされた3自由度フレキシブルロボットマニピュレータの実験では、提案された安全近似NMPCコントローラの平均計算時間は3.6msであり、元のNMPCは11.8msである。
関連論文リスト
- MAGICS: Adversarial RL with Minimax Actors Guided by Implicit Critic Stackelberg for Convergent Neural Synthesis of Robot Safety [1.3353672155935326]
Inlicit Critic Stackelberg (MAGICS)により導かれるMinimaxアクターは、最小値平衡解への局所収束を保証する新しい逆強化学習(RL)アルゴリズムである。
我々は、MAGICSが最先端のニューラルセーフティ合成法よりも優れたロバスト制御ポリシーを実現できることを示す。
論文 参考訳(メタデータ) (2024-09-20T19:45:48Z) - ABNet: Attention BarrierNet for Safe and Scalable Robot Learning [58.4951884593569]
バリアベースの手法は、安全なロボット学習における主要なアプローチの1つである。
本稿では,より大規模な基本安全モデルを段階的に構築するスケーラブルなAttention BarrierNet(ABNet)を提案する。
2次元ロボット障害物回避、安全なロボット操作、視覚に基づくエンドツーエンド自動運転におけるABNetの強みを実証する。
論文 参考訳(メタデータ) (2024-06-18T19:37:44Z) - Domain Randomization for Robust, Affordable and Effective Closed-loop
Control of Soft Robots [10.977130974626668]
ソフトロボットは、コンタクトや適応性に対する本質的な安全性によって人気を集めている。
本稿では、ソフトロボットのRLポリシーを強化することにより、ドメインランダム化(DR)がこの問題を解決する方法を示す。
本稿では,変形可能なオブジェクトに対する動的パラメータの自動推論のための,従来の適応的領域ランダム化手法に対する新しいアルゴリズム拡張を提案する。
論文 参考訳(メタデータ) (2023-03-07T18:50:00Z) - Learning Bipedal Walking for Humanoids with Current Feedback [5.429166905724048]
アクチュエータレベルでの不正確なトルクトラッキングから生じるヒューマノイドロボットのシム2リアルギャップ問題を克服するためのアプローチを提案する。
提案手法は、実際のHRP-5Pヒューマノイドロボットに展開して二足歩行を実現するシミュレーションにおいて、一貫したエンドツーエンドのポリシーをトレーニングする。
論文 参考訳(メタデータ) (2023-03-07T08:16:46Z) - Constrained Dynamic Movement Primitives for Safe Learning of Motor
Skills [25.06692536893836]
ロボット作業空間における制約満足度を実現するための制約付き動的運動プリミティブ(CDMP)を提案する。
異なる環境における異なるマニピュレータを用いた提案アルゴリズムの実装を示すビデオがここにある。
論文 参考訳(メタデータ) (2022-09-28T22:59:33Z) - Active Predicting Coding: Brain-Inspired Reinforcement Learning for
Sparse Reward Robotic Control Problems [79.07468367923619]
ニューラルジェネレーティブ・コーディング(NGC)の神経認知計算フレームワークによるロボット制御へのバックプロパゲーションフリーアプローチを提案する。
我々は、スパース報酬から動的オンライン学習を容易にする強力な予測符号化/処理回路から完全に構築されたエージェントを設計する。
提案するActPCエージェントは,スパース(外部)報酬信号に対して良好に動作し,複数の強力なバックプロップベースのRLアプローチと競合し,性能が優れていることを示す。
論文 参考訳(メタデータ) (2022-09-19T16:49:32Z) - High-Speed Accurate Robot Control using Learned Forward Kinodynamics and
Non-linear Least Squares Optimization [42.92648945058518]
ロボットの動きのキノダイナミックな相互作用への依存は、高速でより顕著になる。
従来の研究から,逆キノダイナミックモデルの学習がロボットの高速制御に有効であることが示唆された。
本稿では,FKDモデルと非線形最小二乗最適化を併用した,高精度かつ高速なロボット制御のための新しい定式化を提案する。
論文 参考訳(メタデータ) (2022-06-16T23:52:01Z) - Model Predictive Control for Fluid Human-to-Robot Handovers [50.72520769938633]
人間の快適さを考慮に入れた計画運動は、人間ロボットのハンドオーバプロセスの一部ではない。
本稿では,効率的なモデル予測制御フレームワークを用いてスムーズな動きを生成することを提案する。
ユーザ数名の多様なオブジェクトに対して,人間とロボットのハンドオーバ実験を行う。
論文 参考訳(メタデータ) (2022-03-31T23:08:20Z) - Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。
連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。
我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文 参考訳(メタデータ) (2021-11-15T18:50:04Z) - SABER: Data-Driven Motion Planner for Autonomously Navigating
Heterogeneous Robots [112.2491765424719]
我々は、データ駆動型アプローチを用いて、異種ロボットチームをグローバルな目標に向けてナビゲートする、エンドツーエンドのオンラインモーションプランニングフレームワークを提案する。
モデル予測制御(SMPC)を用いて,ロボット力学を満たす制御入力を計算し,障害物回避時の不確実性を考慮した。
リカレントニューラルネットワークは、SMPC有限時間地平線解における将来の状態の不確かさを素早く推定するために用いられる。
ディープQ学習エージェントがハイレベルパスプランナーとして機能し、SMPCにロボットを望ましいグローバルな目標に向けて移動させる目標位置を提供する。
論文 参考訳(メタデータ) (2021-08-03T02:56:21Z) - Improving Input-Output Linearizing Controllers for Bipedal Robots via
Reinforcement Learning [85.13138591433635]
入力出力線形化コントローラの主な欠点は、正確な力学モデルが必要であり、入力制約を考慮できないことである。
本稿では,強化学習技術を用いた二足歩行ロボット制御の具体例について,両課題に対処する。
論文 参考訳(メタデータ) (2020-04-15T18:15:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。