論文の概要: Towards Safe Control of Continuum Manipulator Using Shielded Multiagent
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2106.07892v1
- Date: Tue, 15 Jun 2021 05:55:05 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-16 15:01:08.064902
- Title: Towards Safe Control of Continuum Manipulator Using Shielded Multiagent
Reinforcement Learning
- Title(参考訳): シールド型マルチエージェント強化学習による連続マニピュレータの安全制御に向けて
- Authors: Guanglin Ji, Junyan Yan, Jingxin Du, Wanquan Yan, Jibiao Chen,
Yongkang Lu, Juan Rojas, and Shing Shin Cheng
- Abstract要約: ロボットの制御は、MADQNフレームワークにおける1つのエージェント問題である1-DoFとして定式化され、学習効率が向上する。
シールドされたMADQNにより、ロボットは外部負荷下で、サブミリ単位のルート平均二乗誤差で点と軌道追跡を行うことができた。
- 参考スコア(独自算出の注目度): 1.2647816797166165
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Continuum robotic manipulators are increasingly adopted in minimal invasive
surgery. However, their nonlinear behavior is challenging to model accurately,
especially when subject to external interaction, potentially leading to poor
control performance. In this letter, we investigate the feasibility of adopting
a model-free multiagent reinforcement learning (RL), namely multiagent deep Q
network (MADQN), to control a 2-degree of freedom (DoF) cable-driven continuum
surgical manipulator. The control of the robot is formulated as a one-DoF, one
agent problem in the MADQN framework to improve the learning efficiency.
Combined with a shielding scheme that enables dynamic variation of the action
set boundary, MADQN leads to efficient and importantly safer control of the
robot. Shielded MADQN enabled the robot to perform point and trajectory
tracking with submillimeter root mean square errors under external loads, soft
obstacles, and rigid collision, which are common interaction scenarios
encountered by surgical manipulators. The controller was further proven to be
effective in a miniature continuum robot with high structural nonlinearitiy,
achieving trajectory tracking with submillimeter accuracy under external
payload.
- Abstract(参考訳): 連続ロボットマニピュレータは、最小侵襲手術においてますます採用されている。
しかし、その非線形挙動は、特に外部相互作用の対象となる場合、正確にモデル化することが困難であり、制御性能が低下する可能性がある。
本稿では,モデルフリーのマルチエージェント強化学習(rl),すなわちマルチエージェントディープqネットワーク(madqn)を採用し,2自由度ケーブル駆動型連続体手術マニピュレータ(dof)を制御できることについて検討する。
ロボットの制御は、MADQNフレームワークにおける1つのエージェント問題である1-DoFとして定式化され、学習効率が向上する。
アクションセット境界の動的変動を可能にする遮蔽スキームと組み合わせることで、madqnは効率的でより安全なロボットの制御に繋がる。
シールドされたMADQNは、手術用マニピュレータが遭遇する一般的な相互作用シナリオである外負荷、ソフト障害物、剛性衝突の下で、サブミリのルート平均二乗誤差でポイントと軌道追跡を行うことができる。
さらに、制御器は構造的非線形性の高い小型連続ロボットに有効であることが証明され、外部ペイロード下ではサブミリ精度で軌道追跡が達成された。
関連論文リスト
- Neural Internal Model Control: Learning a Robust Control Policy via Predictive Error Feedback [16.46487826869775]
本稿では,モデルベース制御とRLベース制御を統合し,ロバスト性を高めるニューラル内部モデル制御を提案する。
我々のフレームワークは、剛体力学にニュートン・オイラー方程式を適用することで予測モデルを合理化し、複雑な高次元非線形性を捉える必要がなくなる。
本研究では,四足歩行ロボットと四足歩行ロボットにおけるフレームワークの有効性を実証し,最先端の手法と比較して優れた性能を実現する。
論文 参考訳(メタデータ) (2024-11-20T07:07:42Z) - Custom Non-Linear Model Predictive Control for Obstacle Avoidance in Indoor and Outdoor Environments [0.0]
本稿では,DJI行列100のための非線形モデル予測制御(NMPC)フレームワークを提案する。
このフレームワークは様々なトラジェクトリタイプをサポートし、厳密な操作の精度を制御するためにペナルティベースのコスト関数を採用している。
論文 参考訳(メタデータ) (2024-10-03T17:50:19Z) - Integrating DeepRL with Robust Low-Level Control in Robotic Manipulators for Non-Repetitive Reaching Tasks [0.24578723416255746]
ロボット工学では、現代の戦略は学習に基づくもので、複雑なブラックボックスの性質と解釈可能性の欠如が特徴である。
本稿では, 深部強化学習(DRL)に基づく衝突のない軌道プランナと, 自動調整型低レベル制御戦略を統合することを提案する。
論文 参考訳(メタデータ) (2024-02-04T15:54:03Z) - Reinforcement Learning for Safe Robot Control using Control Lyapunov
Barrier Functions [9.690491406456307]
強化学習(RL)は、ロボットの複雑な制御タスクを管理する際の優れた性能を示す。
本稿では、データのみに基づいて安全性と到達可能性を分析するために、制御型リアプノフバリア関数(CLBF)について検討する。
また、Lyapunov barrier actor-critic (LBAC) を提案し、データに基づく安全性と到達性条件の近似を満足するコントローラを探索した。
論文 参考訳(メタデータ) (2023-05-16T20:27:02Z) - Real-Time Model-Free Deep Reinforcement Learning for Force Control of a
Series Elastic Actuator [56.11574814802912]
最先端のロボットアプリケーションは、歩行、揚力、操作などの複雑なタスクを達成するために、閉ループ力制御を備えた連続弾性アクチュエータ(SEAs)を使用する。
モデルフリーPID制御法はSEAの非線形性により不安定になりやすい。
深層強化学習は連続制御タスクに有効なモデルレス手法であることが証明されている。
論文 参考訳(メタデータ) (2023-04-11T00:51:47Z) - Robust, High-Rate Trajectory Tracking on Insect-Scale Soft-Actuated
Aerial Robots with Deep-Learned Tube MPC [0.0]
サブグラムMAV (0.7 グラム) であるMIT SoftFly 上でのアジャイルで効率的な軌道追跡手法を提案する。
我々の戦略は、適応型姿勢制御器と、軌跡追跡堅牢管モデル予測制御器(RTMPC)を模倣する訓練されたニューラルネットワークポリシーを組み合わせたカスケード制御方式を用いている。
我々は,本手法を実験的に評価し,より困難な操作でもルート平均角誤差を1.8cm以下に抑え,従来の作業に比べて最大位置誤差を60%低減し,大きな外乱に対する堅牢性を実証した。
論文 参考訳(メタデータ) (2022-09-20T21:30:16Z) - Active Predicting Coding: Brain-Inspired Reinforcement Learning for
Sparse Reward Robotic Control Problems [79.07468367923619]
ニューラルジェネレーティブ・コーディング(NGC)の神経認知計算フレームワークによるロボット制御へのバックプロパゲーションフリーアプローチを提案する。
我々は、スパース報酬から動的オンライン学習を容易にする強力な予測符号化/処理回路から完全に構築されたエージェントを設計する。
提案するActPCエージェントは,スパース(外部)報酬信号に対して良好に動作し,複数の強力なバックプロップベースのRLアプローチと競合し,性能が優れていることを示す。
論文 参考訳(メタデータ) (2022-09-19T16:49:32Z) - OSCAR: Data-Driven Operational Space Control for Adaptive and Robust
Robot Manipulation [50.59541802645156]
オペレーショナル・スペース・コントロール(OSC)は、操作のための効果的なタスクスペース・コントローラとして使われてきた。
本稿では,データ駆動型OSCのモデル誤差を補償するOSC for Adaptation and Robustness (OSCAR)を提案する。
本手法は,様々なシミュレーション操作問題に対して評価し,制御器のベースラインの配列よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2021-10-02T01:21:38Z) - SABER: Data-Driven Motion Planner for Autonomously Navigating
Heterogeneous Robots [112.2491765424719]
我々は、データ駆動型アプローチを用いて、異種ロボットチームをグローバルな目標に向けてナビゲートする、エンドツーエンドのオンラインモーションプランニングフレームワークを提案する。
モデル予測制御(SMPC)を用いて,ロボット力学を満たす制御入力を計算し,障害物回避時の不確実性を考慮した。
リカレントニューラルネットワークは、SMPC有限時間地平線解における将来の状態の不確かさを素早く推定するために用いられる。
ディープQ学習エージェントがハイレベルパスプランナーとして機能し、SMPCにロボットを望ましいグローバルな目標に向けて移動させる目標位置を提供する。
論文 参考訳(メタデータ) (2021-08-03T02:56:21Z) - Risk-Sensitive Sequential Action Control with Multi-Modal Human
Trajectory Forecasting for Safe Crowd-Robot Interaction [55.569050872780224]
本稿では,リスクに敏感な最適制御に基づく安全な群集ロボットインタラクションのためのオンラインフレームワークを提案し,そのリスクをエントロピーリスク尺度でモデル化する。
私たちのモジュラーアプローチは、クラウドとロボットの相互作用を学習ベースの予測とモデルベースの制御に分離します。
シミュレーション研究と実世界の実験により、このフレームワークは、現場にいる50人以上の人間との衝突を避けながら、安全で効率的なナビゲーションを実現することができることが示された。
論文 参考訳(メタデータ) (2020-09-12T02:02:52Z) - Improving Input-Output Linearizing Controllers for Bipedal Robots via
Reinforcement Learning [85.13138591433635]
入力出力線形化コントローラの主な欠点は、正確な力学モデルが必要であり、入力制約を考慮できないことである。
本稿では,強化学習技術を用いた二足歩行ロボット制御の具体例について,両課題に対処する。
論文 参考訳(メタデータ) (2020-04-15T18:15:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。