論文の概要: A Novel Sample-efficient Deep Reinforcement Learning with Episodic
Policy Transfer for PID-Based Control in Cardiac Catheterization Robots
- arxiv url: http://arxiv.org/abs/2110.14941v1
- Date: Thu, 28 Oct 2021 08:18:01 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-29 16:53:42.789231
- Title: A Novel Sample-efficient Deep Reinforcement Learning with Episodic
Policy Transfer for PID-Based Control in Cardiac Catheterization Robots
- Title(参考訳): 心臓カテーテル化ロボットにおけるPID制御のためのエピソードポリシー伝達を用いた新しいサンプル効率深い強化学習
- Authors: Olatunji Mumini Omisore, Toluwanimi Akinyemi, Wenke Duan, Wenjing Du,
and Lei Wang
- Abstract要約: このモデルは、血管内カテーテル用に設計されたロボットシステムの軸方向運動制御のために検証された。
従来の10試行法と比較すると,0.003mmの誤差で利得を調整できることがわかった。
- 参考スコア(独自算出の注目度): 2.3939470784308914
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Robotic catheterization is typically used for percutaneous coronary
intervention procedures nowadays and it involves steering flexible endovascular
tools to open up occlusion in the coronaries. In this study, a sample-efficient
deep reinforcement learning with episodic policy transfer is, for the first
time, used for motion control during robotic catheterization with fully
adaptive PID tuning strategy. The reinforcement model aids the agent to
continuously learn from its interactions in its environment and adaptively tune
PID control gains for axial navigation of endovascular tool. The model was
validated for axial motion control of a robotic system designed for
intravascular catheterization. Simulation and experimental trials were done to
validate the application of the model, and results obtained shows it could
self-tune PID gains appropriately for motion control of a robotic catheter
system. Performance comparison with conventional methods in average of 10
trials shows the agent tunes the gain better with error of 0.003 mm. Thus, the
proposed model would offer more stable set-point motion control robotic
catheterization.
- Abstract(参考訳): 近年、経皮的冠動脈インターベンションの手術にロボットカテーテルが用いられており、冠動脈の閉塞を開放するために柔軟な血管内工具を操る。
本研究では, 適応型PIDチューニング戦略を用いたロボットカテーテルの動作制御において, エピソード政策伝達を用いた試料効率の高い深部強化学習を初めて行った。
強化モデルは、エージェントがその環境における相互作用から継続的に学習し、血管内工具の軸方向ナビゲーションのためのPID制御ゲインを適応的に調整するのに役立つ。
このモデルは血管内カテーテル用に設計されたロボットシステムの軸方向運動制御のために検証された。
モデルの適用性を検証するためのシミュレーションと実験実験を行い,ロボットカテーテルの動作制御に適した自己チューニング型PIDゲインが得られた。
平均10回の試験で従来の方法と比較すると、エージェントは0.003mmの誤差でゲインを良くチューニングする。
したがって、提案モデルはより安定したセットポイントモーションコントロールロボットカテーテルを提供する。
関連論文リスト
- Safe Navigation for Robotic Digestive Endoscopy via Human Intervention-based Reinforcement Learning [5.520042381826271]
RDE の安全性を高めるため,Human Intervention (HI) をベースとした Pximal Policy Optimization フレームワーク HI-PPO を提案する。
標準PPOの低探査効率に対応するため, 改良探査機構 (EEM) を導入する。
また,初回介入時の安全でない行為を罰する報酬報酬調整(RPA)も導入した。
論文 参考訳(メタデータ) (2024-09-24T03:01:30Z) - A Master-Follower Teleoperation System for Robotic Catheterization: Design, Characterization, and Tracking Control [1.0470286407954037]
本稿では,ロボットカテーテル化のための3自由度マスターフォロワ遠隔操作システムの設計と開発について述べる。
臨床医の手による介入と似ており、手術中にカテーテル座屈やねじれを除去するグリップインサート放出機構を備えている。
システムの性能は、典型的な円形、無限大のような、スパイラルな経路上での接近経路と開ループ経路の追跡によって評価される。
論文 参考訳(メタデータ) (2024-07-18T05:06:48Z) - Modelling, Positioning, and Deep Reinforcement Learning Path Tracking
Control of Scaled Robotic Vehicles: Design and Experimental Validation [3.807917169053206]
スケールされたロボットカーは通常、車両の状態の推定と制御に特化したタスクを含む階層的な制御機構を備えている。
本稿では, (i) フェデレートされた拡張カルマンフィルタ (FEKF) と (ii) エキスパートデモレータを用いて訓練された新しい深部強化学習 (DRL) パストラッキングコントローラを提案する。
実験により検証されたモデルは、(i)FEKFの設計を支援するために使用され、(ii)DRLに基づく経路追跡アルゴリズムをトレーニングするためのデジタルツインとして機能する。
論文 参考訳(メタデータ) (2024-01-10T14:40:53Z) - Automatic diagnosis of knee osteoarthritis severity using Swin
transformer [55.01037422579516]
変形性膝関節症 (KOA) は膝関節の慢性的な痛みと硬直を引き起こす疾患である。
我々は,Swin Transformer を用いて KOA の重大度を予測する自動手法を提案する。
論文 参考訳(メタデータ) (2023-07-10T09:49:30Z) - Self-Tuning PID Control via a Hybrid Actor-Critic-Based Neural Structure
for Quadcopter Control [0.0]
Proportional-Integrator-Derivative (PID) コントローラは、幅広い産業および実験プロセスで使用されている。
モデルパラメータの不確実性と外乱のため、Quadrotorsのような実際のシステムはより堅牢で信頼性の高いPIDコントローラを必要とする。
本研究では,Reinforcement-Learning-based Neural Networkを用いた自己調整型PIDコントローラについて検討した。
論文 参考訳(メタデータ) (2023-07-03T19:35:52Z) - Real-Time Model-Free Deep Reinforcement Learning for Force Control of a
Series Elastic Actuator [56.11574814802912]
最先端のロボットアプリケーションは、歩行、揚力、操作などの複雑なタスクを達成するために、閉ループ力制御を備えた連続弾性アクチュエータ(SEAs)を使用する。
モデルフリーPID制御法はSEAの非線形性により不安定になりやすい。
深層強化学習は連続制御タスクに有効なモデルレス手法であることが証明されている。
論文 参考訳(メタデータ) (2023-04-11T00:51:47Z) - Active Predicting Coding: Brain-Inspired Reinforcement Learning for
Sparse Reward Robotic Control Problems [79.07468367923619]
ニューラルジェネレーティブ・コーディング(NGC)の神経認知計算フレームワークによるロボット制御へのバックプロパゲーションフリーアプローチを提案する。
我々は、スパース報酬から動的オンライン学習を容易にする強力な予測符号化/処理回路から完全に構築されたエージェントを設計する。
提案するActPCエージェントは,スパース(外部)報酬信号に対して良好に動作し,複数の強力なバックプロップベースのRLアプローチと競合し,性能が優れていることを示す。
論文 参考訳(メタデータ) (2022-09-19T16:49:32Z) - Epersist: A Self Balancing Robot Using PID Controller And Deep
Reinforcement Learning [0.0]
二輪自走式ロボットは逆振り子の例であり、本質的に非線形で不安定なシステムである。
「エスペリスト」とは、ロバストな制御機構を提供することで、当初不安定なシステムに逆らうという課題を克服することである。
論文 参考訳(メタデータ) (2022-07-23T06:27:21Z) - Continuous Decoding of Daily-Life Hand Movements from Forearm Muscle
Activity for Enhanced Myoelectric Control of Hand Prostheses [78.120734120667]
本研究では,前腕のEMG活性をハンドキネマティクスに連続的にマップする,長期記憶(LSTM)ネットワークに基づく新しい手法を提案する。
私たちの研究は、この困難なデータセットを使用するハンドキネマティクスの予測に関する最初の報告です。
提案手法は, 人工手指の複数のDOFの独立的, 比例的アクティベーションのための制御信号の生成に適していることが示唆された。
論文 参考訳(メタデータ) (2021-04-29T00:11:32Z) - Online Body Schema Adaptation through Cost-Sensitive Active Learning [63.84207660737483]
この作業は、icubロボットシミュレータの7dofアームを使用して、シミュレーション環境で実行された。
コストに敏感な能動学習手法は最適な関節構成を選択するために用いられる。
その結果,コスト依存型能動学習は標準的な能動学習手法と同等の精度を示し,実行運動の約半分を減らした。
論文 参考訳(メタデータ) (2021-01-26T16:01:02Z) - Risk-Sensitive Sequential Action Control with Multi-Modal Human
Trajectory Forecasting for Safe Crowd-Robot Interaction [55.569050872780224]
本稿では,リスクに敏感な最適制御に基づく安全な群集ロボットインタラクションのためのオンラインフレームワークを提案し,そのリスクをエントロピーリスク尺度でモデル化する。
私たちのモジュラーアプローチは、クラウドとロボットの相互作用を学習ベースの予測とモデルベースの制御に分離します。
シミュレーション研究と実世界の実験により、このフレームワークは、現場にいる50人以上の人間との衝突を避けながら、安全で効率的なナビゲーションを実現することができることが示された。
論文 参考訳(メタデータ) (2020-09-12T02:02:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。