論文の概要: SurgIRL: Towards Life-Long Learning for Surgical Automation by Incremental Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2409.15651v1
- Date: Tue, 24 Sep 2024 01:27:46 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-26 11:32:55.996402
- Title: SurgIRL: Towards Life-Long Learning for Surgical Automation by Incremental Reinforcement Learning
- Title(参考訳): SurgIRL:インクリメンタル強化学習による手術自動化のための生涯学習を目指して
- Authors: Yun-Jie Ho, Zih-Yun Chiu, Yuheng Zhi, Michael C. Yip,
- Abstract要約: 我々は外科的強化学習(SurgIRL)を通して外科的自動化政策を訓練する
SurgIRLは,(1)外部方針(知識)を参照して新たなスキルを獲得し,(2)これらのスキルを蓄積・再利用して,複数の未確認課題を段階的に解決すること(インクリメンタルラーニング)を目的としている。
- 参考スコア(独自算出の注目度): 21.35087120482373
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Surgical automation holds immense potential to improve the outcome and accessibility of surgery. Recent studies use reinforcement learning to learn policies that automate different surgical tasks. However, these policies are developed independently and are limited in their reusability when the task changes, making it more time-consuming when robots learn to solve multiple tasks. Inspired by how human surgeons build their expertise, we train surgical automation policies through Surgical Incremental Reinforcement Learning (SurgIRL). SurgIRL aims to (1) acquire new skills by referring to external policies (knowledge) and (2) accumulate and reuse these skills to solve multiple unseen tasks incrementally (incremental learning). Our SurgIRL framework includes three major components. We first define an expandable knowledge set containing heterogeneous policies that can be helpful for surgical tasks. Then, we propose Knowledge Inclusive Attention Network with mAximum Coverage Exploration (KIAN-ACE), which improves learning efficiency by maximizing the coverage of the knowledge set during the exploration process. Finally, we develop incremental learning pipelines based on KIAN-ACE to accumulate and reuse learned knowledge and solve multiple surgical tasks sequentially. Our simulation experiments show that KIAN-ACE efficiently learns to automate ten surgical tasks separately or incrementally. We also evaluate our learned policies on the da Vinci Research Kit (dVRK) and demonstrate successful sim-to-real transfers.
- Abstract(参考訳): 手術の自動化は、手術の結果とアクセシビリティを向上させる大きな可能性を秘めている。
近年の研究では、異なる手術作業を自動化する政策を学ぶために強化学習を使用している。
しかし、これらのポリシーは独立して開発されており、タスク変更時に再利用性に制限があるため、ロボットが複数のタスクの解決を学ぶのに時間がかかる。
人間の外科医が専門知識を構築する方法にインスパイアされた私たちは、外科的強化学習(SurgIRL)を通じて、外科的自動化ポリシーを訓練します。
SurgIRLは,(1)外部政策(知識)を参照して新たなスキルを身につけること,(2)これらのスキルを蓄積して再利用することで,複数の未確認タスクを段階的に解決すること(インクリメンタルラーニング)を目指す。
私たちのSurgIRLフレームワークには3つの主要なコンポーネントが含まれています。
まず,手術に有用な異種ポリシーを含む拡張可能な知識セットを定義する。
次に,mAximum Coverage Exploration (KIAN-ACE) を用いた知識包含意識ネットワークを提案する。
最後に,KIAN-ACEに基づくインクリメンタル学習パイプラインを開発し,学習知識の蓄積と再利用を行い,複数の手術課題を逐次解決する。
シミュレーション実験により,KIAN-ACEは10の手術タスクを個別に,あるいは段階的に,効率的に自動化できることが判明した。
また,da Vinci Research Kit(dVRK)の学習方針を評価し,シミュレート・トゥ・リアル・トランスファーの成功例を示した。
関連論文リスト
- SPIRE: Synergistic Planning, Imitation, and Reinforcement Learning for Long-Horizon Manipulation [58.14969377419633]
タスクをより小さな学習サブプロブレムに分解し、第2に模倣と強化学習を組み合わせてその強みを最大化するシステムであるspireを提案する。
我々は、模倣学習、強化学習、計画を統合する従来の手法よりも平均タスク性能が35%から50%向上していることを発見した。
論文 参考訳(メタデータ) (2024-10-23T17:42:07Z) - VS-Assistant: Versatile Surgery Assistant on the Demand of Surgeons [29.783300422432763]
外科医の意図を正確に理解できるVersatile Surgery Assistant (VS-Assistant)を提案する。
我々は,VS-Assistantが外科的意図を理解できるように,外科的ケア・チューニング戦略を考案した。
論文 参考訳(メタデータ) (2024-05-14T02:05:36Z) - LLM-Assisted Multi-Teacher Continual Learning for Visual Question Answering in Robotic Surgery [57.358568111574314]
患者のデータのプライバシは、モデル更新時に古いデータの可用性を制限することが多い。
CL研究は外科領域で2つの重要な問題を見落としていた。
本稿では,多モーダル大規模言語モデル (LLM) と適応重み付け手法を用いて,これらの問題に対処することを提案する。
論文 参考訳(メタデータ) (2024-02-26T15:35:24Z) - Incremental procedural and sensorimotor learning in cognitive humanoid
robots [52.77024349608834]
本研究は,手順を段階的に学習する認知エージェントを提案する。
各サブステージで必要とされる認知機能と, エージェントが未解決の課題に, 新たな機能の追加がどう対処するかを示す。
結果は、このアプローチが複雑なタスクを段階的に解くことができることを示している。
論文 参考訳(メタデータ) (2023-04-30T22:51:31Z) - Demonstration-Guided Reinforcement Learning with Efficient Exploration
for Task Automation of Surgical Robot [54.80144694888735]
効率的な強化学習アルゴリズムであるDEX(Demonstration-Guided Exploration)を導入する。
本手法は,生産的相互作用を促進するために,高い値で専門家のような行動を推定する。
総合的な手術シミュレーションプラットフォームであるSurRoLによる10ドルの手術操作に関する実験では、大幅な改善が示されている。
論文 参考訳(メタデータ) (2023-02-20T05:38:54Z) - Objective Surgical Skills Assessment and Tool Localization: Results from
the MICCAI 2021 SimSurgSkill Challenge [11.007322707874184]
SimSurgSkill 2021(MICCAI 2021でEndoVisのサブチャレンジとしてホスト)は、この取り組みの促進と促進を目的としている。
競技者は、機器のローカライズと外科的スキルの予測を任された。
この公開データセットとその結果をスプーンボードとして使用することで、将来の研究は、外科データ科学の進歩を伴う外科医のより効率的な訓練を可能にする可能性がある。
論文 参考訳(メタデータ) (2022-12-08T18:14:52Z) - Quantification of Robotic Surgeries with Vision-Based Deep Learning [45.165919577877695]
本稿では,手術中に録画されたビデオのみを対象とする統合型ディープラーニングフレームワークRoboformerを提案する。
我々は,ミニマル侵襲型ロボット手術において,一般的な2種類のステップの4つのビデオベースデータセットに対して,我々の枠組みを検証した。
論文 参考訳(メタデータ) (2022-05-06T06:08:35Z) - Real-time Informative Surgical Skill Assessment with Gaussian Process
Learning [12.019641896240245]
本研究は,ESSBSのためのガウス的プロセス学習に基づく自動的客観的外科的スキル評価手法を提案する。
提案手法は,計測器の動きを内視鏡座標に投影し,データ次元を減少させる。
実験結果から,完全外科手術における100%の予測精度と,リアルタイムの予測評価における90%の精度が得られた。
論文 参考訳(メタデータ) (2021-12-05T15:35:40Z) - Reset-Free Reinforcement Learning via Multi-Task Learning: Learning
Dexterous Manipulation Behaviors without Human Intervention [67.1936055742498]
マルチタスク学習は、リセットフリーの学習スキームをはるかに複雑な問題に効果的にスケールできることを示す。
この研究は、人間の介入なしにRLを用いて現実世界での巧妙な操作行動を学ぶ能力を示す。
論文 参考訳(メタデータ) (2021-04-22T17:38:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。