Fugu-MT 論文翻訳(概要): Sample-Efficient Learning with Online Expert Correction for Autonomous Catheter Steering in Endovascular Bifurcation Navigation

論文の概要: Sample-Efficient Learning with Online Expert Correction for Autonomous Catheter Steering in Endovascular Bifurcation Navigation

arxiv url: http://arxiv.org/abs/2602.20216v1
Date: Mon, 23 Feb 2026 07:58:08 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-23 08:17:41.653147
Title: Sample-Efficient Learning with Online Expert Correction for Autonomous Catheter Steering in Endovascular Bifurcation Navigation
Title（参考訳）: 自動カテーテルステアリングのためのオンライン専門家補正による血管内分岐ナビゲーションにおけるサンプル効率向上学習
Authors: Hao Wang, Tianliang Yao, Bo Lu, Zhiqiang Pei, Liu Dong, Lei Ma, Peng Qi,
Abstract要約: 強化学習(Reinforcement Learning, RL)は, 自律型カテーテルステアリングにおいて有望なアプローチである。本稿では,自動カテーテルステアリングのためのオンライン専門家補正機能を備えたサンプル効率のよいRLフレームワークを提案する。
参考スコア（独自算出の注目度）: 9.822810178672782
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Robot-assisted endovascular intervention offers a safe and effective solution for remote catheter manipulation, reducing radiation exposure while enabling precise navigation. Reinforcement learning (RL) has recently emerged as a promising approach for autonomous catheter steering; however, conventional methods suffer from sparse reward design and reliance on static vascular models, limiting their sample efficiency and generalization to intraoperative variations. To overcome these challenges, this paper introduces a sample-efficient RL framework with online expert correction for autonomous catheter steering in endovascular bifurcation navigation. The proposed framework integrates three key components: (1) A segmentation-based pose estimation module for accurate real-time state feedback, (2) A fuzzy controller for bifurcation-aware orientation adjustment, and (3) A structured reward generator incorporating expert priors to guide policy learning. By leveraging online expert correction, the framework reduces exploration inefficiency and enhances policy robustness in complex vascular structures. Experimental validation on a robotic platform using a transparent vascular phantom demonstrates that the proposed approach achieves convergence in 123 training episodes -- a 25.9% reduction compared to the baseline Soft Actor-Critic (SAC) algorithm -- while reducing average positional error to 83.8% of the baseline. These results indicate that combining sample-efficient RL with online expert correction enables reliable and accurate catheter steering, particularly in anatomically challenging bifurcation scenarios critical for endovascular navigation.
Abstract（参考訳）: ロボットによる血管内介入は、遠隔カテーテル操作のための安全かつ効果的なソリューションを提供し、正確なナビゲーションを可能にしながら放射線被曝を減らす。強化学習(Reinforcement Learning, RL)は近年, 自律型カテーテルステアリングの有望なアプローチとして登場したが, 従来の方法では, 局所的な報酬設計と静的血管モデルへの依存に悩まされ, サンプル効率と術内変動への一般化が制限されている。これらの課題を克服するために, 自動カテーテルステアリングのオンライン専門家による内血管分岐ナビゲーションのための, サンプル効率のよいRLフレームワークを提案する。提案フレームワークは,(1)正確なリアルタイム状態フィードバックのためのセグメンテーションに基づくポーズ推定モジュール,(2)分岐認識配向調整のためのファジィコントローラ,(3)政策学習の指導に専門家を取り入れた構造的報酬生成モジュールの3つの主要な構成要素を統合する。オンライン専門家の補正を活用することで、このフレームワークは探索の効率を低下させ、複雑な血管構造における政策の堅牢性を高める。透明な血管ファントムを用いたロボットプラットフォームでの実験的検証は、提案手法が123回のトレーニングエピソード(ベースラインのSoft Actor-Critic(SAC)アルゴリズムと比較して25.9%の削減)で収束し、平均的な位置誤差を83.8%に削減したことを示している。これらの結果から, 試料効率の高いRLとオンライン専門家補正を併用することで, 信頼性と正確なカテーテルステアリングが可能であることが示唆された。

関連論文リスト

A Guideline-Aware AI Agent for Zero-Shot Target Volume Auto-Delineation [6.639622698899548]
新たなガイドライン対応AIフレームワークであるOncoAgentを紹介する。 OncoAgentはテキストの臨床ガイドラインを3次元の目標輪郭にシームレスに無訓練で変換する。このフレームワークはゼロショットを代替食道ガイドラインや他の解剖学的部位に一般化する。
論文参考訳（メタデータ） (2026-03-10T10:00:01Z)
Diffusion Controller: Framework, Algorithms and Parameterization [54.82539154511621]
本稿では,逆拡散サンプリングを(一般化された)線形解法マルコフ決定過程における状態のみの制御として活用する統一的な制御理論的視点を提案する。このフレームワークでは、制御はトレーニング済みのリバースタイムのトランジションカーネルを再重み付けし、端末の目的と$f$分割コストのバランスをとる。安定拡散v1.4の実験では、選好調整の勝利率が一貫した上昇を示し、品質効率のトレードオフを改善した。
論文参考訳（メタデータ） (2026-03-07T01:49:59Z)
Modeling and Control of a Pneumatic Soft Robotic Catheter Using Neural Koopman Operators [3.2642164905437503]
ソフトなロボットカテーテルシステムを構築するために,ニューラルネットワークで強化されたクープマン演算子フレームワークを提案する。心房アブレーションにおけるX線透視における放射線被曝の最小化の必要性から,オープンループ制御戦略について検討した。提案手法は平均誤差が2.1 +- 0.4 mm、方向が4.9 +- 0.6 である。
論文参考訳（メタデータ） (2026-03-04T14:36:22Z)
Toward AI Autonomous Navigation for Mechanical Thrombectomy using Hierarchical Modular Multi-agent Reinforcement Learning (HM-MARL) [57.65363326406228]
In vitroにおける自律型2デバイスナビゲーションのための階層型モジュールマルチエージェント強化学習フレームワークを提案する。 HM-MARLは、大腿動脈から内頸動脈(ICA)へのガイドカテーテルとガイドワイヤを自律的にナビゲートするために開発された。モジュール型マルチエージェントアプローチは、複雑なナビゲーションタスクを特別なサブタスクに分解するために用いられ、それぞれがソフトアクター・クライブRLを用いて訓練された。 In vitroでは、両方のHM-MARLモデルが大腿動脈から右総頸動脈への100%の治験に成功し、右ICAへの80%は失敗に終わった。
論文参考訳（メタデータ） (2026-02-20T23:50:35Z)
Human-in-the-loop Online Rejection Sampling for Robotic Manipulation [55.99788088622936]
Hi-ORSは、オンライン微調整中に負の報酬を得たサンプルをフィルタリングすることで、値推定を安定化する。 Hi-ORSは、わずか1.5時間でコンタクトリッチな操作をマスターするためのpiベースのポリシーを微調整する。
論文参考訳（メタデータ） (2025-10-30T11:53:08Z)
DINO-CVA: A Multimodal Goal-Conditioned Vision-to-Action Model for Autonomous Catheter Navigation [0.33727511459109777]
本研究は,マルチモーダルな目標条件行動クローニングフレームワークであるDINO-CVAの導入により,自律カテーテルナビゲーションへ移行する。提案モデルでは,視覚観測とジョイスティックのキネマティクスを統合埋め込み空間に融合し,視覚とキネマティクスの両方を意識したポリシーを実現する。その結果, DINO-CVAは動作予測の精度が高く, キネマティクスのみのベースラインの性能と一致していることがわかった。
論文参考訳（メタデータ） (2025-10-19T22:59:32Z)
A Novel Attention-Augmented Wavelet YOLO System for Real-time Brain Vessel Segmentation on Transcranial Color-coded Doppler [49.03919553747297]
我々は,脳動脈を効率よく捉えることができるAIを利用したリアルタイムCoW自動分割システムを提案する。 Transcranial Color-coded Doppler (TCCD) を用いたAIによる脳血管セグメンテーションの事前研究は行われていない。提案したAAW-YOLOは, 異方性および対側性CoW容器のセグメンテーションにおいて高い性能を示した。
論文参考訳（メタデータ） (2025-08-19T14:41:22Z)
Efficient Test-time Adaptive Object Detection via Sensitivity-Guided Pruning [73.40364018029673]
連続的なテスト時間適応オブジェクト検出(CTTA-OD)は、源となる事前訓練された検出器を常に変化する環境にオンライン適応させることを目的としている。私たちのモチベーションは、学習したすべての特徴が有益であるとは限らないという観察に起因しています。 FLOPの計算オーバヘッドを12%削減し,優れた適応性を実現する。
論文参考訳（メタデータ） (2025-06-03T05:27:56Z)
Safe Navigation for Robotic Digestive Endoscopy via Human Intervention-based Reinforcement Learning [5.520042381826271]
既存の強化学習ナビゲーションアルゴリズムは、しばしば潜在的に危険な衝突を引き起こす。 RDEの安全性を高めるために専門家の知識を取り入れたHI-PPOと呼ばれるHuman Intervention(HI)ベースのプロキシポリシー最適化フレームワークを提案する。その結果、HI-PPO は平均 ATE (8.02 textmm) とセキュリティスコア (0.862) を達成し、人間の専門家に匹敵する性能を示した。
論文参考訳（メタデータ） (2024-09-24T03:01:30Z)
Real-time landmark detection for precise endoscopic submucosal dissection via shape-aware relation network [51.44506007844284]
内視鏡下粘膜下郭清術における高精度かつリアルタイムなランドマーク検出のための形状認識型関係ネットワークを提案する。まず,ランドマーク間の空間的関係に関する先行知識を直感的に表現する関係キーポイント・ヒートマップを自動生成するアルゴリズムを考案する。次に、事前知識を学習プロセスに段階的に組み込むために、2つの補完的な正規化手法を開発する。
論文参考訳（メタデータ） (2021-11-08T07:57:30Z)
A Novel Sample-efficient Deep Reinforcement Learning with Episodic Policy Transfer for PID-Based Control in Cardiac Catheterization Robots [2.3939470784308914]
このモデルは、血管内カテーテル用に設計されたロボットシステムの軸方向運動制御のために検証された。従来の10試行法と比較すると,0.003mmの誤差で利得を調整できることがわかった。
論文参考訳（メタデータ） (2021-10-28T08:18:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。