Fugu-MT 論文翻訳(概要): Reinforcement Learning for Follow-the-Leader Robotic Endoscopic Navigation via Synthetic Data

論文の概要: Reinforcement Learning for Follow-the-Leader Robotic Endoscopic Navigation via Synthetic Data

arxiv url: http://arxiv.org/abs/2601.02798v1
Date: Tue, 06 Jan 2026 08:15:53 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-23 08:17:40.656369
Title: Reinforcement Learning for Follow-the-Leader Robotic Endoscopic Navigation via Synthetic Data
Title（参考訳）: 合成データを用いた足のロボット内視鏡ナビゲーションのための強化学習
Authors: Sicong Gao, Chen Qian, Laurence Xian, Liao Wu, Maurice Pagnucco, Yang Song,
Abstract要約: 本稿では,内視鏡本体と腸管壁との接触を最小限に抑えるために,フレキシブルな連続構造に基づく内視鏡ロボットについて述べる。単眼深度推定による視覚に基づく深部強化学習フレームワークを提案する。
参考スコア（独自算出の注目度）: 21.611096590329343
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Autonomous navigation is crucial for both medical and industrial endoscopic robots, enabling safe and efficient exploration of narrow tubular environments without continuous human intervention, where avoiding contact with the inner walls has been a longstanding challenge for prior approaches. We present a follow-the-leader endoscopic robot based on a flexible continuum structure designed to minimize contact between the endoscope body and intestinal walls, thereby reducing patient discomfort. To achieve this objective, we propose a vision-based deep reinforcement learning framework guided by monocular depth estimation. A realistic intestinal simulation environment was constructed in \textit{NVIDIA Omniverse} to train and evaluate autonomous navigation strategies. Furthermore, thousands of synthetic intraluminal images were generated using NVIDIA Replicator to fine-tune the Depth Anything model, enabling dense three-dimensional perception of the intestinal environment with a single monocular camera. Subsequently, we introduce a geometry-aware reward and penalty mechanism to enable accurate lumen tracking. Compared with the original Depth Anything model, our method improves $δ_{1}$ depth accuracy by 39.2% and reduces the navigation J-index by 0.67 relative to the second-best method, demonstrating the robustness and effectiveness of the proposed approach.
Abstract（参考訳）: 自律ナビゲーションは、医療用と産業用の両方の内視鏡ロボットにとって不可欠であり、人間の介入なしに細管環境の安全かつ効率的な探索を可能にする。本稿では,内視鏡本体と腸壁との接触を最小限に抑え,患者の不快感を軽減するために,フレキシブルな連続構造に基づく内視鏡ロボットを提案する。この目的を達成するために,単眼深度推定による視覚に基づく深部強化学習フレームワークを提案する。自律的なナビゲーション戦略を訓練し評価するために,textit{NVIDIA Omniverse} で現実的な腸管シミュレーション環境を構築した。さらに、NVIDIA Replicatorを用いて数千の合成光源内画像が生成され、Depth Anythingモデルが微調整され、単一の単眼カメラで腸内環境の高密度な3次元認識が可能となった。次に,正確なルーメン追跡を実現するために,幾何学的報酬とペナルティのメカニズムを導入する。従来のDepth Anythingモデルと比較すると,提案手法の精度を39.2%向上し,第2のベスト手法と比較してナビゲーションJインデックスを0.67削減し,提案手法の堅牢性と有効性を示す。

関連論文リスト

DualVision ArthroNav: Investigating Opportunities to Enhance Localization and Reconstruction in Image-based Arthroscopy Navigation via External Cameras [38.19996575955867]
視覚ベースの代替品は、侵襲性は低いが、しばしば単眼の関節鏡カメラにのみ依存する。関節鏡に固定された外部カメラを統合したマルチカメラ関節鏡ナビゲーションシステムであるDualVision ArthroNavを提案する。実験により, キャリブレーション誤差を効果的に補償し, 平均絶対軌道誤差1.09mmを達成した。
論文参考訳（メタデータ） (2025-11-12T16:02:34Z)
EndoUFM: Utilizing Foundation Models for Monocular depth estimation of endoscopic images [7.350425834778092]
EndoUFMは、教師なしの単眼深度推定フレームワークである。強力な事前学習先を活用することにより、深さ推定性能を向上させる。この研究は、最小侵襲の手術において、外科医の空間的知覚を増大させるのに寄与する。
論文参考訳（メタデータ） (2025-08-25T11:33:05Z)
A Novel Attention-Augmented Wavelet YOLO System for Real-time Brain Vessel Segmentation on Transcranial Color-coded Doppler [49.03919553747297]
我々は,脳動脈を効率よく捉えることができるAIを利用したリアルタイムCoW自動分割システムを提案する。 Transcranial Color-coded Doppler (TCCD) を用いたAIによる脳血管セグメンテーションの事前研究は行われていない。提案したAAW-YOLOは, 異方性および対側性CoW容器のセグメンテーションにおいて高い性能を示した。
論文参考訳（メタデータ） (2025-08-19T14:41:22Z)
Unifying Scale-Aware Depth Prediction and Perceptual Priors for Monocular Endoscope Pose Estimation and Tissue Reconstruction [3.251946340142663]
単分子内視鏡組織再建のための統一的枠組みを提示する。スケール認識深度予測と時間的に制約された知覚の洗練を統合する。 HEVDとSCAREDの評価は、アブレーションと比較分析によって、最先端の手法よりもフレームワークの堅牢性と優位性を示している。
論文参考訳（メタデータ） (2025-08-15T07:41:17Z)
Intraoperative Registration by Cross-Modal Inverse Neural Rendering [61.687068931599846]
クロスモーダル逆ニューラルレンダリングによる神経外科手術における術中3D/2Dレジストレーションのための新しいアプローチを提案する。本手法では,暗黙の神経表現を2つの構成要素に分離し,術前および術中における解剖学的構造について検討した。臨床症例の振り返りデータを用いて本法の有効性を検証し,現在の登録基準を満たした状態での最先端の検査成績を示した。
論文参考訳（メタデータ） (2024-09-18T13:40:59Z)
Advancing Depth Anything Model for Unsupervised Monocular Depth Estimation in Endoscopy [2.906891207990726]
本稿では,Depth Anything Modelのための新しい微調整戦略を提案する。本手法は本態性に基づく教師なし単眼深度推定フレームワークと統合する。提案手法は,トレーニング可能なパラメータ数を最小化しつつ,最先端性能を実現する。
論文参考訳（メタデータ） (2024-09-12T03:04:43Z)
3D Vessel Reconstruction from Sparse-View Dynamic DSA Images via Vessel Probability Guided Attenuation Learning [79.60829508459753]
現在の商用デジタルサブトラクション・アンジオグラフィー(DSA)システムは通常、再構築を行うために数百のスキャンビューを要求する。スパース・ビューDSA画像のダイナミックな血流と不十分な入力は,3次元血管再建作業において重要な課題である。本稿では,時間に依存しない容器確率場を用いてこの問題を効果的に解くことを提案する。
論文参考訳（メタデータ） (2024-05-17T11:23:33Z)
EyeLS: Shadow-Guided Instrument Landing System for Intraocular Target Approaching in Robotic Eye Surgery [51.05595735405451]
ロボット眼科手術(Robotic Ophthalmic surgery)は、網膜下注入における網膜侵入や網膜剥離における浮動組織の除去など、高精度な介入を促進する新しい技術である。現在の画像に基づく手法では、針先端の軌跡を網膜と浮動標的の両方に向けて効果的に推定することはできない。本研究では,ターゲットの影位置と楽器先端を用いて相対的な深度位置を推定する。手術シミュレータでは, 平均深度0.0127mm, 平均深度0.3473mm, 平均深度0.0127mm, 平均深度0.3473mmを目標とした。
論文参考訳（メタデータ） (2023-11-15T09:11:37Z)
Robotic Navigation Autonomy for Subretinal Injection via Intelligent Real-Time Virtual iOCT Volume Slicing [88.99939660183881]
網膜下注射のための自律型ロボットナビゲーションの枠組みを提案する。提案手法は,機器のポーズ推定方法,ロボットとi OCTシステム間のオンライン登録,およびインジェクションターゲットへのナビゲーションに適した軌道計画から構成される。ブタ前眼の精度と再現性について実験を行った。
論文参考訳（メタデータ） (2023-01-17T21:41:21Z)
Towards Autonomous Atlas-based Ultrasound Acquisitions in Presence of Articulated Motion [48.52403516006036]
本稿では、自律型ロボットUS手足のスキャンを可能にする視覚ベースのアプローチを提案する。この目的のために、アノテートされた血管構造を有するヒト腕のアトラスMRIテンプレートを使用して、軌跡を生成する。いずれの場合も、このシステムはボランティアの手足で計画された血管構造を取得することができる。
論文参考訳（メタデータ） (2022-08-10T15:39:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。