論文の概要: Real-time Monocular 2D and 3D Perception of Endoluminal Scenes for Controlling Flexible Robotic Endoscopic Instruments
- arxiv url: http://arxiv.org/abs/2602.14666v1
- Date: Mon, 16 Feb 2026 11:46:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.487213
- Title: Real-time Monocular 2D and 3D Perception of Endoluminal Scenes for Controlling Flexible Robotic Endoscopic Instruments
- Title(参考訳): フレキシブルロボット用内視鏡装置のリアルタイムモノクラー2次元および3次元認識
- Authors: Ruofeng Wei, Kai Chen, Yui Lun Ng, Yiyao Ma, Justin Di-Lang Ho, Hon Sing Tong, Xiaomei Wang, Jing Dai, Ka-Wai Kwok, Qi Dou,
- Abstract要約: 本稿では,内膜手術における連続体ロボットシステムのための視覚認識プラットフォームを提案する。
フレキシブル機器の位置と方向を識別する2次元および3次元学習に基づく知覚アルゴリズムを提案する。
物理的に現実的なシミュレータは、現実的な内在的なシーンを生成し、柔軟なロボットの制御を可能にする。
- 参考スコア(独自算出の注目度): 28.77639956401214
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Endoluminal surgery offers a minimally invasive option for early-stage gastrointestinal and urinary tract cancers but is limited by surgical tools and a steep learning curve. Robotic systems, particularly continuum robots, provide flexible instruments that enable precise tissue resection, potentially improving outcomes. This paper presents a visual perception platform for a continuum robotic system in endoluminal surgery. Our goal is to utilize monocular endoscopic image-based perception algorithms to identify position and orientation of flexible instruments and measure their distances from tissues. We introduce 2D and 3D learning-based perception algorithms and develop a physically-realistic simulator that models flexible instruments dynamics. This simulator generates realistic endoluminal scenes, enabling control of flexible robots and substantial data collection. Using a continuum robot prototype, we conducted module and system-level evaluations. Results show that our algorithms improve control of flexible instruments, reducing manipulation time by over 70% for trajectory-following tasks and enhancing understanding of surgical scenarios, leading to robust endoluminal surgeries.
- Abstract(参考訳): 子宮内膜手術は早期消化管および尿路癌に対して最小侵襲の選択肢を提供するが、外科的ツールと急激な学習曲線によって制限される。
ロボットシステム、特に連続ロボットは、正確な組織切除を可能にし、その結果を改善するフレキシブルな機器を提供する。
本稿では,内膜手術における連続体ロボットシステムのための視覚認識プラットフォームを提案する。
我々のゴールは、単眼の内視鏡画像に基づく知覚アルゴリズムを用いて、フレキシブル機器の位置と向きを特定し、組織からの距離を測定することである。
本研究では,2次元および3次元学習に基づく知覚アルゴリズムを導入し,フレキシブルな楽器力学をモデル化する物理現実的なシミュレータを開発した。
このシミュレータは、現実的な内在的なシーンを生成し、柔軟なロボットの制御と実質的なデータ収集を可能にする。
連続ロボットのプロトタイプを用いてモジュールとシステムレベルの評価を行った。
その結果, フレキシブル機器の制御を改良し, 軌道追従作業の操作時間を70%以上短縮し, 手術シナリオの理解を深め, 頑健な内膜手術をおこなった。
関連論文リスト
- Learning Surgical Robotic Manipulation with 3D Spatial Priors [73.00031539525202]
本稿では,3次元空間認識を持つ手術ロボットを支援する,終端から終端までのバイスモータポリシーであるSSTを紹介した。
立体内視鏡画像から頑健な3次元潜伏表現を抽出するために、手術3Dに基づいて強力な幾何学変換器を微調整する。
SSTは、複雑な外科手術における最先端性能と強力な空間一般化を実現する。
論文 参考訳(メタデータ) (2026-03-04T07:19:56Z) - Hysteresis-Aware Neural Network Modeling and Whole-Body Reinforcement Learning Control of Soft Robots [14.02771001060961]
外科的応用を目的としたソフトロボットシステムを提案する。
本稿では,ソフトロボットの全身動作を正確に把握し,予測する全身ニューラルネットワークモデルを提案する。
本手法はファントムを用いた手術実験において高い性能を示した。
論文 参考訳(メタデータ) (2025-04-18T09:34:56Z) - EchoWorld: Learning Motion-Aware World Models for Echocardiography Probe Guidance [79.66329903007869]
本稿では,プローブ誘導のためのモーションアウェアな世界モデリングフレームワークであるEchoWorldを紹介する。
解剖学的な知識と運動によって引き起こされる視覚力学を符号化する。
200以上の定期的なスキャンから100万枚以上の超音波画像で訓練されている。
論文 参考訳(メタデータ) (2025-04-17T16:19:05Z) - Instrument-Splatting: Controllable Photorealistic Reconstruction of Surgical Instruments Using Gaussian Splatting [15.51259636712844]
Real2Simは、外科的人工知能(AI)と自律性の急速な発展により、ますます重要になりつつある。
本稿では3次元ガウススプラッティングを応用した新しいReal2Sim法であるInstrument-Splattingを提案する。
論文 参考訳(メタデータ) (2025-03-06T04:37:09Z) - Realistic Data Generation for 6D Pose Estimation of Surgical Instruments [4.226502078427161]
手術器具の6次元ポーズ推定は,手術操作の自動実行を可能にするために重要である。
家庭や工業環境では、3Dコンピュータグラフィックスソフトウェアで生成された合成データが、アノテーションコストを最小限に抑える代替手段として示されている。
本稿では,大規模・多様なデータセットの自動生成を可能にする外科ロボティクスのシミュレーション環境の改善を提案する。
論文 参考訳(メタデータ) (2024-06-11T14:59:29Z) - Creating a Digital Twin of Spinal Surgery: A Proof of Concept [68.37190859183663]
手術デジタル化は、現実世界の手術の仮想レプリカを作成するプロセスである。
脊椎外科手術に応用した手術デジタル化のための概念実証(PoC)を提案する。
5台のRGB-Dカメラを外科医の動的3D再構成に、ハイエンドカメラを解剖学の3D再構成に、赤外線ステレオカメラを手術器具追跡に、レーザースキャナーを手術室の3D再構成とデータ融合に使用した。
論文 参考訳(メタデータ) (2024-03-25T13:09:40Z) - AiAReSeg: Catheter Detection and Segmentation in Interventional
Ultrasound using Transformers [75.20925220246689]
血管内手術は、電離放射線を用いてカテーテルと血管を可視化するFluoroscopyの黄金標準を用いて行われる。
本研究では、最先端機械学習トランスフォーマアーキテクチャを応用して、軸干渉超音波画像シーケンス中のカテーテルを検出し、セグメント化する手法を提案する。
論文 参考訳(メタデータ) (2023-09-25T19:34:12Z) - Next-generation Surgical Navigation: Marker-less Multi-view 6DoF Pose Estimation of Surgical Instruments [64.59698930334012]
静止カメラとヘッドマウントカメラを組み合わせたマルチカメラ・キャプチャー・セットアップを提案する。
第2に,手術用ウェットラボと実際の手術用劇場で撮影された元脊椎手術のマルチビューRGB-Dビデオデータセットを公表した。
第3に,手術器具の6DoFポーズ推定の課題に対して,最先端のシングルビューとマルチビューの3つの手法を評価した。
論文 参考訳(メタデータ) (2023-05-05T13:42:19Z) - Robotic Navigation Autonomy for Subretinal Injection via Intelligent
Real-Time Virtual iOCT Volume Slicing [88.99939660183881]
網膜下注射のための自律型ロボットナビゲーションの枠組みを提案する。
提案手法は,機器のポーズ推定方法,ロボットとi OCTシステム間のオンライン登録,およびインジェクションターゲットへのナビゲーションに適した軌道計画から構成される。
ブタ前眼の精度と再現性について実験を行った。
論文 参考訳(メタデータ) (2023-01-17T21:41:21Z) - A Kinematic Bottleneck Approach For Pose Regression of Flexible Surgical
Instruments directly from Images [17.32860829016479]
ロボットから提供される運動情報のみをトレーニング時に活用し、自己監督画像に基づく手法を提案する。
時間を要する手動アノテーションの導入を避けるため、問題は自動エンコーダとして定式化される。
本手法の検証は, 柔軟ロボット内視鏡を用いて, 半合成, 幻, および生体内データセットを用いて行った。
論文 参考訳(メタデータ) (2021-02-28T18:41:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。