論文の概要: EndoSERV: A Vision-based Endoluminal Robot Navigation System
- arxiv url: http://arxiv.org/abs/2603.08324v1
- Date: Mon, 09 Mar 2026 12:44:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:15.994363
- Title: EndoSERV: A Vision-based Endoluminal Robot Navigation System
- Title(参考訳): EndoSERV: 視覚をベースとした内燃性ロボットナビゲーションシステム
- Authors: Junyang Wu, Fangfang Xie, Minghui Zhang, Hanxiao Zhang, Jiayuan Sun, Yun Gu, Guang-Zhong Yang,
- Abstract要約: 視覚に基づくナビゲーションは有望な解決策を提供するが、既存の局所化アプローチは組織変形によるエラーを起こしやすい。
本稿では,これらの課題に対処する新しいEndoSERVローカライゼーション手法を提案する。
textiti.e. textbfSEgment-to-structure と textbfReal-to-textbfVirtual マッピングの2つの主要な部分を含んでいる。
- 参考スコア(独自算出の注目度): 24.169832054647575
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Robot-assisted endoluminal procedures are increasingly used for early cancer intervention. However, the intricate, narrow and tortuous pathways within the luminal anatomy pose substantial difficulties for robot navigation. Vision-based navigation offers a promising solution, but existing localization approaches are error-prone due to tissue deformation, in vivo artifacts and a lack of distinctive landmarks for consistent localization. This paper presents a novel EndoSERV localization method to address these challenges. It includes two main parts, \textit{i.e.}, \textbf{SE}gment-to-structure and \textbf{R}eal-to-\textbf{V}irtual mapping, and hence the name. For long-range and complex luminal structures, we divide them into smaller sub-segments and estimate the odometry independently. To cater for label insufficiency, an efficient transfer technique maps real image features to the virtual domain to use virtual pose ground truth. The training phases of EndoSERV include an offline pretraining to extract texture-agnostic features, and an online phase that adapts to real-world conditions. Extensive experiments based on both public and clinical datasets have been performed to demonstrate the effectiveness of the method even without any real pose labels.
- Abstract(参考訳): ロボット支援の内膜手術は、早期がん治療にますます利用されている。
しかし、光解剖学における複雑で狭く丈夫な経路は、ロボットナビゲーションにかなりの困難をもたらす。
視覚に基づくナビゲーションは、有望な解決策を提供するが、既存の局所化アプローチは、組織変形、生体内アーティファクト、一貫した局在化のための顕著なランドマークの欠如によるエラーを起こしやすい。
本稿では,これらの課題に対処する新しいEndoSERVローカライゼーション手法を提案する。
これには2つの主要な部分が含まれる: \textit{i.e.}, \textbf{SE}gment-to-structure, \textbf{R}eal-to-\textbf{V}irtual mapping。
長距離および複雑な光構造では、それらをより小さなサブセグメントに分割し、独立してオードメトリーを推定する。
ラベル不足に対処するため、実像特徴を仮想領域にマッピングし、仮想ポーズグラウンド真理を使用する。
EndoSERVのトレーニングフェーズには、テクスチャに依存しない特徴を抽出するためのオフライン事前トレーニングと、現実世界の状態に適応するオンラインフェーズが含まれる。
実際のポーズラベルなしでも, パブリックデータセットと臨床データセットを併用した大規模な実験が実施されている。
関連論文リスト
- Deep Expert Injection for Anchoring Retinal VLMs with Domain-Specific Knowledge [66.67024684187915]
LVLM(Large Vision Language Models)は、眼科における自動診断の可能性を秘めている。
彼らの臨床展開は、ドメイン固有の知識の欠如によって著しく妨げられている。
EyExInは、Deep Expert Injectionメカニズムを通じて専門知識で網膜VLMを固定するように設計されたフレームワークである。
論文 参考訳(メタデータ) (2026-03-07T09:43:49Z) - Self-Supervised Anatomical Consistency Learning for Vision-Grounded Medical Report Generation [61.350584471060756]
医用画像の臨床的に正確な記述を作成することを目的とした医用レポート生成。
本稿では, 自己監督型解剖学的一貫性学習(SS-ACL)を提案し, 生成された報告を対応する解剖学的領域と整合させる。
SS-ACLは、ヒト解剖学の不変のトップダウン包摂構造にインスパイアされた階層的な解剖学的グラフを構築する。
論文 参考訳(メタデータ) (2025-09-30T08:59:06Z) - EchoWorld: Learning Motion-Aware World Models for Echocardiography Probe Guidance [79.66329903007869]
本稿では,プローブ誘導のためのモーションアウェアな世界モデリングフレームワークであるEchoWorldを紹介する。
解剖学的な知識と運動によって引き起こされる視覚力学を符号化する。
200以上の定期的なスキャンから100万枚以上の超音波画像で訓練されている。
論文 参考訳(メタデータ) (2025-04-17T16:19:05Z) - Generalizing Segmentation Foundation Model Under Sim-to-real Domain-shift for Guidewire Segmentation in X-ray Fluoroscopy [1.4353812560047192]
Sim-to-real ドメイン適応アプローチは、コスト効率の良いソリューションを提供するシミュレーションから合成データを利用する。
対象領域のアノテーションを使わずに、SAMを蛍光X線ガイドワイヤセグメント化に適応させる戦略を提案する。
提案手法は、事前訓練されたSAMと、最先端のドメイン適応技術の両方を大きなマージンで上回っている。
論文 参考訳(メタデータ) (2024-10-09T21:59:48Z) - CathFlow: Self-Supervised Segmentation of Catheters in Interventional Ultrasound Using Optical Flow and Transformers [66.15847237150909]
縦型超音波画像におけるカテーテルのセグメンテーションのための自己教師型ディープラーニングアーキテクチャを提案する。
ネットワークアーキテクチャは、Attention in Attentionメカニズムで構築されたセグメンテーショントランスフォーマであるAiAReSeg上に構築されている。
我々は,シリコンオルタファントムから収集した合成データと画像からなる実験データセット上で,我々のモデルを検証した。
論文 参考訳(メタデータ) (2024-03-21T15:13:36Z) - Domain Adaptive Sim-to-Real Segmentation of Oropharyngeal Organs Towards
Robot-assisted Intubation [15.795665057836636]
この作業では、Open Framework Architectureフレームワークによって生成された仮想データセットを導入し、実際の内視鏡画像の可用性の制限を克服する。
また,画像ブレンディング戦略を用いた咽頭臓器画像分割のための領域適応型Sim-to-Real法を提案する。
実験結果は,ドメイン適応モデルを用いた提案手法の優れた性能を示す。
論文 参考訳(メタデータ) (2023-05-19T14:08:15Z) - Domain Adaptive Sim-to-Real Segmentation of Oropharyngeal Organs [14.723143613743211]
経口的気管挿管(TI)は内視鏡を用いて必要であり、鼻腔の代わりに気管を喉頭に挿入するのに役立つ。
咽頭臓器の実在は、限られたオープンソースデータと患者のプライバシーのためにアクセスできないことが多い。
IoU-Ranking Blend-ArtFlow (IRB-AF) と呼ばれるドメイン適応型Sim-to-Realフレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-18T11:25:23Z) - Towards Scale Consistent Monocular Visual Odometry by Learning from the
Virtual World [83.36195426897768]
仮想データから絶対スケールを取得するための新しいフレームワークであるVRVOを提案する。
まず、モノクロ実画像とステレオ仮想データの両方を用いて、スケール対応の異種ネットワークをトレーニングする。
結果として生じるスケール一貫性の相違は、直接VOシステムと統合される。
論文 参考訳(メタデータ) (2022-03-11T01:51:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。