論文の概要: Learning-Based Depth and Pose Estimation for Monocular Endoscope with
Loss Generalization
- arxiv url: http://arxiv.org/abs/2107.13263v1
- Date: Wed, 28 Jul 2021 10:51:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-29 13:58:15.386333
- Title: Learning-Based Depth and Pose Estimation for Monocular Endoscope with
Loss Generalization
- Title(参考訳): 損失一般化による単眼内視鏡の深度とポス推定
- Authors: Aji Resindra Widya, Yusuke Monno, Masatoshi Okutomi, Sho Suzuki,
Takuji Gotoda, Kenji Miki
- Abstract要約: 本稿では,連続した内視鏡像を用いた深度・ポーズ推定ネットワークの学習のための新しい教師付きアプローチを提案する。
提案した胃3D再建パイプラインを用いて,実際の深度とトレーニングデータを生成する。
さらに,奥行きとポーズ損失項のバランスをとるための適切な重みを求める複雑なプロセスを回避するために,新しい一般化された測光損失関数を提案する。
- 参考スコア(独自算出の注目度): 10.864212162628625
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Gastroendoscopy has been a clinical standard for diagnosing and treating
conditions that affect a part of a patient's digestive system, such as the
stomach. Despite the fact that gastroendoscopy has a lot of advantages for
patients, there exist some challenges for practitioners, such as the lack of 3D
perception, including the depth and the endoscope pose information. Such
challenges make navigating the endoscope and localizing any found lesion in a
digestive tract difficult. To tackle these problems, deep learning-based
approaches have been proposed to provide monocular gastroendoscopy with
additional yet important depth and pose information. In this paper, we propose
a novel supervised approach to train depth and pose estimation networks using
consecutive endoscopy images to assist the endoscope navigation in the stomach.
We firstly generate real depth and pose training data using our previously
proposed whole stomach 3D reconstruction pipeline to avoid poor generalization
ability between computer-generated (CG) models and real data for the stomach.
In addition, we propose a novel generalized photometric loss function to avoid
the complicated process of finding proper weights for balancing the depth and
the pose loss terms, which is required for existing direct depth and pose
supervision approaches. We then experimentally show that our proposed
generalized loss performs better than existing direct supervision losses.
- Abstract(参考訳): 胃内視鏡は、胃などの消化器系の一部に影響を及ぼす疾患の診断と治療のための臨床標準である。
胃内視鏡は患者に多くの利点があるにもかかわらず、深度や内視鏡などの3D知覚の欠如など、実践者にはいくつかの課題がある。
このような課題は、内視鏡をナビゲートし、消化器内の病変の特定を困難にする。
これらの問題に対処するために、深層学習に基づくアプローチが提案されており、さらに重要な深さとポーズ情報を持つ単眼胃内視鏡を提供する。
本稿では,胃の内視鏡ナビゲーションを支援するために,腹腔鏡画像を用いて深度を訓練し,推定ネットワークを推定するための新しい教師付きアプローチを提案する。
まず,提案した全胃3D再建パイプラインを用いて実深度とトレーニングデータを合成し,コンピュータ生成(CG)モデルと胃の実データとの一般化能力の低下を回避する。
また,既存の直接的深度と姿勢監視アプローチに必要な深さとポーズ損失項のバランスをとるための適切な重みを求める複雑なプロセスを避けるために,新しい一般化測光損失関数を提案する。
次に,提案した一般化損失が,既存の直接監督損失よりも優れていることを示す。
関連論文リスト
- ToDER: Towards Colonoscopy Depth Estimation and Reconstruction with Geometry Constraint Adaptation [67.22294293695255]
そこで本稿では,ToDERという双方向適応アーキテクチャを用いて,高精度な深度推定を行う新しいパイプラインを提案する。
以上の結果から,本手法は実写および合成大腸内視鏡ビデオの深度マップを精度良く予測できることが示唆された。
論文 参考訳(メタデータ) (2024-07-23T14:24:26Z) - 3D Reconstruction of the Human Colon from Capsule Endoscope Video [2.3513645401551337]
本研究では,ヒト大腸全切片の3次元モデル構築の可能性について,ワイヤレスカプセル内視鏡による画像シーケンスを用いて検討した。
近年のヒト消化器系の仮想グラフィックベースモデルでは、歪みやアーティファクトの有効化や無効化が可能なため、問題の解決が可能になっている。
論文 参考訳(メタデータ) (2024-07-21T17:31:38Z) - High-fidelity Endoscopic Image Synthesis by Utilizing Depth-guided Neural Surfaces [18.948630080040576]
内視鏡画像に適用したNeuSを1フレームの深度マップで補足した新しい大腸部分再建法を提案する。
本手法は, 大腸切片を完全にレンダリングし, 表面の見えない部分を捕捉する際の異常な精度を示す。
このブレークスルーは、安定的で一貫してスケールされた再建を達成するための道を開き、がんスクリーニングの手順と治療介入の質を高めることを約束する。
論文 参考訳(メタデータ) (2024-04-20T18:06:26Z) - CathFlow: Self-Supervised Segmentation of Catheters in Interventional Ultrasound Using Optical Flow and Transformers [66.15847237150909]
縦型超音波画像におけるカテーテルのセグメンテーションのための自己教師型ディープラーニングアーキテクチャを提案する。
ネットワークアーキテクチャは、Attention in Attentionメカニズムで構築されたセグメンテーショントランスフォーマであるAiAReSeg上に構築されている。
我々は,シリコンオルタファントムから収集した合成データと画像からなる実験データセット上で,我々のモデルを検証した。
論文 参考訳(メタデータ) (2024-03-21T15:13:36Z) - A Quantitative Evaluation of Dense 3D Reconstruction of Sinus Anatomy
from Monocular Endoscopic Video [8.32570164101507]
内視鏡的シーケンスと光学的トラッキングを用いた洞再建のための自己教師型アプローチの定量的解析を行った。
以上の結果から, 生成した復元は解剖学的に高い一致を示し, 平均点間誤差は0.91mmであった。
ポーズと深さ推定の不正確さがこの誤りに等しく寄与し、より短い軌跡を持つ局所的に一貫したシーケンスがより正確な再構成をもたらすことを確認した。
論文 参考訳(メタデータ) (2023-10-22T17:11:40Z) - AiAReSeg: Catheter Detection and Segmentation in Interventional
Ultrasound using Transformers [75.20925220246689]
血管内手術は、電離放射線を用いてカテーテルと血管を可視化するFluoroscopyの黄金標準を用いて行われる。
本研究では、最先端機械学習トランスフォーマアーキテクチャを応用して、軸干渉超音波画像シーケンス中のカテーテルを検出し、セグメント化する手法を提案する。
論文 参考訳(メタデータ) (2023-09-25T19:34:12Z) - Deep learning network to correct axial and coronal eye motion in 3D OCT
retinal imaging [65.47834983591957]
深層学習に基づくニューラルネットワークを用いて,OCTの軸運動とコロナ運動のアーチファクトを1つのスキャンで補正する。
実験結果から, 提案手法は動作アーチファクトを効果的に補正し, 誤差が他の方法よりも小さいことを示す。
論文 参考訳(メタデータ) (2023-05-27T03:55:19Z) - ColDE: A Depth Estimation Framework for Colonoscopy Reconstruction [27.793186578742088]
本研究では,大腸内視鏡データの特別な課題に対処するために,一連のトレーニング損失を設計した。
ColDEという名前の自己監督型フレームワークは、十分なトレーニング損失を伴って、大腸内視鏡データのより詳細なマップを生成することができる。
論文 参考訳(メタデータ) (2021-11-19T04:44:27Z) - Adversarial Domain Feature Adaptation for Bronchoscopic Depth Estimation [111.89519571205778]
そこで本研究では,深度推定のためのドメイン適応手法を提案する。
提案する2段階構造は,まず,ラベル付き合成画像を用いた深度推定ネットワークを教師付きで訓練する。
実験の結果,提案手法は実画像上でのネットワーク性能をかなりの差で向上させることがわかった。
論文 参考訳(メタデータ) (2021-09-24T08:11:34Z) - Calibrating Self-supervised Monocular Depth Estimation [77.77696851397539]
近年、ニューラルネットワークが深度を学習し、画像のシーケンスに変化を起こさせる能力を示す方法は、訓練信号として自己スーパービジョンのみを使用している。
カメラの構成や環境に関する事前情報を取り入れることで,センサの追加に頼ることなく,自己教師型定式化を用いて,スケールのあいまいさを排除し,深度を直接予測できることを示す。
論文 参考訳(メタデータ) (2020-09-16T14:35:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。