論文の概要: Learning-Based Depth and Pose Estimation for Monocular Endoscope with
Loss Generalization
- arxiv url: http://arxiv.org/abs/2107.13263v1
- Date: Wed, 28 Jul 2021 10:51:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-29 13:58:15.386333
- Title: Learning-Based Depth and Pose Estimation for Monocular Endoscope with
Loss Generalization
- Title(参考訳): 損失一般化による単眼内視鏡の深度とポス推定
- Authors: Aji Resindra Widya, Yusuke Monno, Masatoshi Okutomi, Sho Suzuki,
Takuji Gotoda, Kenji Miki
- Abstract要約: 本稿では,連続した内視鏡像を用いた深度・ポーズ推定ネットワークの学習のための新しい教師付きアプローチを提案する。
提案した胃3D再建パイプラインを用いて,実際の深度とトレーニングデータを生成する。
さらに,奥行きとポーズ損失項のバランスをとるための適切な重みを求める複雑なプロセスを回避するために,新しい一般化された測光損失関数を提案する。
- 参考スコア(独自算出の注目度): 10.864212162628625
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Gastroendoscopy has been a clinical standard for diagnosing and treating
conditions that affect a part of a patient's digestive system, such as the
stomach. Despite the fact that gastroendoscopy has a lot of advantages for
patients, there exist some challenges for practitioners, such as the lack of 3D
perception, including the depth and the endoscope pose information. Such
challenges make navigating the endoscope and localizing any found lesion in a
digestive tract difficult. To tackle these problems, deep learning-based
approaches have been proposed to provide monocular gastroendoscopy with
additional yet important depth and pose information. In this paper, we propose
a novel supervised approach to train depth and pose estimation networks using
consecutive endoscopy images to assist the endoscope navigation in the stomach.
We firstly generate real depth and pose training data using our previously
proposed whole stomach 3D reconstruction pipeline to avoid poor generalization
ability between computer-generated (CG) models and real data for the stomach.
In addition, we propose a novel generalized photometric loss function to avoid
the complicated process of finding proper weights for balancing the depth and
the pose loss terms, which is required for existing direct depth and pose
supervision approaches. We then experimentally show that our proposed
generalized loss performs better than existing direct supervision losses.
- Abstract(参考訳): 胃内視鏡は、胃などの消化器系の一部に影響を及ぼす疾患の診断と治療のための臨床標準である。
胃内視鏡は患者に多くの利点があるにもかかわらず、深度や内視鏡などの3D知覚の欠如など、実践者にはいくつかの課題がある。
このような課題は、内視鏡をナビゲートし、消化器内の病変の特定を困難にする。
これらの問題に対処するために、深層学習に基づくアプローチが提案されており、さらに重要な深さとポーズ情報を持つ単眼胃内視鏡を提供する。
本稿では,胃の内視鏡ナビゲーションを支援するために,腹腔鏡画像を用いて深度を訓練し,推定ネットワークを推定するための新しい教師付きアプローチを提案する。
まず,提案した全胃3D再建パイプラインを用いて実深度とトレーニングデータを合成し,コンピュータ生成(CG)モデルと胃の実データとの一般化能力の低下を回避する。
また,既存の直接的深度と姿勢監視アプローチに必要な深さとポーズ損失項のバランスをとるための適切な重みを求める複雑なプロセスを避けるために,新しい一般化測光損失関数を提案する。
次に,提案した一般化損失が,既存の直接監督損失よりも優れていることを示す。
関連論文リスト
- A Quantitative Evaluation of Dense 3D Reconstruction of Sinus Anatomy
from Monocular Endoscopic Video [8.32570164101507]
内視鏡的シーケンスと光学的トラッキングを用いた洞再建のための自己教師型アプローチの定量的解析を行った。
以上の結果から, 生成した復元は解剖学的に高い一致を示し, 平均点間誤差は0.91mmであった。
ポーズと深さ推定の不正確さがこの誤りに等しく寄与し、より短い軌跡を持つ局所的に一貫したシーケンスがより正確な再構成をもたらすことを確認した。
論文 参考訳(メタデータ) (2023-10-22T17:11:40Z) - AiAReSeg: Catheter Detection and Segmentation in Interventional
Ultrasound using Transformers [75.20925220246689]
血管内手術は、電離放射線を用いてカテーテルと血管を可視化するFluoroscopyの黄金標準を用いて行われる。
本研究では、最先端機械学習トランスフォーマアーキテクチャを応用して、軸干渉超音波画像シーケンス中のカテーテルを検出し、セグメント化する手法を提案する。
論文 参考訳(メタデータ) (2023-09-25T19:34:12Z) - Deep learning network to correct axial and coronal eye motion in 3D OCT
retinal imaging [65.47834983591957]
深層学習に基づくニューラルネットワークを用いて,OCTの軸運動とコロナ運動のアーチファクトを1つのスキャンで補正する。
実験結果から, 提案手法は動作アーチファクトを効果的に補正し, 誤差が他の方法よりも小さいことを示す。
論文 参考訳(メタデータ) (2023-05-27T03:55:19Z) - Photometric single-view dense 3D reconstruction in endoscopy [2.094821665776961]
大腸内視鏡検査において,光度ステレオによるヒト大腸の3次元立体再構成を実現するために,制御光を利用する。
本手法は実際の医療環境下で機能し,適切な位置校正法と大腸管形状に適応した深さ推定法の両方を提供する。
論文 参考訳(メタデータ) (2022-04-19T18:23:31Z) - 3D endoscopic depth estimation using 3D surface-aware constraints [16.161276518580262]
深度推定は3次元表面から行うことができることを示す。
本研究では,表面認識制約を統合した深度推定のための損失関数を提案する。
カメラパラメータは、深さ推定の制御と透明性を高めるために、トレーニングパイプラインに組み込まれる。
論文 参考訳(メタデータ) (2022-03-04T04:47:20Z) - ColDE: A Depth Estimation Framework for Colonoscopy Reconstruction [27.793186578742088]
本研究では,大腸内視鏡データの特別な課題に対処するために,一連のトレーニング損失を設計した。
ColDEという名前の自己監督型フレームワークは、十分なトレーニング損失を伴って、大腸内視鏡データのより詳細なマップを生成することができる。
論文 参考訳(メタデータ) (2021-11-19T04:44:27Z) - Adversarial Domain Feature Adaptation for Bronchoscopic Depth Estimation [111.89519571205778]
そこで本研究では,深度推定のためのドメイン適応手法を提案する。
提案する2段階構造は,まず,ラベル付き合成画像を用いた深度推定ネットワークを教師付きで訓練する。
実験の結果,提案手法は実画像上でのネットワーク性能をかなりの差で向上させることがわかった。
論文 参考訳(メタデータ) (2021-09-24T08:11:34Z) - Self-Supervised Generative Adversarial Network for Depth Estimation in
Laparoscopic Images [13.996932179049978]
本稿では,ジェネレーティブ・ディバイサル・ネットワークに基づく自己教師型深度推定手法であるSADepthを提案する。
エンコーダデコーダジェネレータと、トレーニング中に幾何学的制約を組み込む識別器で構成される。
2つの公開データセットの実験により、SADepthは最新の最先端の教師なし手法よりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2021-07-09T19:40:20Z) - FetReg: Placental Vessel Segmentation and Registration in Fetoscopy
Challenge Dataset [57.30136148318641]
Fetoscopy Laser Photocoagulation はツイン・ツー・ツイン・トランスフュージョン症候群(TTTS)の治療に広く用いられている治療法である
これにより、プロシージャ時間と不完全アブレーションが増加し、持続的なTTTSが生じる可能性がある。
コンピュータ支援による介入は、ビデオモザイクによって胎児の視野を広げ、船体ネットワークのより良い視覚化を提供することによって、これらの課題を克服するのに役立つかもしれない。
本稿では,長期フェトスコープビデオからドリフトフリーモザイクを作成することを目的とした,胎児環境のための汎用的でロバストなセマンティックセマンティックセグメンテーションとビデオモザイクアルゴリズムを開発するための大規模マルチセントデータセットを提案する。
論文 参考訳(メタデータ) (2021-06-10T17:14:27Z) - An Interpretable Multiple-Instance Approach for the Detection of
referable Diabetic Retinopathy from Fundus Images [72.94446225783697]
基礎画像における参照糖尿病網膜症検出のための機械学習システムを提案する。
画像パッチから局所情報を抽出し,アテンション機構により効率的に組み合わせることで,高い分類精度を実現することができる。
我々は,現在入手可能な網膜画像データセットに対するアプローチを評価し,最先端の性能を示す。
論文 参考訳(メタデータ) (2021-03-02T13:14:15Z) - Calibrating Self-supervised Monocular Depth Estimation [77.77696851397539]
近年、ニューラルネットワークが深度を学習し、画像のシーケンスに変化を起こさせる能力を示す方法は、訓練信号として自己スーパービジョンのみを使用している。
カメラの構成や環境に関する事前情報を取り入れることで,センサの追加に頼ることなく,自己教師型定式化を用いて,スケールのあいまいさを排除し,深度を直接予測できることを示す。
論文 参考訳(メタデータ) (2020-09-16T14:35:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。