論文の概要: Depth Estimation from Single-shot Monocular Endoscope Image Using Image
Domain Adaptation And Edge-Aware Depth Estimation
- arxiv url: http://arxiv.org/abs/2201.04485v1
- Date: Wed, 12 Jan 2022 14:06:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-13 16:43:04.092304
- Title: Depth Estimation from Single-shot Monocular Endoscope Image Using Image
Domain Adaptation And Edge-Aware Depth Estimation
- Title(参考訳): 画像領域適応とエッジ認識深度推定を用いた単眼単眼内視鏡像の深さ推定
- Authors: Masahiro Oda, Hayato Itoh, Kiyohito Tanaka, Hirotsugu Takabatake,
Masaki Mori, Hiroshi Natori, Kensaku Mori
- Abstract要約: 領域適応によるランベルト面の変換とマルチスケールエッジロスを用いた深度推定による単眼単眼単眼内視鏡像からの深度推定法を提案する。
臓器の表面のテクスチャと特異反射により、深さ推定の精度が低下する。
本研究では,畳み込みニューラルネットワークを用いた大腸内視鏡像の解剖学的位置同定に,推定深度画像を適用した。
- 参考スコア(独自算出の注目度): 1.7086737326992167
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose a depth estimation method from a single-shot monocular endoscopic
image using Lambertian surface translation by domain adaptation and depth
estimation using multi-scale edge loss. We employ a two-step estimation process
including Lambertian surface translation from unpaired data and depth
estimation. The texture and specular reflection on the surface of an organ
reduce the accuracy of depth estimations. We apply Lambertian surface
translation to an endoscopic image to remove these texture and reflections.
Then, we estimate the depth by using a fully convolutional network (FCN).
During the training of the FCN, improvement of the object edge similarity
between an estimated image and a ground truth depth image is important for
getting better results. We introduced a muti-scale edge loss function to
improve the accuracy of depth estimation. We quantitatively evaluated the
proposed method using real colonoscopic images. The estimated depth values were
proportional to the real depth values. Furthermore, we applied the estimated
depth images to automated anatomical location identification of colonoscopic
images using a convolutional neural network. The identification accuracy of the
network improved from 69.2% to 74.1% by using the estimated depth images.
- Abstract(参考訳): 領域適応によるランベルト面の変換とマルチスケールエッジロスを用いた深度推定による単眼単眼単眼内視鏡像からの深度推定法を提案する。
未ペアデータからのランベルト面の変換と深度推定を含む2段階推定法を用いる。
臓器の表面のテクスチャと特異反射により、深さ推定の精度が低下する。
これらのテクスチャや反射を除去すべく,ランベルチアン表面翻訳を内視鏡画像に適用した。
次に,完全畳み込みネットワーク(FCN)を用いて深度を推定する。
FCNのトレーニング中は、推定画像と地上の真理深度画像とのオブジェクトエッジ類似性の改善が、より良い結果を得るために重要である。
我々は,深度推定の精度を向上させるため,マルチスケールエッジロス関数を導入した。
実際の大腸内視鏡画像を用いて,提案手法の定量的評価を行った。
推定深度値は実深度値に比例した。
さらに,畳み込みニューラルネットワークを用いた大腸内視鏡像の解剖学的位置同定に,推定深度画像を適用した。
推定深度画像を用いて,ネットワークの識別精度は69.2%から74.1%に向上した。
関連論文リスト
- ToDER: Towards Colonoscopy Depth Estimation and Reconstruction with Geometry Constraint Adaptation [67.22294293695255]
そこで本稿では,ToDERという双方向適応アーキテクチャを用いて,高精度な深度推定を行う新しいパイプラインを提案する。
以上の結果から,本手法は実写および合成大腸内視鏡ビデオの深度マップを精度良く予測できることが示唆された。
論文 参考訳(メタデータ) (2024-07-23T14:24:26Z) - ScaleDepth: Decomposing Metric Depth Estimation into Scale Prediction and Relative Depth Estimation [62.600382533322325]
本研究では,新しい単分子深度推定法であるScaleDepthを提案する。
提案手法は,距離深度をシーンスケールと相対深度に分解し,セマンティック・アウェア・スケール予測モジュールを用いて予測する。
本手法は,室内と屋外の両方のシーンを統一した枠組みで距離推定する。
論文 参考訳(メタデータ) (2024-07-11T05:11:56Z) - Temporal Lidar Depth Completion [0.08192907805418582]
PENetは, 再発の恩恵を受けるために, 最新の手法であるPENetをどう修正するかを示す。
提案アルゴリズムは,KITTI深度補完データセットの最先端結果を実現する。
論文 参考訳(メタデータ) (2024-06-17T08:25:31Z) - Weakly-Supervised Monocular Depth Estimationwith Resolution-Mismatched
Data [73.9872931307401]
単眼深度推定ネットワークをトレーニングするための弱教師付きフレームワークを提案する。
提案フレームワークは, 共有重量単分子深度推定ネットワークと蒸留用深度再構成ネットワークから構成される。
実験結果から,本手法は教師なし・半教師付き学習ベース方式よりも優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2021-09-23T18:04:12Z) - Differentiable Diffusion for Dense Depth Estimation from Multi-view
Images [31.941861222005603]
深度マップへの拡散がRGB監督からの多視点再投射誤差を最小限に抑えるように、細かな点集合を最適化することにより、深度を推定する手法を提案する。
また,複雑なシーン再構成に必要な50k以上のポイントを同時に最適化できる効率的な最適化ルーチンを開発した。
論文 参考訳(メタデータ) (2021-06-16T16:17:34Z) - Depth Completion using Plane-Residual Representation [84.63079529738924]
深度情報を最も近い深度平面ラベル$p$と残値$r$で解釈する新しい方法を紹介し,これをPlane-Residual (PR)表現と呼ぶ。
PR表現で深度情報を解釈し,それに対応する深度補完網を用いて,高速な計算により深度補完性能を向上させることができた。
論文 参考訳(メタデータ) (2021-04-15T10:17:53Z) - Variational Monocular Depth Estimation for Reliability Prediction [12.951621755732544]
教師付き学習手法の代替として,単眼深度推定のための自己教師付き学習が広く研究されている。
従来はモデル構造の変更による深度推定の精度向上に成功している。
本稿では, 単眼深度推定のための変分モデルを理論的に定式化し, 推定深度画像の信頼性を推定する。
論文 参考訳(メタデータ) (2020-11-24T06:23:51Z) - Deep Multi-view Depth Estimation with Predicted Uncertainty [11.012201499666503]
我々は、高密度光フローネットワークを用いて対応を計算し、点雲を三角測量して初期深度マップを得る。
三角測量の精度をさらに高めるため,画像の文脈に基づく初期深度マップを最適化する深度補正ネットワーク(DRN)を導入する。
論文 参考訳(メタデータ) (2020-11-19T00:22:09Z) - Adaptive confidence thresholding for monocular depth estimation [83.06265443599521]
本稿では,自己教師付ステレオマッチング法から生成されたステレオ画像の擬似地上真実深度マップを利用する新しい手法を提案する。
擬似地底深度マップの信頼度マップを推定し、不正確な擬似地底深度マップによる性能劣化を緩和する。
実験結果から, 最先端の単分子深度推定法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2020-09-27T13:26:16Z) - Monocular Retinal Depth Estimation and Joint Optic Disc and Cup
Segmentation using Adversarial Networks [18.188041599999547]
本稿では,1つの画像から深度マップを予測するために,対角ネットワークを用いた新しい手法を提案する。
5倍のクロスバリデーションで0.92の非常に高い平均相関係数を得る。
次に,光ディスクとカップセグメンテーションのプロキシタスクとして深度推定プロセスを利用する。
論文 参考訳(メタデータ) (2020-07-15T06:21:46Z) - Depth Completion Using a View-constrained Deep Prior [73.21559000917554]
近年の研究では、畳み込みニューラルネットワーク(CNN)の構造が、自然画像に有利な強い先行性をもたらすことが示されている。
この前者はディープ・イメージ・先行 (DIP) と呼ばれ、画像の装飾や塗装といった逆問題において有効な正則化器である。
我々は、DIPの概念を深度画像に拡張し、色画像とノイズと不完全な目標深度マップから、CNNネットワーク構造を先行して復元された深度マップを再構成する。
論文 参考訳(メタデータ) (2020-01-21T21:56:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。