論文の概要: Leveraging a realistic synthetic database to learn Shape-from-Shading
for estimating the colon depth in colonoscopy images
- arxiv url: http://arxiv.org/abs/2311.05021v1
- Date: Wed, 8 Nov 2023 21:14:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-10 16:43:46.483730
- Title: Leveraging a realistic synthetic database to learn Shape-from-Shading
for estimating the colon depth in colonoscopy images
- Title(参考訳): 大腸内視鏡画像における大腸深度推定のためのシェーディング形状学習のためのリアルな合成データベースの利用
- Authors: Josu\'e Ruano, Mart\'in G\'omez, Eduardo Romero, Antoine Manzanera
- Abstract要約: 本研究は,単眼的大腸内視鏡画像から1フレームの大腸深度マップを推定する新しい手法を提案する。
生成した深度マップは、光源に関する結腸壁のシェーディング変動から推定される。
古典的な畳み込みニューラルネットワークアーキテクチャは、深さマップを推定するためにゼロから訓練される。
- 参考スコア(独自算出の注目度): 0.20482269513546453
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Colonoscopy is the choice procedure to diagnose colon and rectum cancer, from
early detection of small precancerous lesions (polyps), to confirmation of
malign masses. However, the high variability of the organ appearance and the
complex shape of both the colon wall and structures of interest make this
exploration difficult. Learned visuospatial and perceptual abilities mitigate
technical limitations in clinical practice by proper estimation of the
intestinal depth. This work introduces a novel methodology to estimate colon
depth maps in single frames from monocular colonoscopy videos. The generated
depth map is inferred from the shading variation of the colon wall with respect
to the light source, as learned from a realistic synthetic database. Briefly, a
classic convolutional neural network architecture is trained from scratch to
estimate the depth map, improving sharp depth estimations in haustral folds and
polyps by a custom loss function that minimizes the estimation error in edges
and curvatures. The network was trained by a custom synthetic colonoscopy
database herein constructed and released, composed of 248,400 frames (47
videos), with depth annotations at the level of pixels. This collection
comprehends 5 subsets of videos with progressively higher levels of visual
complexity. Evaluation of the depth estimation with the synthetic database
reached a threshold accuracy of 95.65%, and a mean-RMSE of 0.451 cm, while a
qualitative assessment with a real database showed consistent depth
estimations, visually evaluated by the expert gastroenterologist coauthoring
this paper. Finally, the method achieved competitive performance with respect
to another state-of-the-art method using a public synthetic database and
comparable results in a set of images with other five state-of-the-art methods.
- Abstract(参考訳): 大腸内視鏡は大腸癌と直腸癌を早期に診断し,悪性腫瘍の診断に有用である。
しかし、臓器の外観の変動が高く、大腸壁と興味のある構造の両方が複雑な形状であることから、この探検は困難である。
臨床実習における視覚・知覚能力の習得は,腸深度を適切に推定することによって技術的限界を緩和する。
本研究は,単眼大腸内視鏡ビデオから大腸深さマップを推定する新しい手法を提案する。
生成された深度マップは、現実的な合成データベースから学んだように、光源に対する大腸壁の陰影変化から推定される。
簡単に言うと、従来の畳み込みニューラルネットワークアーキテクチャをスクラッチから訓練して深さマップを推定し、エッジや曲率の推定誤差を最小限にするカスタム損失関数により、haustral foldsやpolypsのシャープな深さ推定を改善する。
このネットワークは、248,400フレーム(47ビデオ)のピクセルレベルで奥行きを注釈したカスタム合成大腸内視鏡データベースで訓練された。
このコレクションは、映像の5つのサブセットを徐々に高いレベルの視覚的複雑度で理解している。
合成データベースによる深さ推定の精度は95.65%、平均rmseは0.451cmに達したが、実データベースを用いた定性評価では一貫性のある深さ推定が示され、専門家の胃腸学者によって視覚的に評価された。
最後に、パブリック合成データベースを用いた別の最先端手法と、他の5つの最先端手法による画像群における比較結果に関して、競合性能を達成した。
関連論文リスト
- Structure-preserving Image Translation for Depth Estimation in Colonoscopy Video [1.0485739694839669]
本稿では,構造保存型合成現実画像(sim2real)のパイプラインを提案する。
これにより、教師付き深度推定のために、大量のリアルな合成画像を生成することができる。
また,画像翻訳のプロセスを改善するために,臨床大腸内視鏡からの手書き配列のデータセットも提案する。
論文 参考訳(メタデータ) (2024-08-19T17:02:16Z) - ToDER: Towards Colonoscopy Depth Estimation and Reconstruction with Geometry Constraint Adaptation [67.22294293695255]
そこで本稿では,ToDERという双方向適応アーキテクチャを用いて,高精度な深度推定を行う新しいパイプラインを提案する。
以上の結果から,本手法は実写および合成大腸内視鏡ビデオの深度マップを精度良く予測できることが示唆された。
論文 参考訳(メタデータ) (2024-07-23T14:24:26Z) - High-fidelity Endoscopic Image Synthesis by Utilizing Depth-guided Neural Surfaces [18.948630080040576]
内視鏡画像に適用したNeuSを1フレームの深度マップで補足した新しい大腸部分再建法を提案する。
本手法は, 大腸切片を完全にレンダリングし, 表面の見えない部分を捕捉する際の異常な精度を示す。
このブレークスルーは、安定的で一貫してスケールされた再建を達成するための道を開き、がんスクリーニングの手順と治療介入の質を高めることを約束する。
論文 参考訳(メタデータ) (2024-04-20T18:06:26Z) - Multi-task learning with cross-task consistency for improved depth
estimation in colonoscopy [0.2995885872626565]
我々は、共有エンコーダと2つのデコーダ、すなわち表面正規デコーダと深度推定器を備えた新しいマルチタスク学習(MTL)アプローチを開発する。
比較誤差は14.17%、$delta_1$精度は10.4%改善した。
論文 参考訳(メタデータ) (2023-11-30T16:13:17Z) - OADAT: Experimental and Synthetic Clinical Optoacoustic Data for
Standardized Image Processing [62.993663757843464]
オプトアコースティック(OA)イメージングは、ナノ秒レーザーパルスによる生体組織の励起と、光吸収による熱弾性膨張によって発生する超音波の検出に基づいている。
OAイメージングは、深部組織における豊富な光学コントラストと高分解能の強力な組み合わせを特徴としている。
臨床環境でのOAの幅広い応用を促進するために、異なるタイプの実験的なセットアップと関連する処理手法で生成される標準化データセットは存在しない。
論文 参考訳(メタデータ) (2022-06-17T08:11:26Z) - C$^3$Fusion: Consistent Contrastive Colon Fusion, Towards Deep SLAM in
Colonoscopy [0.0]
光内視鏡(OC)による3D大腸再建による非検査面の検出は未解決の問題である。
近年の手法では,(1)フレーム・ツー・フレーム(あるいはフレーム・ツー・モデル)の予測が多くのトラッキング障害を引き起こし,(2)スキャン品質を犠牲にしてポイントベース表現に頼っている。
本稿では,これらの課題を終末まで解決し,定量的かつ定性的かつ堅牢な3次元大腸再建を実現するための新しい再構築フレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-04T10:38:19Z) - Learning Topology from Synthetic Data for Unsupervised Depth Completion [66.26787962258346]
画像から高密度深度マップとスパース深度測定を推定する手法を提案する。
我々は,疎点雲と密度の高い自然形状の関係を学習し,その画像を用いて予測深度マップの検証を行う。
論文 参考訳(メタデータ) (2021-06-06T00:21:12Z) - A parameter refinement method for Ptychography based on Deep Learning
concepts [55.41644538483948]
伝播距離、位置誤差、部分的コヒーレンスにおける粗いパラメトリゼーションは、しばしば実験の生存性を脅かす。
最新のDeep Learningフレームワークは、セットアップの不整合を自律的に補正するために使用され、ポチコグラフィーの再構築の質が向上する。
我々は,elettra シンクロトロン施設のツインミックビームラインで取得した合成データセットと実データの両方でシステムをテストした。
論文 参考訳(メタデータ) (2021-05-18T10:15:17Z) - Chest x-ray automated triage: a semiologic approach designed for
clinical implementation, exploiting different types of labels through a
combination of four Deep Learning architectures [83.48996461770017]
本研究では,異なる畳み込みアーキテクチャの後期融合に基づく深層学習手法を提案する。
公開胸部x線画像と機関アーカイブを組み合わせたトレーニングデータセットを4つ構築した。
4つの異なるディープラーニングアーキテクチャをトレーニングし、それらのアウトプットとレイトフュージョン戦略を組み合わせることで、統一されたツールを得ました。
論文 参考訳(メタデータ) (2020-12-23T14:38:35Z) - Data Consistent CT Reconstruction from Insufficient Data with Learned
Prior Images [70.13735569016752]
偽陰性病変と偽陽性病変を呈示し,CT画像再構成における深層学習の堅牢性について検討した。
本稿では,圧縮センシングと深層学習の利点を組み合わせた画像品質向上のためのデータ一貫性再構築手法を提案する。
提案手法の有効性は,円錐ビームCTにおいて,トランキャットデータ,リミテッドアングルデータ,スパースビューデータで示される。
論文 参考訳(メタデータ) (2020-05-20T13:30:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。