論文の概要: Combining Deep Learning with Geometric Features for Image based
Localization in the Gastrointestinal Tract
- arxiv url: http://arxiv.org/abs/2005.05481v2
- Date: Wed, 13 May 2020 19:25:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-04 20:39:50.951927
- Title: Combining Deep Learning with Geometric Features for Image based
Localization in the Gastrointestinal Tract
- Title(参考訳): 画像に基づく消化管定位のための深層学習と幾何学的特徴の融合
- Authors: Jingwei Song, Mitesh Patel, Andreas Girgensohn, Chelhwon Kim
- Abstract要約: そこで本研究では,Deep Learning法と従来の特徴量に基づく手法を併用して,小さなトレーニングデータを用いたより優れたローカライゼーションを実現する手法を提案する。
本手法は, セグメンテッドトレーニング画像セットにおいて, 最寄りのゾーンに数発の分類を行うために, シームズネットワーク構造を導入することにより, 両世界の長所をフル活用する。
精度は28.94% (Position) と10.97% (Orientation) で改善されている。
- 参考スコア(独自算出の注目度): 8.510792628268824
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tracking monocular colonoscope in the Gastrointestinal tract (GI) is a
challenging problem as the images suffer from deformation, blurred textures,
significant changes in appearance. They greatly restrict the tracking ability
of conventional geometry based methods. Even though Deep Learning (DL) can
overcome these issues, limited labeling data is a roadblock to state-of-art DL
method. Considering these, we propose a novel approach to combine DL method
with traditional feature based approach to achieve better localization with
small training data. Our method fully exploits the best of both worlds by
introducing a Siamese network structure to perform few-shot classification to
the closest zone in the segmented training image set. The classified label is
further adopted to initialize the pose of scope. To fully use the training
dataset, a pre-generated triangulated map points within the zone in the
training set are registered with observation and contribute to estimating the
optimal pose of the test image. The proposed hybrid method is extensively
tested and compared with existing methods, and the result shows significant
improvement over traditional geometric based or DL based localization. The
accuracy is improved by 28.94% (Position) and 10.97% (Orientation) with respect
to state-of-art method.
- Abstract(参考訳): 消化管におけるモノクロ大腸鏡(gi)の追跡は,画像の変形,ぼやけたテクスチャ,外観の著しい変化に苦しむため,困難な課題である。
従来の幾何学に基づく手法の追跡能力を大幅に制限する。
深層学習(DL)はこれらの問題を克服できるが、ラベリングの制限は最先端のDL手法の障害となる。
そこで本研究では,DL法と従来の特徴量に基づく手法を併用して,小さなトレーニングデータを用いたより優れたローカライゼーションを実現する手法を提案する。
本手法は,セグメンテッドトレーニング画像セットの最も近いゾーンにマイトショット分類を行うため,シャムネットワーク構造を導入することで,両世界のベストを最大限に活用する。
分類ラベルは、スコープのポーズを初期化するためにさらに採用される。
トレーニングデータセットを十分に利用するために、トレーニングセット内のゾーン内の予め生成された三角マップポイントを観察登録し、テスト画像の最適なポーズの推定に寄与する。
提案手法は既存の手法と広範囲に比較検討され,従来の幾何ベースやdlベースに比べて大きな改善が見られた。
精度は28.94% (Position) と10.97% (Orientation) で改善されている。
関連論文リスト
- Domain Generalization for Endoscopic Image Segmentation by Disentangling Style-Content Information and SuperPixel Consistency [1.4991956341367338]
本稿では,インスタンス正規化とインスタンス選択白化(ISW)を用いて,ドメインの一般化を改善する手法を提案する。
本研究では,EndoUDA BarrettのEsophagusとEndoUDA polypsの2つのデータセットに対するアプローチを評価し,その性能を3つの最先端(SOTA)手法と比較した。
論文 参考訳(メタデータ) (2024-09-19T04:10:04Z) - Deep Learning Based Speckle Filtering for Polarimetric SAR Images. Application to Sentinel-1 [51.404644401997736]
本稿では、畳み込みニューラルネットワークを用いて偏光SAR画像のスペックルを除去するための完全なフレームワークを提案する。
実験により,提案手法はスペックル低減と分解能保存の両方において例外的な結果をもたらすことが示された。
論文 参考訳(メタデータ) (2024-08-28T10:07:17Z) - SwIPE: Efficient and Robust Medical Image Segmentation with Implicit Patch Embeddings [12.79344668998054]
正確な局所境界線とグローバルな形状コヒーレンスを実現するために,SwIPE(Segmentation with Implicit Patch Embeddings)を提案する。
その結果,最近の暗黙的アプローチよりもSwIPEは大幅に改善され,パラメータが10倍以上の最先端の離散手法よりも優れていた。
論文 参考訳(メタデータ) (2023-07-23T20:55:11Z) - LatentForensics: Towards frugal deepfake detection in the StyleGAN latent space [2.629091178090276]
本稿では,高品質な顔画像で訓練された最先端生成逆数ネットワーク(GAN)の潜時空間で動作するディープフェイク検出手法を提案する。
標準データセットの実験結果から,提案手法が他の最先端のディープフェイク分類法よりも優れていることが明らかになった。
論文 参考訳(メタデータ) (2023-03-30T08:36:48Z) - Parallax-Tolerant Unsupervised Deep Image Stitching [57.76737888499145]
本稿では,パララックス耐性の非教師あり深層画像縫合技術であるUDIS++を提案する。
まず,グローバルなホモグラフィから局所的な薄板スプライン運動への画像登録をモデル化するための,頑健で柔軟なワープを提案する。
本研究では, 縫合された画像をシームレスに合成し, シーム駆動合成マスクの教師なし学習を行うことを提案する。
論文 参考訳(メタデータ) (2023-02-16T10:40:55Z) - CAMERAS: Enhanced Resolution And Sanity preserving Class Activation
Mapping for image saliency [61.40511574314069]
バックプロパゲーション画像のサリエンシは、入力中の個々のピクセルのモデル中心の重要性を推定することにより、モデル予測を説明することを目的としている。
CAMERASは、外部の事前処理を必要とせずに、高忠実度バックプロパゲーション・サリエンシ・マップを計算できる手法である。
論文 参考訳(メタデータ) (2021-06-20T08:20:56Z) - An Adaptive Framework for Learning Unsupervised Depth Completion [59.17364202590475]
カラー画像から高密度深度マップとそれに伴うスパース深度測定を推定する手法を提案する。
正規化とコビジュアライゼーションは、モデルの適合度とデータによって関連付けられており、単一のフレームワークに統合可能であることを示す。
論文 参考訳(メタデータ) (2021-06-06T02:27:55Z) - Scalable Semi-supervised Landmark Localization for X-ray Images using
Few-shot Deep Adaptive Graph [19.588348005574165]
完全に監視されたグラフベースの方法であるDAGに基づいて、少数のショットDAGと呼ばれる半監視された拡張を提案しました。
まず、ラベル付きデータ上でDAGモデルをトレーニングし、教師のSSLメカニズムを使用してラベル付きデータ上で事前トレーニングされたモデルを微調整する。
骨盤,手指,胸部ランドマーク検出タスクについて広範囲に検討を行った。
論文 参考訳(メタデータ) (2021-04-29T19:46:18Z) - Contrastive Rendering for Ultrasound Image Segmentation [59.23915581079123]
米国の画像にシャープな境界がないことは、セグメンテーションに固有の課題である。
我々は,US画像における境界推定を改善するための,新しい,効果的なフレームワークを提案する。
提案手法は最先端の手法より優れており,臨床応用の可能性も高い。
論文 参考訳(メタデータ) (2020-10-10T07:14:03Z) - Attentive CutMix: An Enhanced Data Augmentation Approach for Deep
Learning Based Image Classification [58.20132466198622]
そこで我々は,CutMixに基づく自然拡張拡張戦略であるAttentive CutMixを提案する。
各トレーニングイテレーションにおいて、特徴抽出器から中間注意マップに基づいて最も記述性の高い領域を選択する。
提案手法は単純かつ有効であり,実装が容易であり,ベースラインを大幅に向上させることができる。
論文 参考訳(メタデータ) (2020-03-29T15:01:05Z) - Deep Weakly-Supervised Learning Methods for Classification and
Localization in Histology Images: A Survey [25.429124017422385]
深層学習モデルを用いて癌を診断することはいくつかの課題をもたらす。
深層弱教師付きオブジェクトローカライゼーション(WSOL)手法は、ディープラーニングモデルの低コストトレーニングのための戦略を提供する。
本稿では,WSOL の最先端 DL 手法について概説する。
論文 参考訳(メタデータ) (2019-09-08T00:01:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。