論文の概要: PS-DeVCEM: Pathology-sensitive deep learning model for video capsule
endoscopy based on weakly labeled data
- arxiv url: http://arxiv.org/abs/2011.12957v1
- Date: Sun, 22 Nov 2020 15:33:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-22 08:58:52.808989
- Title: PS-DeVCEM: Pathology-sensitive deep learning model for video capsule
endoscopy based on weakly labeled data
- Title(参考訳): ps-devcem:弱ラベルデータに基づくビデオカプセル内視鏡の病理センシティブ深層学習モデル
- Authors: A. Mohammed, I. Farup, M. Pedersen, S. Yildirim, and {\O} Hovde
- Abstract要約: 本稿では, ビデオカプセル内視鏡(VCE)データを用いて, フレームレベルの異常検出と大腸疾患の多ラベル分類を行うための, 病因性深層学習モデル(PS-DeVCEM)を提案する。
我々のモデルは注目に基づく深層マルチインスタンス学習によって駆動され、弱いラベル付きデータでエンドツーエンドに訓練されている。
トレーニング中にフレームアノテーション情報を使わずに、時間的にフレームを病状でローカライズする能力を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose a novel pathology-sensitive deep learning model (PS-DeVCEM) for
frame-level anomaly detection and multi-label classification of different colon
diseases in video capsule endoscopy (VCE) data. Our proposed model is capable
of coping with the key challenge of colon apparent heterogeneity caused by
several types of diseases. Our model is driven by attention-based deep multiple
instance learning and is trained end-to-end on weakly labeled data using video
labels instead of detailed frame-by-frame annotation. The spatial and temporal
features are obtained through ResNet50 and residual Long short-term memory
(residual LSTM) blocks, respectively. Additionally, the learned temporal
attention module provides the importance of each frame to the final label
prediction. Moreover, we developed a self-supervision method to maximize the
distance between classes of pathologies. We demonstrate through qualitative and
quantitative experiments that our proposed weakly supervised learning model
gives superior precision and F1-score reaching, 61.6% and 55.1%, as compared to
three state-of-the-art video analysis methods respectively. We also show our
model's ability to temporally localize frames with pathologies, without frame
annotation information during training. Furthermore, we collected and annotated
the first and largest VCE dataset with only video labels. The dataset contains
455 short video segments with 28,304 frames and 14 classes of colorectal
diseases and artifacts. Dataset and code supporting this publication will be
made available on our home page.
- Abstract(参考訳): 本稿では, ビデオカプセル内視鏡(VCE)データを用いて, フレームレベルの異常検出と異なる大腸疾患の多ラベル分類を行うための新しい病理モデル(PS-DeVCEM)を提案する。
提案するモデルは,いくつかの疾患に起因する大腸の明らかな多様性の鍵となる課題に対処できる。
我々のモデルは、注目に基づく深層多元学習によって駆動され、フレーム単位の詳細なアノテーションの代わりにビデオラベルを用いて、弱いラベル付きデータに対してエンドツーエンドで訓練される。
空間的特徴と時間的特徴はそれぞれResNet50と残長短期記憶ブロック(残留LSTM)を介して得られる。
さらに、学習した時間的注意モジュールは、最終ラベル予測に各フレームの重要性を提供する。
さらに,病理学のクラス間の距離を最大化する自己超越法を開発した。
筆者らが提案した弱教師付き学習モデルによる定性的および定量的実験により,3つの最先端ビデオ解析手法と比較して,F1スコアの到達精度が61.6%,55.1%に向上したことを示す。
また,訓練中にフレームアノテーション情報を使わずに,病理でフレームを時間的にローカライズする能力を示す。
さらに,ビデオラベルのみのVCEデータセットを収集し,注釈付けを行った。
データセットには455の短いビデオセグメントと28,304フレーム、14種類の大腸疾患とアーティファクトが含まれている。
このパブリッシュをサポートするデータセットとコードは、私たちのホームページで公開されます。
関連論文リスト
- Shape Matters: Detecting Vertebral Fractures Using Differentiable
Point-Based Shape Decoding [51.38395069380457]
変性性脊椎疾患は高齢者に多い。
骨粗しょう性骨折やその他の変性変形性骨折のタイムリーな診断は、重度の腰痛や障害のリスクを軽減するための前向きな処置を促進する。
本研究では,脊椎動物に対する形状自動エンコーダの使用について検討する。
論文 参考訳(メタデータ) (2023-12-08T18:11:22Z) - Automated interpretation of congenital heart disease from multi-view
echocardiograms [10.238433789459624]
先天性心疾患(CHD)は、中国で最も多い出生障害であり、新生児死亡の原因となっている。
本研究では,多視点心エコー図を実用的エンドツーエンドのフレームワークで自動解析する手法を提案する。
論文 参考訳(メタデータ) (2023-11-30T18:37:21Z) - Domain Adaptive Synapse Detection with Weak Point Annotations [63.97144211520869]
弱点アノテーションを用いたドメイン適応型シナプス検出のためのフレームワークであるAdaSynを提案する。
I SBI 2023のWASPSYNチャレンジでは、我々の手法が第1位にランクインした。
論文 参考訳(メタデータ) (2023-08-31T05:05:53Z) - Feature Representation Learning for Robust Retinal Disease Detection
from Optical Coherence Tomography Images [0.0]
眼科画像は、異なる網膜変性疾患を区別する自動化技術で失敗する、同一の外観の病理を含んでいる可能性がある。
本研究では,3つの学習ヘッドを持つ堅牢な疾患検出アーキテクチャを提案する。
2つのOCTデータセットによる実験結果から,提案モデルが既存の最先端モデルよりも精度,解釈可能性,堅牢性に優れ,網膜外網膜疾患の検出に有用であることが示唆された。
論文 参考訳(メタデータ) (2022-06-24T07:59:36Z) - About Explicit Variance Minimization: Training Neural Networks for
Medical Imaging With Limited Data Annotations [2.3204178451683264]
VAT(Variance Aware Training)法は、モデル損失関数に分散誤差を導入することにより、この特性を利用する。
多様な領域から得られた3つの医用画像データセットと様々な学習目標に対するVATの有効性を検証した。
論文 参考訳(メタデータ) (2021-05-28T21:34:04Z) - SSLM: Self-Supervised Learning for Medical Diagnosis from MR Video [19.5917119072985]
本稿では,磁気共鳴(MR)ビデオクリップから空間解剖学的表現を学習するための自己教師型学習手法を提案する。
提案する前文モデルは意味のある空間的文脈不変表現を学習する。
異なる実験は、プリテキストモデルによって学習された特徴が下流タスクで説明可能なパフォーマンスを提供することを示している。
論文 参考訳(メタデータ) (2021-04-21T12:01:49Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z) - Self-Training with Improved Regularization for Sample-Efficient Chest
X-Ray Classification [80.00316465793702]
挑戦的なシナリオで堅牢なモデリングを可能にするディープラーニングフレームワークを提案する。
その結果,85%のラベル付きデータを用いて,大規模データ設定で学習した分類器の性能に適合する予測モデルを構築することができた。
論文 参考訳(メタデータ) (2020-05-03T02:36:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。