論文の概要: Interpretable and synergistic deep learning for visual explanation and
statistical estimations of segmentation of disease features from medical
images
- arxiv url: http://arxiv.org/abs/2011.05791v1
- Date: Wed, 11 Nov 2020 14:08:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-26 23:13:22.794047
- Title: Interpretable and synergistic deep learning for visual explanation and
statistical estimations of segmentation of disease features from medical
images
- Title(参考訳): 医用画像からの疾患特徴分節の視覚的説明と統計的推定のための解釈的・相乗的深層学習
- Authors: Sambuddha Ghosal and Pratik Shah
- Abstract要約: 医学画像からの病因分類やセグメンテーションのための深層学習(DL)モデルは、無関係な自然界画像からの伝達学習(TL)を用いて、ますます訓練されている。
TL後バイナリセグメンテーションに広く用いられているDLアーキテクチャの比較,厳密な統計的解析,および比較について報告する。
TIIおよびLMIモデル、コード、10,000以上の医療画像の無料GitHubリポジトリと、この研究からのGrad-CAM出力は、高度な計算医学の出発点として利用できる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning (DL) models for disease classification or segmentation from
medical images are increasingly trained using transfer learning (TL) from
unrelated natural world images. However, shortcomings and utility of TL for
specialized tasks in the medical imaging domain remain unknown and are based on
assumptions that increasing training data will improve performance. We report
detailed comparisons, rigorous statistical analysis and comparisons of widely
used DL architecture for binary segmentation after TL with ImageNet
initialization (TII-models) with supervised learning with only medical
images(LMI-models) of macroscopic optical skin cancer, microscopic prostate
core biopsy and Computed Tomography (CT) DICOM images. Through visual
inspection of TII and LMI model outputs and their Grad-CAM counterparts, our
results identify several counter intuitive scenarios where automated
segmentation of one tumor by both models or the use of individual segmentation
output masks in various combinations from individual models leads to 10%
increase in performance. We also report sophisticated ensemble DL strategies
for achieving clinical grade medical image segmentation and model explanations
under low data regimes. For example; estimating performance, explanations and
replicability of LMI and TII models described by us can be used for situations
in which sparsity promotes better learning. A free GitHub repository of TII and
LMI models, code and more than 10,000 medical images and their Grad-CAM output
from this study can be used as starting points for advanced computational
medicine and DL research for biomedical discovery and applications.
- Abstract(参考訳): 医学画像からの病因分類やセグメンテーションのための深層学習(DL)モデルは、無関係な自然界画像からの伝達学習(TL)を用いて、ますます訓練されている。
しかし、医用画像領域における特殊なタスクに対するTLの欠点と有用性はいまだ不明であり、トレーニングデータの増加がパフォーマンスを向上させるという仮定に基づいている。
TLとImageNetの初期化(TII-models)とマクロな光学的皮膚癌(LMI-models)、顕微鏡的前立腺核生検、CT(CT)DICOM画像のみを用いた教師あり学習の比較,厳密な統計的解析,および2値分割のためのDLアーキテクチャの比較を行った。
TIIおよびLMIモデルアウトプットとそのGrad-CAMの視覚的検査により、両モデルによる1つの腫瘍の自動セグメンテーションや、個別モデルからの様々な組み合わせにおける個々のセグメンテーションアウトプットマスクの使用が10%の性能向上をもたらす、いくつかの直感的なシナリオを同定した。
また,低データ環境下で臨床グレードの医用画像分割とモデル説明を行うための高度アンサンブルDL戦略を報告した。
例えば、我々の記述したLMIモデルとTIIモデルの性能、説明、再現性を推定することは、スパーシティがより良い学習を促進する状況に利用できる。
TIIおよびLMIモデル、コード、10,000以上の医療画像の無料GitHubリポジトリとそのGrad-CAM出力は、生物医学的な発見と応用のための高度な計算医学およびDL研究の出発点として利用できる。
関連論文リスト
- MLIP: Enhancing Medical Visual Representation with Divergence Encoder
and Knowledge-guided Contrastive Learning [48.97640824497327]
本稿では、画像テキストのコントラスト学習を通じて、言語情報を視覚領域に統合するための案内信号として、ドメイン固有の医療知識を活用する新しいフレームワークを提案する。
我々のモデルには、設計した分散エンコーダによるグローバルコントラスト学習、局所トークン・知識・パッチアライメントコントラスト学習、知識誘導型カテゴリレベルのコントラスト学習、エキスパートナレッジによるコントラスト学習が含まれる。
特に、MLIPは、限られた注釈付きデータであっても最先端の手法を超越し、医療表現学習の進歩におけるマルチモーダル事前学習の可能性を強調している。
論文 参考訳(メタデータ) (2024-02-03T05:48:50Z) - C^2M-DoT: Cross-modal consistent multi-view medical report generation
with domain transfer network [67.97926983664676]
ドメイン転送ネットワーク(C2M-DoT)を用いたクロスモーダルなマルチビュー医療レポート生成を提案する。
C2M-DoTは、すべてのメトリクスで最先端のベースラインを大幅に上回る。
論文 参考訳(メタデータ) (2023-10-09T02:31:36Z) - Exploring Transfer Learning in Medical Image Segmentation using
Vision-Language Models [0.9324036842528547]
本稿では,VLSMの2次元医用画像への変換学習に関する最初のベンチマーク研究について述べる。
以上の結果から,VLSMは自然画像とテキストのペアで訓練され,ゼロショット設定で医療領域に合理的に移行することが示唆された。
しかし、微調整中の言語プロンプトのさらなる利点は限られているかもしれない。
論文 参考訳(メタデータ) (2023-08-15T11:28:21Z) - LVM-Med: Learning Large-Scale Self-Supervised Vision Models for Medical
Imaging via Second-order Graph Matching [59.01894976615714]
LVM-Medは、大規模医療データセットに基づいてトレーニングされた、最初のディープネットワークファミリーである。
55の公開データセットから約13万の医療画像を収集しました。
LVM-Medは、多くの最先端の教師付き、自己監督型、基礎モデルよりも経験的に優れている。
論文 参考訳(メタデータ) (2023-06-20T22:21:34Z) - Generalist Vision Foundation Models for Medical Imaging: A Case Study of
Segment Anything Model on Zero-Shot Medical Segmentation [5.547422331445511]
9つの医用画像セグメンテーションベンチマークにおいて,定量および定性的ゼロショットセグメンテーションの結果を報告する。
本研究は,医用画像における一般視基盤モデルの汎用性を示すものである。
論文 参考訳(メタデータ) (2023-04-25T08:07:59Z) - Vision-Language Modelling For Radiological Imaging and Reports In The
Low Data Regime [70.04389979779195]
本稿では,視覚および言語入力を共通空間に埋め込んだ医用視覚言語モデル(VLM)について検討する。
本稿では,新しい画像領域やテキスト領域への汎用事前学習モデルの適用など,低データ性能向上のためのいくつかの候補手法について検討する。
テキスト・ツー・イメージ検索をベンチマークとして,2つの胸部X線および放射線学的報告を用いた可変サイズのトレーニングデータセットを用いて,これらの手法の性能評価を行った。
論文 参考訳(メタデータ) (2023-03-30T18:20:00Z) - AMIGO: Sparse Multi-Modal Graph Transformer with Shared-Context
Processing for Representation Learning of Giga-pixel Images [53.29794593104923]
本稿では,スライド病理像全体に対する共有コンテキスト処理の新たな概念を提案する。
AMIGOは、組織内のセルラーグラフを使用して、患者に単一の表現を提供する。
我々のモデルは、データの20%以下で同じ性能を達成できる程度に、欠落した情報に対して強い堅牢性を示す。
論文 参考訳(メタデータ) (2023-03-01T23:37:45Z) - Medical Image Harmonization Using Deep Learning Based Canonical Mapping:
Toward Robust and Generalizable Learning in Imaging [4.396671464565882]
多様な取得条件のデータを共通参照領域に"調和"する新しいパラダイムを提案する。
我々は,MRIによる脳年齢予測と統合失調症の分類という,2つの問題に対して本手法を検証した。
論文 参考訳(メタデータ) (2020-10-11T22:01:37Z) - Democratizing Artificial Intelligence in Healthcare: A Study of Model
Development Across Two Institutions Incorporating Transfer Learning [8.043077408518826]
トランスファーラーニング(TL)は、非常に小さなローカルデータセットを使用して、ある機関から完全に訓練されたモデルを他の機関によって微調整することを可能にする。
本稿では,基本的なユースケースを対象としたAIモデル開発におけるTLの課題,方法論,メリットについて述べる。
論文 参考訳(メタデータ) (2020-09-25T21:12:50Z) - Pathological Retinal Region Segmentation From OCT Images Using Geometric
Relation Based Augmentation [84.7571086566595]
本稿では,幾何学と形状の内在的関係を共同で符号化することで,従来のGANベースの医用画像合成法よりも優れた手法を提案する。
提案手法は,取得手順の異なる画像を有する公開RETOUCHデータセット上で,最先端のセグメンテーション手法より優れている。
論文 参考訳(メタデータ) (2020-03-31T11:50:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。