論文の概要: Learning from few examples: Classifying sex from retinal images via deep
learning
- arxiv url: http://arxiv.org/abs/2207.09624v1
- Date: Wed, 20 Jul 2022 02:47:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-21 12:57:53.363122
- Title: Learning from few examples: Classifying sex from retinal images via deep
learning
- Title(参考訳): いくつか例から学ぶ:深層学習による網膜画像からの性分類
- Authors: Aaron Berk, Gulcenur Ozturan, Parsa Delavari, David Maberley,
\"Ozg\"ur Y{\i}lmaz and Ipek Oruc
- Abstract要約: 基礎画像から患者の性別を分類するために,小データセット上でのDLの性能について紹介する。
約2500基の画像を用いて開発した本モデルでは,最大0.72点のAUCスコアが得られた。
これは、データセットサイズが1000倍近く減少しているにもかかわらず、わずか25%のパフォーマンス低下に相当する。
- 参考スコア(独自算出の注目度): 3.9146761527401424
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning has seen tremendous interest in medical imaging, particularly
in the use of convolutional neural networks (CNNs) for developing automated
diagnostic tools. The facility of its non-invasive acquisition makes retinal
fundus imaging amenable to such automated approaches. Recent work in analyzing
fundus images using CNNs relies on access to massive data for training and
validation - hundreds of thousands of images. However, data residency and data
privacy restrictions stymie the applicability of this approach in medical
settings where patient confidentiality is a mandate. Here, we showcase results
for the performance of DL on small datasets to classify patient sex from fundus
images - a trait thought not to be present or quantifiable in fundus images
until recently. We fine-tune a Resnet-152 model whose last layer has been
modified for binary classification. In several experiments, we assess
performance in the small dataset context using one private (DOVS) and one
public (ODIR) data source. Our models, developed using approximately 2500
fundus images, achieved test AUC scores of up to 0.72 (95% CI: [0.67, 0.77]).
This corresponds to a mere 25% decrease in performance despite a nearly
1000-fold decrease in the dataset size compared to prior work in the
literature. Even with a hard task like sex categorization from retinal images,
we find that classification is possible with very small datasets. Additionally,
we perform domain adaptation experiments between DOVS and ODIR; explore the
effect of data curation on training and generalizability; and investigate model
ensembling to maximize CNN classifier performance in the context of small
development datasets.
- Abstract(参考訳): 深層学習は、医療画像、特に自動診断ツールを開発するための畳み込みニューラルネットワーク(cnns)の使用に大きな関心を寄せてきた。
非侵襲的買収により、網膜底イメージングはこのような自動化アプローチに適応できる。
cnnを用いたファンダス画像の解析に関する最近の研究は、トレーニングと検証のために大量のデータへのアクセスに依存している。
しかし、データレジデンシーとデータプライバシの制限は、患者の機密性が義務付けられている医療現場におけるこのアプローチの適用性を損なう。
本稿では,眼底画像から患者の性別を分類する小データセットにおけるdlの性能について,最近まで眼底画像に存在しなかったり,定量化できなかったりする特徴であるdlの性能を示す。
最後の層がバイナリ分類のために修正されたresnet-152モデルを微調整する。
いくつかの実験では、1つのプライベート(DOVS)と1つのパブリック(ODIR)データソースを用いて、小さなデータセットコンテキストのパフォーマンスを評価する。
約2500眼底画像を用いて開発した本モデルは,最大0.72点(95%ci: [0.67, 0.77])のaucスコアを達成した。
これは、以前の文献に比べてデータセットサイズが1000倍近く減少したにもかかわらず、パフォーマンスがたった25%減少することに相当する。
網膜画像からの性分類のような難しいタスクであっても、非常に小さなデータセットでは分類が可能である。
さらに,dovs と odir 間のドメイン適応実験を行い,データキュレーションがトレーニングと一般化性に与える影響を調査し,cnn 分類器の性能を最大化するモデルセンスリングを検討する。
関連論文リスト
- Local-to-Global Self-Supervised Representation Learning for Diabetic Retinopathy Grading [0.0]
本研究では,自己指導型学習と知識蒸留を用いた新しいハイブリッド学習モデルを提案する。
我々のアルゴリズムでは、自己教師型学習および知識蒸留モデルの中で初めて、テストデータセットがトレーニングデータセットよりも50%大きい。
類似の最先端モデルと比較すると,より高精度で効率的な表現空間が得られた。
論文 参考訳(メタデータ) (2024-10-01T15:19:16Z) - Comparative Analysis of ImageNet Pre-Trained Deep Learning Models and
DINOv2 in Medical Imaging Classification [7.205610366609243]
本稿では,脳MRIデータの3つの臨床的モダリティを用いたグリオーマグレーディングタスクを行った。
我々は、ImageNetやDINOv2をベースとした様々な事前学習深層学習モデルの性能を比較した。
臨床データでは,DINOv2 はImageNet ベースで事前訓練したモデルほど優れていなかった。
論文 参考訳(メタデータ) (2024-02-12T11:49:08Z) - Additional Look into GAN-based Augmentation for Deep Learning COVID-19
Image Classification [57.1795052451257]
我々は,GANに基づく拡張性能のデータセットサイズ依存性について,小サンプルに着目して検討した。
両方のセットでStyleGAN2-ADAをトレーニングし、生成した画像の品質を検証した後、マルチクラス分類問題における拡張アプローチの1つとしてトレーニングされたGANを使用する。
GANベースの拡張アプローチは、中規模および大規模データセットでは古典的な拡張に匹敵するが、より小さなデータセットでは不十分である。
論文 参考訳(メタデータ) (2024-01-26T08:28:13Z) - Self-Supervised Pre-Training with Contrastive and Masked Autoencoder
Methods for Dealing with Small Datasets in Deep Learning for Medical Imaging [8.34398674359296]
医用画像の深層学習は、診断ミスのリスクを最小限に抑え、放射線医の作業量を減らし、診断を加速する可能性がある。
このようなディープラーニングモデルのトレーニングには,すべてのトレーニングサンプルに対するアノテーションを備えた,大規模かつ正確なデータセットが必要です。
この課題に対処するために、ディープラーニングモデルは、自己教師付き学習の分野からのメソッドを使用してアノテーションなしで、大規模な画像データセット上で事前トレーニングすることができる。
論文 参考訳(メタデータ) (2023-08-12T11:31:01Z) - LVM-Med: Learning Large-Scale Self-Supervised Vision Models for Medical
Imaging via Second-order Graph Matching [59.01894976615714]
LVM-Medは、大規模医療データセットに基づいてトレーニングされた、最初のディープネットワークファミリーである。
55の公開データセットから約13万の医療画像を収集しました。
LVM-Medは、多くの最先端の教師付き、自己監督型、基礎モデルよりも経験的に優れている。
論文 参考訳(メタデータ) (2023-06-20T22:21:34Z) - Vision-Language Modelling For Radiological Imaging and Reports In The
Low Data Regime [70.04389979779195]
本稿では,視覚および言語入力を共通空間に埋め込んだ医用視覚言語モデル(VLM)について検討する。
本稿では,新しい画像領域やテキスト領域への汎用事前学習モデルの適用など,低データ性能向上のためのいくつかの候補手法について検討する。
テキスト・ツー・イメージ検索をベンチマークとして,2つの胸部X線および放射線学的報告を用いた可変サイズのトレーニングデータセットを用いて,これらの手法の性能評価を行った。
論文 参考訳(メタデータ) (2023-03-30T18:20:00Z) - Retinal Image Segmentation with Small Datasets [25.095695898777656]
糖尿病黄斑浮腫(DME)、加齢関連黄斑変性(AMD)、緑内障などの多くの眼疾患が網膜に出現し、不可逆的な失明や中心バージョンに深刻な障害を引き起こす。
オプティカルコヒーレンス・トモグラフィ(OCT)は網膜の3Dスキャンであり、網膜解剖の変化を診断し、モニターするために用いられる。
多くのDeep Learning(DL)メソッドは、網膜の病理学的変化を監視する自動化ツールの開発の成功を共有している。
論文 参考訳(メタデータ) (2023-03-09T08:32:14Z) - AMIGO: Sparse Multi-Modal Graph Transformer with Shared-Context
Processing for Representation Learning of Giga-pixel Images [53.29794593104923]
本稿では,スライド病理像全体に対する共有コンテキスト処理の新たな概念を提案する。
AMIGOは、組織内のセルラーグラフを使用して、患者に単一の表現を提供する。
我々のモデルは、データの20%以下で同じ性能を達成できる程度に、欠落した情報に対して強い堅牢性を示す。
論文 参考訳(メタデータ) (2023-03-01T23:37:45Z) - Data-Efficient Vision Transformers for Multi-Label Disease
Classification on Chest Radiographs [55.78588835407174]
視覚変換器(ViT)は一般的な画像の分類性能が高いにもかかわらず、このタスクには適用されていない。
ViTは、畳み込みではなくパッチベースの自己アテンションに依存しており、CNNとは対照的に、ローカル接続に関する事前の知識は存在しない。
以上の結果から,ViTとCNNのパフォーマンスはViTの利点に匹敵するものの,DeiTsはトレーニング用に適度に大規模なデータセットが利用可能であれば,前者よりも優れることがわかった。
論文 参考訳(メタデータ) (2022-08-17T09:07:45Z) - Classification of Microscopy Images of Breast Tissue: Region Duplication
based Self-Supervision vs. Off-the Shelf Deep Representations [0.0]
本稿では、畳み込みニューラルネットワーク(CNN)を訓練し、ドメイン固有の特徴を抽出する、新しい自己超越プレテキストタスクを提案する。
その結果,ResNet50を用いて抽出した深部機能に対して,パッチレベルの埋め込みを併用した99%の感度の最高の性能が得られた。
論文 参考訳(メタデータ) (2022-02-12T14:12:13Z) - Classification of COVID-19 in CT Scans using Multi-Source Transfer
Learning [91.3755431537592]
我々は,従来のトランスファー学習の改良にマルチソース・トランスファー・ラーニングを応用して,CTスキャンによる新型コロナウイルスの分類を提案する。
マルチソースファインチューニングアプローチでは、ImageNetで微調整されたベースラインモデルよりも優れています。
我々の最高のパフォーマンスモデルは、0.893の精度と0.897のリコールスコアを達成でき、ベースラインのリコールスコアを9.3%上回った。
論文 参考訳(メタデータ) (2020-09-22T11:53:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。