論文の概要: Identifying the key components in ResNet-50 for diabetic retinopathy
grading from fundus images: a systematic investigation
- arxiv url: http://arxiv.org/abs/2110.14160v1
- Date: Wed, 27 Oct 2021 04:37:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-29 03:48:14.613922
- Title: Identifying the key components in ResNet-50 for diabetic retinopathy
grading from fundus images: a systematic investigation
- Title(参考訳): 糖尿病網膜症におけるresnet-50の主要成分の同定 : 組織学的検討
- Authors: Yijin Huang, Li Lin, Pujin Cheng, Junyan Lyu, Xiaoying Tang
- Abstract要約: トレーニング設定は予測性能に無視できない影響を与えます。
DRグレーディングのための標準ディープラーニングフレームワーク(ResNet-50)の主要なコンポーネントを同定する。
このフレームワークはEyePACSテストセット上での最先端の結果(0.8631 for Kappa)を達成する。
- 参考スコア(独自算出の注目度): 2.498907460918493
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Although deep learning based diabetic retinopathy (DR) classification methods
typically benefit from well-designed architectures of convolutional neural
networks, the training setting also has a non-negligible impact on the
prediction performance. The training setting includes various interdependent
components, such as objective function, data sampling strategy and data
augmentation approach. To identify the key components in a standard deep
learning framework (ResNet-50) for DR grading, we systematically analyze the
impact of several major components. Extensive experiments are conducted on a
publicly-available dataset EyePACS. We demonstrate that (1) the ResNet-50
framework for DR grading is sensitive to input resolution, objective function,
and composition of data augmentation, (2) using mean square error as the loss
function can effectively improve the performance with respect to a
task-specific evaluation metric, namely the quadratically-weighted Kappa, (3)
utilizing eye pairs boosts the performance of DR grading and (4) using data
resampling to address the problem of imbalanced data distribution in EyePACS
hurts the performance. Based on these observations and an optimal combination
of the investigated components, our framework, without any specialized network
design, achieves the state-of-the-art result (0.8631 for Kappa) on the EyePACS
test set (a total of 42670 fundus images) with only image-level labels. Our
codes and pre-trained model are available at
https://github.com/YijinHuang/pytorch-classification
- Abstract(参考訳): 深層学習に基づく糖尿病網膜症(DR)分類法は通常、畳み込みニューラルネットワークのよく設計されたアーキテクチャの恩恵を受けるが、トレーニング設定は予測性能に無視できない影響を及ぼす。
トレーニング設定は、客観的機能、データサンプリング戦略、データ拡張アプローチなど、さまざまな相互依存コンポーネントを含む。
DRグレーディングのための標準ディープラーニングフレームワーク(ResNet-50)の主要なコンポーネントを特定するために,いくつかの主要コンポーネントの影響を系統的に解析する。
公開データセットEyePACSで大規模な実験を行う。
We demonstrate that (1) the ResNet-50 framework for DR grading is sensitive to input resolution, objective function, and composition of data augmentation, (2) using mean square error as the loss function can effectively improve the performance with respect to a task-specific evaluation metric, namely the quadratically-weighted Kappa, (3) utilizing eye pairs boosts the performance of DR grading and (4) using data resampling to address the problem of imbalanced data distribution in EyePACS hurts the performance.
これらの観測と研究対象コンポーネントの最適組み合わせに基づき,ネットワーク設計を一切行わずに画像レベルラベルのみのeyepacsテストセット(合計42670眼底画像)の最先端結果(kappa用0.8631)を達成する。
私たちのコードと事前訓練済みモデルはhttps://github.com/YijinHuang/pytorch-classificationで利用可能です。
関連論文リスト
- Affinity-Graph-Guided Contractive Learning for Pretext-Free Medical Image Segmentation with Minimal Annotation [55.325956390997]
本稿では,医用画像セグメンテーションのための親和性グラフ誘導半教師付きコントラスト学習フレームワーク(Semi-AGCL)を提案する。
このフレームワークは、まず、ロバストな初期特徴空間を提供する平均パッチエントロピー駆動のパッチ間サンプリング法を設計する。
完全アノテーションセットの10%に過ぎず, 完全注釈付きベースラインの精度にアプローチし, 限界偏差は2.52%に過ぎなかった。
論文 参考訳(メタデータ) (2024-10-14T10:44:47Z) - Controllable retinal image synthesis using conditional StyleGAN and latent space manipulation for improved diagnosis and grading of diabetic retinopathy [0.0]
本稿では,高忠実かつ多様なDRファウンダス画像を生成するためのフレームワークを提案する。
生成画像内のDR重大度と視覚的特徴を包括的に制御する。
我々は、条件付きで生成したDR画像をグレードで操作し、データセットの多様性をさらに向上する。
論文 参考訳(メタデータ) (2024-09-11T17:08:28Z) - Visual Context-Aware Person Fall Detection [52.49277799455569]
画像中の個人とオブジェクトを半自動分離するセグメンテーションパイプラインを提案する。
ベッド、椅子、車椅子などの背景オブジェクトは、転倒検知システムに挑戦し、誤ったポジティブアラームを引き起こす。
トレーニング中のオブジェクト固有のコンテキスト変換が、この課題を効果的に軽減することを示す。
論文 参考訳(メタデータ) (2024-04-11T19:06:36Z) - Class Anchor Margin Loss for Content-Based Image Retrieval [97.81742911657497]
距離学習パラダイムに該当する新しいレペラ・トラクタ損失を提案するが、ペアを生成する必要がなく、直接L2メトリックに最適化する。
CBIRタスクにおいて,畳み込みアーキテクチャと変圧器アーキテクチャの両方を用いて,少数ショットおよびフルセットトレーニングの文脈で提案した目的を評価する。
論文 参考訳(メタデータ) (2023-06-01T12:53:10Z) - Discriminative Kernel Convolution Network for Multi-Label Ophthalmic
Disease Detection on Imbalanced Fundus Image Dataset [13.687617973585983]
緑内障、糖尿病網膜症、白内障などの眼疾患が世界中の視覚障害の主な原因である。
本研究は,識別的カーネル畳み込みネットワーク (DKCNet) を提案する。
また、全く見えない眼底像にも良い効果が認められる。
論文 参考訳(メタデータ) (2022-07-16T12:03:27Z) - Impact of loss function in Deep Learning methods for accurate retinal
vessel segmentation [1.1470070927586016]
我々は、深層学習アーキテクチャ(U-Net、Attention U-Net、Nested U-Net)とDRIVEデータセットを用いて、Binary Cross Entropy、Dice、Tversky、Comboの損失を比較した。
その結果,損失関数の選択には有意な差が認められた。
論文 参考訳(メタデータ) (2022-06-01T14:47:18Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - Boosting Segmentation Performance across datasets using histogram
specification with application to pelvic bone segmentation [1.3750624267664155]
限られたデータで訓練されたネットワークの性能を高めるために,画像のトーン分布の変調と深層学習に基づく手法を提案する。
セグメンテーションタスクは、拡張BCE-IoU損失関数を使用して最適化されたEfficientNet-B0バックボーンを備えたU-Net構成を使用します。
論文 参考訳(メタデータ) (2021-01-26T23:48:40Z) - RetiNerveNet: Using Recursive Deep Learning to Estimate Pointwise 24-2
Visual Field Data based on Retinal Structure [109.33721060718392]
緑内障は 世界でも 不可逆的な盲目の 主要な原因です 7000万人以上が 影響を受けています
The Standard Automated Perimetry (SAP) test's innate difficulty and its high test-retest variable, we propose the RetiNerveNet。
論文 参考訳(メタデータ) (2020-10-15T03:09:08Z) - Conversion and Implementation of State-of-the-Art Deep Learning
Algorithms for the Classification of Diabetic Retinopathy [0.0]
Inception-V3, VGG19, VGG16, ResNet50, InceptionResNetV2を実験により評価した。
彼らは、DR重度に基づいて、医療画像を5つの異なるクラスに分類する。
実験の結果、ResNet50はバイナリ分類の最高性能を示している。
論文 参考訳(メタデータ) (2020-10-07T20:42:14Z) - Retinopathy of Prematurity Stage Diagnosis Using Object Segmentation and
Convolutional Neural Networks [68.96150598294072]
未熟児網膜症(英: Retinopathy of Prematurity、ROP)は、主に体重の低い未熟児に影響を及ぼす眼疾患である。
網膜の血管の増殖を招き、視力喪失を招き、最終的には網膜剥離を招き、失明を引き起こす。
近年,ディープラーニングを用いて診断を自動化する試みが盛んに行われている。
本稿では,従来のモデルの成功を基盤として,オブジェクトセグメンテーションと畳み込みニューラルネットワーク(CNN)を組み合わせた新しいアーキテクチャを開発する。
提案システムでは,まず対象分割モデルを訓練し,画素レベルでの区切り線を識別し,その結果のマスクを追加の"カラー"チャネルとして付加する。
論文 参考訳(メタデータ) (2020-04-03T14:07:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。