論文の概要: Frequency Domain Convolutional Neural Network: Accelerated CNN for Large
Diabetic Retinopathy Image Classification
- arxiv url: http://arxiv.org/abs/2106.12736v1
- Date: Thu, 24 Jun 2021 02:52:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-25 15:16:02.875148
- Title: Frequency Domain Convolutional Neural Network: Accelerated CNN for Large
Diabetic Retinopathy Image Classification
- Title(参考訳): 周波数領域畳み込みニューラルネットワーク:大型糖尿病網膜症画像分類のための加速CNN
- Authors: Ee Fey Goh, ZhiYuan Chen and Wei Xiang Lim
- Abstract要約: 256x256ピクセルの画像サイズは、糖尿病網膜症(DR)分類のようなアプリケーションには小さすぎる。
本研究では、周波数領域の畳み込み(FDC)と周波数領域のプール(FDP)層を提案する。
FDCとFDP層は周波数領域畳み込みニューラルネットワーク(FDCNN)を構築するために使われ、DR分類のための大きな画像のトレーニングを高速化する。
- 参考スコア(独自算出の注目度): 1.1852751647387592
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The conventional spatial convolution layers in the Convolutional Neural
Networks (CNNs) are computationally expensive at the point where the training
time could take days unless the number of layers, the number of training images
or the size of the training images are reduced. The image size of 256x256
pixels is commonly used for most of the applications of CNN, but this image
size is too small for applications like Diabetic Retinopathy (DR)
classification where the image details are important for accurate
classification. This research proposed Frequency Domain Convolution (FDC) and
Frequency Domain Pooling (FDP) layers which were built with RFFT, kernel
initialization strategy, convolution artifact removal and Channel Independent
Convolution (CIC) to replace the conventional convolution and pooling layers.
The FDC and FDP layers are used to build a Frequency Domain Convolutional
Neural Network (FDCNN) to accelerate the training of large images for DR
classification. The Full FDC layer is an extension of the FDC layer to allow
direct use in conventional CNNs, it is also used to modify the VGG16
architecture. FDCNN is shown to be at least 54.21% faster and 70.74% more
memory efficient compared to an equivalent CNN architecture. The modified VGG16
architecture with Full FDC layer is reported to achieve a shorter training time
and a higher accuracy at 95.63% compared to the original VGG16 architecture for
DR classification.
- Abstract(参考訳): 畳み込みニューラルネットワーク(CNN)の従来の空間畳み込み層は、レイヤーの数、トレーニング画像の数、トレーニング画像のサイズを減らさない限り、トレーニング時間が数日かかるような時点で計算コストがかかる。
256x256ピクセルの画像サイズは、CNNのほとんどの用途で一般的に使われているが、正確な分類に画像の詳細が重要である糖尿病網膜症(DR)分類のようなアプリケーションでは、この画像サイズは小さすぎる。
本研究は、RFFT、カーネル初期化戦略、畳み込みアーティファクト除去、チャネル独立畳み込み(CIC)を用いて構築された周波数領域変換(FDC)と周波数領域プール(FDP)層を提案し、従来の畳み込み・プール層を置き換える。
FDC層とFDP層は周波数領域畳み込みニューラルネットワーク(FDCNN)を構築するために使用され、DR分類のための大きな画像のトレーニングを高速化する。
フルFDC層はFDC層の拡張であり、従来のCNNで直接使用することができるが、VGG16アーキテクチャの変更にも使用されている。
FDCNNは、同等のCNNアーキテクチャに比べて54.21%高速で、メモリ効率は70.74%向上している。
フルFDC層で修正されたVGG16アーキテクチャは、DR分類のためのオリジナルのVGG16アーキテクチャと比較して、トレーニング時間が短く、精度が95.63%向上したと報告されている。
関連論文リスト
- LeRF: Learning Resampling Function for Adaptive and Efficient Image Interpolation [64.34935748707673]
最近のディープニューラルネットワーク(DNN)は、学習データ前処理を導入することで、パフォーマンスを著しく向上させた。
本稿では,DNNが学習した構造的前提と局所的連続仮定の両方を活かした学習再サンプリング(Learning Resampling, LeRF)を提案する。
LeRFは空間的に異なる再サンプリング関数を入力画像ピクセルに割り当て、ニューラルネットワークを用いてこれらの再サンプリング関数の形状を予測する。
論文 参考訳(メタデータ) (2024-07-13T16:09:45Z) - TCCT-Net: Two-Stream Network Architecture for Fast and Efficient Engagement Estimation via Behavioral Feature Signals [58.865901821451295]
本稿では,新しい2ストリーム機能融合 "Tensor-Convolution and Convolution-Transformer Network" (TCCT-Net) アーキテクチャを提案する。
時間空間領域における意味のあるパターンをよりよく学習するために、ハイブリッド畳み込み変換器を統合する「CT」ストリームを設計する。
並行して、時間周波数領域からリッチなパターンを効率的に抽出するために、連続ウェーブレット変換(CWT)を用いて情報を2次元テンソル形式で表現する「TC」ストリームを導入する。
論文 参考訳(メタデータ) (2024-04-15T06:01:48Z) - Image Reconstruction for Accelerated MR Scan with Faster Fourier
Convolutional Neural Networks [87.87578529398019]
部分走査は、磁気共鳴イメージング(MRI)データ取得を2次元および3次元の両方で加速する一般的な手法である。
本稿では,Faster Fourier Convolution (FasterFC) と呼ばれる新しい畳み込み演算子を提案する。
2次元加速MRI法であるFasterFC-End-to-End-VarNetは、FasterFCを用いて感度マップと再構成品質を改善する。
k空間領域再構成を誘導する単一グループアルゴリズムを用いたFasterFC-based Single-to-group Network (FAS-Net) と呼ばれる3次元加速MRI法
論文 参考訳(メタデータ) (2023-06-05T13:53:57Z) - Improving Convolutional Neural Networks for Fault Diagnosis by
Assimilating Global Features [0.0]
本稿では, 局所的・グローバル的特徴を考慮した局所的CNNアーキテクチャを提案する。
提案したLG-CNNは,モデル複雑性を大幅に増大させることなく,故障診断性能を大幅に向上させることができる。
論文 参考訳(メタデータ) (2022-10-03T16:49:16Z) - Increasing the Accuracy of a Neural Network Using Frequency Selective
Mesh-to-Grid Resampling [4.211128681972148]
ニューラルネットワークの入力データの処理にFSMR(Keypoint frequency selective mesh-to-grid resampling)を提案する。
ネットワークアーキテクチャや分類タスクによって、トレーニング中のFSMRの適用は学習プロセスに役立ちます。
ResNet50とOxflower17データセットの分類精度は最大4.31ポイント向上できる。
論文 参考訳(メタデータ) (2022-09-28T21:34:47Z) - Fault Detection and Classification of Aerospace Sensors using a
VGG16-based Deep Neural Network [1.2599533416395765]
イメージフィケーションに基づくインテリジェントFDCという概念が近年研究されている。
本稿ではまず,重ねられた画像をより大きなサイズに膨らませるデータ拡張手法を提案する。
FDCニューラルネットワークは、VGG16を直接微調整することでトレーニングされる。
論文 参考訳(メタデータ) (2022-07-27T03:14:17Z) - CNNs for JPEGs: A Study in Computational Cost [49.97673761305336]
畳み込みニューラルネットワーク(CNN)は過去10年間で驚くべき進歩を遂げてきた。
CNNはRGBピクセルから直接データの堅牢な表現を学習することができる。
近年,圧縮領域から直接学習できる深層学習手法が注目されている。
論文 参考訳(メタデータ) (2020-12-26T15:00:10Z) - DCT-SNN: Using DCT to Distribute Spatial Information over Time for
Learning Low-Latency Spiking Neural Networks [7.876001630578417]
Spiking Neural Networks(SNN)は、従来のディープラーニングフレームワークに代わる有望な選択肢を提供する。
SNNは高い推論遅延に悩まされており、デプロイメントの大きなボトルネックとなっている。
本稿では、離散コサイン変換(DCT)を用いて、推論に必要な時間ステップ数を削減できるスケーラブルな時間ベースの符号化方式を提案する。
論文 参考訳(メタデータ) (2020-10-05T05:55:34Z) - Learning CNN filters from user-drawn image markers for coconut-tree
image classification [78.42152902652215]
本稿では,CNNの特徴抽出器を訓練するために,最小限のユーザ選択画像を必要とする手法を提案する。
本手法は,クラスを識別する画像領域のユーザ描画マーカーから,各畳み込み層のフィルタを学習する。
バックプロパゲーションに基づく最適化には依存せず、ココナッツツリー空中画像のバイナリ分類にその利点を実証する。
論文 参考訳(メタデータ) (2020-08-08T15:50:23Z) - Frequency learning for image classification [1.9336815376402716]
本稿では、トレーニング可能な周波数フィルタからなる入力画像のフーリエ変換を探索する新しい手法を提案する。
画像ブロックの周波数領域表現からグローバル特徴とローカル特徴の両方を学習するスライシング手法を提案する。
論文 参考訳(メタデータ) (2020-06-28T00:32:47Z) - R-FCN: Object Detection via Region-based Fully Convolutional Networks [87.62557357527861]
我々は,高精度かつ効率的な物体検出のための領域ベースの完全畳み込みネットワークを提案する。
我々の結果は、Faster R-CNNよりも2.5-20倍高速で、1画像あたり170msのテストタイムで達成される。
論文 参考訳(メタデータ) (2016-05-20T15:50:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。