論文の概要: FFCNet: Fourier Transform-Based Frequency Learning and Complex
Convolutional Network for Colon Disease Classification
- arxiv url: http://arxiv.org/abs/2207.01287v1
- Date: Mon, 4 Jul 2022 09:32:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-06 00:30:46.945970
- Title: FFCNet: Fourier Transform-Based Frequency Learning and Complex
Convolutional Network for Colon Disease Classification
- Title(参考訳): FFCNet: 大腸疾患分類のためのフーリエ変換に基づく周波数学習と複雑畳み込みネットワーク
- Authors: Kai-Ni Wang, Yuting He, Shuaishuai Zhuang, Juzheng Miao, Xiaopu He,
Ping Zhou, Guanyu Yang, Guang-Quan Zhou, Shuo Li
- Abstract要約: 大腸疾患分類のためのFFCNet(Fourier-based Frequency Complex Network)を提案する。
FFCNetは、複雑な畳み込みネットワークと周波数学習の組み合わせを可能にする、新しい複雑なネットワークである。
従来の最先端技術よりも86:35%, 背骨より4.46%高い精度で高い性能を実現している。
- 参考スコア(独自算出の注目度): 6.483399675485918
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reliable automatic classification of colonoscopy images is of great
significance in assessing the stage of colonic lesions and formulating
appropriate treatment plans. However, it is challenging due to uneven
brightness, location variability, inter-class similarity, and intra-class
dissimilarity, affecting the classification accuracy. To address the above
issues, we propose a Fourier-based Frequency Complex Network (FFCNet) for colon
disease classification in this study. Specifically, FFCNet is a novel complex
network that enables the combination of complex convolutional networks with
frequency learning to overcome the loss of phase information caused by real
convolution operations. Also, our Fourier transform transfers the average
brightness of an image to a point in the spectrum (the DC component),
alleviating the effects of uneven brightness by decoupling image content and
brightness. Moreover, the image patch scrambling module in FFCNet generates
random local spectral blocks, empowering the network to learn long-range and
local diseasespecific features and improving the discriminative ability of hard
samples. We evaluated the proposed FFCNet on an in-house dataset with 2568
colonoscopy images, showing our method achieves high performance outperforming
previous state-of-the art methods with an accuracy of 86:35% and an accuracy of
4.46% higher than the backbone. The project page with code is available at
https://github.com/soleilssss/FFCNet.
- Abstract(参考訳): 大腸内視鏡画像の信頼性の高い自動分類は大腸病変の病期評価や適切な治療計画の策定に非常に重要である。
しかし, 不均一な明るさ, 位置変動, クラス間類似性, クラス内類似性などにより, 分類精度に影響を与えている。
そこで本研究では,結腸疾患分類のためのフーリエベース周波数複合ネットワーク (ffcnet) を提案する。
具体的には、FFCNetは複雑な畳み込みネットワークと周波数学習を組み合わせることで、実際の畳み込み操作による位相情報の損失を克服する新しい複雑なネットワークである。
また、フーリエ変換は、画像の平均輝度をスペクトルの点(直流成分)に転送し、画像の内容と明るさを分離することで、均一な明るさの影響を緩和する。
さらに、FFCNetの画像パッチスクランブルモジュールはランダムな局所スペクトルブロックを生成し、ネットワークが長距離および局所的な疾患の特徴を学習し、ハードサンプルの識別能力を向上させる。
提案するffcnetを2568枚の大腸内視鏡画像を用いた社内データセット上で評価し,従来法と比較して86:35%,精度4.46%の精度で高い性能が得られることを示した。
コード付きのプロジェクトページはhttps://github.com/soleilssss/FFCNetで公開されている。
関連論文リスト
- Misalignment-Robust Frequency Distribution Loss for Image Transformation [51.0462138717502]
本稿では,画像強調や超解像といった深層学習に基づく画像変換手法における共通の課題に対処することを目的とする。
本稿では、周波数領域内における分布距離を計算するための、新しいシンプルな周波数分布損失(FDL)を提案する。
本手法は,周波数領域におけるグローバル情報の思慮深い活用により,トレーニング制約として実証的に有効であることが実証された。
論文 参考訳(メタデータ) (2024-02-28T09:27:41Z) - Affine-Consistent Transformer for Multi-Class Cell Nuclei Detection [76.11864242047074]
本稿では, 原子核位置を直接生成する新しいアフィン一貫性変換器 (AC-Former) を提案する。
本稿では,AAT (Adaptive Affine Transformer) モジュールを導入し,ローカルネットワークトレーニングのためのオリジナル画像をワープするための重要な空間変換を自動学習する。
実験結果から,提案手法は様々なベンチマークにおいて既存の最先端アルゴリズムを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2023-10-22T02:27:02Z) - PRISTA-Net: Deep Iterative Shrinkage Thresholding Network for Coded
Diffraction Patterns Phase Retrieval [6.982256124089]
位相検索は、計算画像および画像処理における非線型逆問題である。
我々は,1次反復しきい値しきい値アルゴリズム(ISTA)に基づく深層展開ネットワークであるPRISTA-Netを開発した。
非線形変換,しきい値,ステップサイズなど,提案するPRISTA-Netフレームワークのパラメータはすべて,設定されるのではなく,エンドツーエンドで学習される。
論文 参考訳(メタデータ) (2023-09-08T07:37:15Z) - Unlocking Fine-Grained Details with Wavelet-based High-Frequency
Enhancement in Transformers [4.208461204572879]
医用画像のセグメンテーションは、診断、治療計画、疾患モニタリングにおいて重要な役割を担っている。
本稿では,自己注意マップを慎重に再設計することで,トランスフォーマーモデルの局所的特徴不足に対処する。
そこで本研究では,マルチスケールのコンテキスト拡張ブロックをスキップ接続内で提案し,スケール間の依存関係を適応的にモデル化する。
論文 参考訳(メタデータ) (2023-08-25T15:42:19Z) - Performance of GAN-based augmentation for deep learning COVID-19 image
classification [57.1795052451257]
ディープラーニングを医療分野に適用する上で最大の課題は、トレーニングデータの提供である。
データ拡張は、限られたデータセットに直面した時に機械学習で使用される典型的な方法論である。
本研究は, 新型コロナウイルスの胸部X線画像セットを限定して, StyleGAN2-ADAモデルを用いて訓練するものである。
論文 参考訳(メタデータ) (2023-04-18T15:39:58Z) - Increasing the Accuracy of a Neural Network Using Frequency Selective
Mesh-to-Grid Resampling [4.211128681972148]
ニューラルネットワークの入力データの処理にFSMR(Keypoint frequency selective mesh-to-grid resampling)を提案する。
ネットワークアーキテクチャや分類タスクによって、トレーニング中のFSMRの適用は学習プロセスに役立ちます。
ResNet50とOxflower17データセットの分類精度は最大4.31ポイント向上できる。
論文 参考訳(メタデータ) (2022-09-28T21:34:47Z) - Preservation of High Frequency Content for Deep Learning-Based Medical
Image Classification [74.84221280249876]
大量の胸部ラジオグラフィーの効率的な分析は、医師や放射線技師を助けることができる。
本稿では,視覚情報の効率的な識別と符号化のための離散ウェーブレット変換(DWT)を提案する。
論文 参考訳(メタデータ) (2022-05-08T15:29:54Z) - SpectralFormer: Rethinking Hyperspectral Image Classification with
Transformers [91.09957836250209]
ハイパースペクトル(HS)画像は、ほぼ連続したスペクトル情報によって特徴づけられる。
CNNは、HS画像分類において強力な特徴抽出器であることが証明されている。
我々は、HS画像分類のためのulSpectralFormerと呼ばれる新しいバックボーンネットワークを提案する。
論文 参考訳(メタデータ) (2021-07-07T02:59:21Z) - Global Filter Networks for Image Classification [90.81352483076323]
本稿では,対数線形複雑度を持つ周波数領域における長期空間依存性を学習する,概念的に単純だが計算効率のよいアーキテクチャを提案する。
この結果から,GFNetはトランスフォーマー型モデルやCNNの効率,一般化能力,堅牢性において,非常に競争力のある代替手段となる可能性が示唆された。
論文 参考訳(メタデータ) (2021-07-01T17:58:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。