論文の概要: HiFuse: Hierarchical Multi-Scale Feature Fusion Network for Medical
Image Classification
- arxiv url: http://arxiv.org/abs/2209.10218v1
- Date: Wed, 21 Sep 2022 09:30:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-22 17:01:27.086980
- Title: HiFuse: Hierarchical Multi-Scale Feature Fusion Network for Medical
Image Classification
- Title(参考訳): HiFuse: 医用画像分類のための階層型マルチスケール機能融合ネットワーク
- Authors: Xiangzuo Huo, Gang Sun, Shengwei Tian, Yan Wang, Long Yu, Jun Long,
Wendong Zhang, Aolun Li
- Abstract要約: 本稿では,医用画像分類のためのHiFuseと呼ばれる3分岐階層型マルチスケール機能融合ネットワーク構造を提案する。
提案したISICデータセットの精度はベースラインより7.6%高く、Covid-19データセットは21.5%、Kvasirデータセットは10.4%である。
- 参考スコア(独自算出の注目度): 16.455887856811465
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Medical image classification has developed rapidly under the impetus of the
convolutional neural network (CNN). Due to the fixed size of the receptive
field of the convolution kernel, it is difficult to capture the global features
of medical images. Although the self-attention-based Transformer can model
long-range dependencies, it has high computational complexity and lacks local
inductive bias. Much research has demonstrated that global and local features
are crucial for image classification. However, medical images have a lot of
noisy, scattered features, intra-class variation, and inter-class similarities.
This paper proposes a three-branch hierarchical multi-scale feature fusion
network structure termed as HiFuse for medical image classification as a new
method. It can fuse the advantages of Transformer and CNN from multi-scale
hierarchies without destroying the respective modeling so as to improve the
classification accuracy of various medical images. A parallel hierarchy of
local and global feature blocks is designed to efficiently extract local
features and global representations at various semantic scales, with the
flexibility to model at different scales and linear computational complexity
relevant to image size. Moreover, an adaptive hierarchical feature fusion block
(HFF block) is designed to utilize the features obtained at different
hierarchical levels comprehensively. The HFF block contains spatial attention,
channel attention, residual inverted MLP, and shortcut to adaptively fuse
semantic information between various scale features of each branch. The
accuracy of our proposed model on the ISIC2018 dataset is 7.6% higher than
baseline, 21.5% on the Covid-19 dataset, and 10.4% on the Kvasir dataset.
Compared with other advanced models, the HiFuse model performs the best. Our
code is open-source and available from https://github.com/huoxiangzuo/HiFuse.
- Abstract(参考訳): 医用画像分類は畳み込みニューラルネットワーク(cnn)の影響で急速に発展してきた。
コンボリューションカーネルの受容野の大きさが一定であるため,医用画像のグローバルな特徴を捉えることは困難である。
自己注意に基づくトランスフォーマーは、長距離依存をモデル化できるが、計算複雑性が高く、局所帰納バイアスがない。
多くの研究により、グローバルおよびローカル機能は画像分類に不可欠であることが示されている。
しかし、医用画像には多くのノイズ、散在した特徴、クラス内変異、クラス間の類似点がある。
本稿では,医用画像分類のためのHiFuseと呼ばれる3分岐階層型マルチスケール核融合ネットワーク構造を提案する。
様々な医用画像の分類精度を向上させるため、各モデルを破壊することなく、トランスフォーマーとcnnの利点をマルチスケール階層から融合させることができる。
局所的および大域的特徴ブロックの並列階層は、様々な意味的スケールで局所的特徴と大域的表現を効率的に抽出し、異なるスケールでモデル化する柔軟性と、画像サイズに関連する線形計算複雑性を持つように設計されている。
さらに、異なる階層レベルで得られた特徴を包括的に活用するために、適応的階層的特徴融合ブロック(HFFブロック)を設計する。
HFFブロックは、空間的注意、チャネル的注意、残差反転MLP、および各ブランチの様々なスケール特徴間で適応的に意味情報を融合するショートカットを含む。
ISIC2018データセットにおける提案したモデルの精度は、ベースラインよりも7.6%高く、Covid-19データセットでは21.5%、Kvasirデータセットでは10.4%である。
他の先進モデルと比較すると、hifuseモデルは最高の性能を発揮する。
私たちのコードはオープンソースで、https://github.com/huoxiangzuo/hifuseから利用できます。
関連論文リスト
- BEFUnet: A Hybrid CNN-Transformer Architecture for Precise Medical Image
Segmentation [0.0]
本稿では,医療画像の正確な分割のために,身体情報とエッジ情報の融合を強化するBEFUnetという,革新的なU字型ネットワークを提案する。
BEFUnetは、新しいローカル・クロス・アテンション・フィーチャー(LCAF)融合モジュール、新しいダブル・レベル・フュージョン(DLF)モジュール、デュアルブランチ・エンコーダの3つの主要モジュールから構成されている。
LCAFモジュールは、2つのモダリティの間に空間的に近接する特徴に対して、局所的な相互注意を選択的に行うことにより、エッジとボディの特徴を効率よく融合させる。
論文 参考訳(メタデータ) (2024-02-13T21:03:36Z) - PMFSNet: Polarized Multi-scale Feature Self-attention Network For
Lightweight Medical Image Segmentation [6.134314911212846]
現在の最先端の医用画像分割法は精度を優先するが、計算要求の増大とより大きなモデルサイズを犠牲にすることも多い。
計算冗長性を避けつつグローバルな局所特徴処理のバランスをとる新しい医用画像分割モデルPMFSNetを提案する。
長期依存関係をキャプチャするために,アテンション機構に基づいたマルチスケール機能拡張モジュールであるPMFSブロックをプラグインとして組み込んでいる。
論文 参考訳(メタデータ) (2024-01-15T10:26:47Z) - MultiFusionNet: Multilayer Multimodal Fusion of Deep Neural Networks for
Chest X-Ray Image Classification [16.479941416339265]
畳み込みニューラルネットワーク(CNN)を用いた自動システムは胸部X線画像分類の精度と効率を向上させることを約束している。
本稿では,異なる層から特徴を抽出し,それらを融合させる深層学習に基づく多層核融合モデルを提案する。
提案モデルでは,3クラス分類と2クラス分類の両方において,97.21%,99.60%の精度を実現している。
論文 参考訳(メタデータ) (2024-01-01T11:50:01Z) - Mutual-Guided Dynamic Network for Image Fusion [51.615598671899335]
画像融合のための新しい相互誘導動的ネットワーク(MGDN)を提案する。
5つのベンチマークデータセットによる実験結果から,提案手法は4つの画像融合タスクにおいて既存手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-08-24T03:50:37Z) - Deep Neural Networks Fused with Textures for Image Classification [20.58839604333332]
きめ細かい画像分類はコンピュータビジョンにおいて難しい課題である。
グローバルテクスチャと局所パッチ情報を組み合わせたFGICの融合手法を提案する。
提案手法は,有意なマージンを有する既存手法よりも高い分類精度を達成できた。
論文 参考訳(メタデータ) (2023-08-03T15:21:08Z) - M$^{2}$SNet: Multi-scale in Multi-scale Subtraction Network for Medical
Image Segmentation [73.10707675345253]
医用画像から多様なセグメンテーションを仕上げるマルチスケールサブトラクションネットワーク(M$2$SNet)を提案する。
本手法は,4つの異なる医用画像セグメンテーションタスクの11つのデータセットに対して,異なる評価基準の下で,ほとんどの最先端手法に対して好意的に機能する。
論文 参考訳(メタデータ) (2023-03-20T06:26:49Z) - How GNNs Facilitate CNNs in Mining Geometric Information from
Large-Scale Medical Images [2.2699159408903484]
畳み込みニューラルネットワーク(CNN)が捉えたグローバルな画像レベルの表現を強化するための融合フレームワークを提案する。
大腸癌と胃癌の大規模なコホートから得られた組織学的データセットの融合戦略について検討した。
論文 参考訳(メタデータ) (2022-06-15T15:27:48Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - Global Filter Networks for Image Classification [90.81352483076323]
本稿では,対数線形複雑度を持つ周波数領域における長期空間依存性を学習する,概念的に単純だが計算効率のよいアーキテクチャを提案する。
この結果から,GFNetはトランスフォーマー型モデルやCNNの効率,一般化能力,堅牢性において,非常に競争力のある代替手段となる可能性が示唆された。
論文 参考訳(メタデータ) (2021-07-01T17:58:16Z) - CoTr: Efficiently Bridging CNN and Transformer for 3D Medical Image
Segmentation [95.51455777713092]
畳み込みニューラルネットワーク(CNN)は、現代の3D医療画像セグメンテーションのデファクトスタンダードとなっている。
本稿では,bf畳み込みニューラルネットワークとbfトランスbf(cotr)を効率良く橋渡しし,正確な3次元医用画像分割を実現する新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-03-04T13:34:22Z) - Sequential Hierarchical Learning with Distribution Transformation for
Image Super-Resolution [83.70890515772456]
画像SRのための逐次階層学習型超解像ネットワーク(SHSR)を構築した。
特徴のスケール間相関を考察し、階層的情報を段階的に探索するシーケンシャルなマルチスケールブロック(SMB)を考案する。
実験結果から,SHSRは最先端手法に優れた定量的性能と視覚的品質が得られることが示された。
論文 参考訳(メタデータ) (2020-07-19T01:35:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。