論文の概要: ConMatFormer: A Multi-attention and Transformer Integrated ConvNext based Deep Learning Model for Enhanced Diabetic Foot Ulcer Classification
- arxiv url: http://arxiv.org/abs/2510.22743v1
- Date: Sun, 26 Oct 2025 16:34:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 15:28:15.352183
- Title: ConMatFormer: A Multi-attention and Transformer Integrated ConvNext based Deep Learning Model for Enhanced Diabetic Foot Ulcer Classification
- Title(参考訳): ConMatFormer: マルチアテンション・トランスフォーマー統合型ConvNext型深層学習モデルによる糖尿病性足部潰瘍の分類
- Authors: Raihan Ahamed Rifat, Fuyad Hasan Bhoyan, Md Humaion Kabir Mehedi, Md Kaviul Hossain, Md. Jakir Hossen, M. F. Mridha,
- Abstract要約: ConMatFormerは,ConvNeXtブロック,マルチアテンション機構,トランスフォーマーモジュールを組み合わせた,新しいハイブリッドディープラーニングアーキテクチャである。
テストの結果、ConMatFormerは精度、信頼性、柔軟性の観点から、最先端(SOTA)畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)モデルを上回った。
DFU分類のための新しいベンチマークを設定し,医用画像解析のためのハイブリット・アテンション・トランスフォーマー・フレームワークを提供する。
- 参考スコア(独自算出の注目度): 0.21990652930491858
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diabetic foot ulcer (DFU) detection is a clinically significant yet challenging task due to the scarcity and variability of publicly available datasets. To solve these problems, we propose ConMatFormer, a new hybrid deep learning architecture that combines ConvNeXt blocks, multiple attention mechanisms convolutional block attention module (CBAM) and dual attention network (DANet), and transformer modules in a way that works together. This design facilitates the extraction of better local features and understanding of the global context, which allows us to model small skin patterns across different types of DFU very accurately. To address the class imbalance, we used data augmentation methods. A ConvNeXt block was used to obtain detailed local features in the initial stages. Subsequently, we compiled the model by adding a transformer module to enhance long-range dependency. This enabled us to pinpoint the DFU classes that were underrepresented or constituted minorities. Tests on the DS1 (DFUC2021) and DS2 (diabetic foot ulcer (DFU)) datasets showed that ConMatFormer outperformed state-of-the-art (SOTA) convolutional neural network (CNN) and Vision Transformer (ViT) models in terms of accuracy, reliability, and flexibility. The proposed method achieved an accuracy of 0.8961 and a precision of 0.9160 in a single experiment, which is a significant improvement over the current standards for classifying DFUs. In addition, by 4-fold cross-validation, the proposed model achieved an accuracy of 0.9755 with a standard deviation of only 0.0031. We further applied explainable artificial intelligence (XAI) methods, such as Grad-CAM, Grad-CAM++, and LIME, to consistently monitor the transparency and trustworthiness of the decision-making process.. Our findings set a new benchmark for DFU classification and provide a hybrid attention transformer framework for medical image analysis.
- Abstract(参考訳): 糖尿病性足潰瘍 (DFU) の検出は, 公用データセットの不足と変動が原因で, 臨床的に重要な課題である。
この問題を解決するためにConMatFormerを提案する。これはConvNeXtブロックと、CBAM(Multiple attention Mechanism Convolutional Block attention Module)とDANet(Dual attention Network)を組み合わせたハイブリッドディープラーニングアーキテクチャである。
この設計により、より優れた局所的特徴の抽出とグローバルコンテキストの理解が容易になり、異なる種類のDFUの小さなスキンパターンを非常に正確にモデル化することができる。
クラス不均衡に対処するために、データ拡張手法を使用しました。
ConvNeXtブロックは、初期段階で詳細なローカル特徴を取得するために使用された。
その後、長距離依存性を高めるためにトランスモジュールを追加してモデルをコンパイルした。
これによって、表現不足やマイノリティを構成するDFUクラスを特定できるようになりました。
DS1 (DFUC2021) と DS2 (糖尿病性フット潰瘍 (DFU) データセットの試験では、ConMatFormer は精度、信頼性、柔軟性の点で、CNN (State-of-the-art) 畳み込みニューラルネットワーク (SOTA) とViT (Vit) モデルより優れていた。
提案手法は1回の実験で0.8961の精度と0.9160の精度を実現した。
さらに, 4倍のクロスバリデーションにより, 標準偏差0.0031で0.9755の精度を実現した。
さらに、意思決定プロセスの透明性と信頼性を継続的に監視するために、Grad-CAM、Grad-CAM++、LIMEなどの説明可能な人工知能(XAI)手法を適用した。
と。
DFU分類のための新しいベンチマークを設定し,医用画像解析のためのハイブリット・アテンション・トランスフォーマー・フレームワークを提供する。
関連論文リスト
- Detection of retinal diseases using an accelerated reused convolutional network [3.5808917363708743]
ArConv層と呼ばれる新しい畳み込み層を組み込んだ新しい汎用モデルを作成します。
このモデルは携帯電話での使用に適した複雑さを持ち、疾患の存在を高精度に診断するタスクを実行することができる。
論文 参考訳(メタデータ) (2025-10-05T14:44:09Z) - MitoDetect++: A Domain-Robust Pipeline for Mitosis Detection and Atypical Subtyping [6.267650544824679]
MitoDetect++はMIDOG 2025チャレンジ用に設計された統合ディープラーニングパイプラインである。
検出には、EfficientNetV2-LをバックボーンとするU-Netベースのエンコーダデコーダアーキテクチャを用いる。
分類には、Lo-Rank Adaptation (LoRA) を用いて効率よく微調整されたVirchow2視覚変換器を用いて、資源消費を最小限に抑える。
論文 参考訳(メタデータ) (2025-08-28T18:19:51Z) - Model Inversion Attacks Through Target-Specific Conditional Diffusion Models [54.69008212790426]
モデル反転攻撃(MIA)は、ターゲット分類器のトレーニングセットからプライベートイメージを再構築することを目的としており、それによってAIアプリケーションにおけるプライバシー上の懸念が高まる。
従来のGANベースのMIAは、GANの固有の欠陥と潜伏空間における最適化の偏りにより、劣った遺伝子的忠実度に悩まされる傾向にある。
これらの問題を緩和するために拡散モデル反転(Diff-MI)攻撃を提案する。
論文 参考訳(メタデータ) (2024-07-16T06:38:49Z) - Multi-scale Quaternion CNN and BiGRU with Cross Self-attention Feature Fusion for Fault Diagnosis of Bearing [5.3598912592106345]
深層学習は断層診断(FD)に著しい進歩をもたらした
マルチスケール畳み込み畳み込みニューラルネットワーク(MQCNN)、双方向ゲートリカレントユニット(BiG)、クロス自己注意機能融合(CSAFF)を統合した新しいFDモデルを提案する。
論文 参考訳(メタデータ) (2024-05-25T07:55:02Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - Enhancing Multiple Reliability Measures via Nuisance-extended
Information Bottleneck [77.37409441129995]
トレーニングデータに制限がある現実的なシナリオでは、データ内の多くの予測信号は、データ取得のバイアスからより多く得る。
我々は,相互情報制約の下で,より広い範囲の摂動をカバーできる敵の脅威モデルを考える。
そこで本研究では,その目的を実現するためのオートエンコーダベーストレーニングと,提案したハイブリッド識別世代学習を促進するための実用的なエンコーダ設計を提案する。
論文 参考訳(メタデータ) (2023-03-24T16:03:21Z) - Learning Interpretable Microscopic Features of Tumor by Multi-task
Adversarial CNNs To Improve Generalization [1.7371375427784381]
既存のCNNモデルはブラックボックスとして機能し、医師が重要な診断機能がモデルによって使用されることを保証しない。
ここでは,マルチタスクと敵の損失を両立させる不確実性に基づく重み付けの組み合わせをエンド・ツー・エンドで学習することにより,病理的特徴に焦点を合わせることを推奨する。
AUC 0.89 (0.01) がベースラインであるAUC 0.86 (0.005) に対して最も高い値を示した。
論文 参考訳(メタデータ) (2020-08-04T12:10:35Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z) - Rectified Meta-Learning from Noisy Labels for Robust Image-based Plant
Disease Diagnosis [64.82680813427054]
植物病は食料安全保障と作物生産に対する主要な脅威の1つである。
1つの一般的なアプローチは、葉画像分類タスクとしてこの問題を変換し、強力な畳み込みニューラルネットワーク(CNN)によって対処できる。
本稿では,正規化メタ学習モジュールを共通CNNパラダイムに組み込んだ新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-17T09:51:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。