論文の概要: RS-CA-HSICT: A Residual and Spatial Channel Augmented CNN Transformer Framework for Monkeypox Detection
- arxiv url: http://arxiv.org/abs/2511.15476v1
- Date: Wed, 19 Nov 2025 14:32:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-20 15:51:28.846539
- Title: RS-CA-HSICT: A Residual and Spatial Channel Augmented CNN Transformer Framework for Monkeypox Detection
- Title(参考訳): RS-CA-HSICT:モンキーポックス検出のための残留及び空間チャネル拡張CNNトランスフレームワーク
- Authors: Rashid Iqbal, Saddam Hussain Khan,
- Abstract要約: 本研究では,ResidualとSpatial LearningをベースとしたCNN-Transformerアーキテクチャのハイブリッドな深層学習手法を提案する。
提案するRS-CA-HSICTフレームワークは,HSICTブロック,残留CNNモジュール,空間CNNブロック,CAから構成される。
Kaggleベンチマークと多種多様なMPoxデータセットの実験結果から、分類精度は98.30%、F1スコアは98.13%と報告され、既存のCNNやViTよりも優れていた。
- 参考スコア(独自算出の注目度): 0.7857499581522376
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This work proposes a hybrid deep learning approach, namely Residual and Spatial Learning based Channel Augmented Integrated CNN-Transformer architecture, that leverages the strengths of CNN and Transformer towards enhanced MPox detection. The proposed RS-CA-HSICT framework is composed of an HSICT block, a residual CNN module, a spatial CNN block, and a CA, which enhances the diverse feature space, detailed lesion information, and long-range dependencies. The new HSICT module first integrates an abstract representation of the stem CNN and customized ICT blocks for efficient multihead attention and structured CNN layers with homogeneous (H) and structural (S) operations. The customized ICT blocks learn global contextual interactions and local texture extraction. Additionally, H and S layers learn spatial homogeneity and fine structural details by reducing noise and modeling complex morphological variations. Moreover, inverse residual learning enhances vanishing gradient, and stage-wise resolution reduction ensures scale invariance. Furthermore, the RS-CA-HSICT framework augments the learned HSICT channels with the TL-driven Residual and Spatial CNN maps for enhanced multiscale feature space capturing global and localized structural cues, subtle texture, and contrast variations. These channels, preceding augmentation, are refined through the Channel-Fusion-and-Attention block, which preserves discriminative channels while suppressing redundant ones, thereby enabling efficient computation. Finally, the spatial attention mechanism refines pixel selection to detect subtle patterns and intra-class contrast variations in Mpox. Experimental results on both the Kaggle benchmark and a diverse MPox dataset reported classification accuracy as high as 98.30% and an F1-score of 98.13%, which outperforms the existing CNNs and ViTs.
- Abstract(参考訳): 本稿では,CNN と Transformer の強みをMPox 検出に活用する,Residual and Spatial Learning based Channel Augmented Integrated CNN-Transformer Architecture というハイブリッドディープラーニング手法を提案する。
提案する RS-CA-HSICT フレームワークは,HSICT ブロック,残留 CNN モジュール,空間 CNN ブロック,CA から構成される。
新しいHSICTモジュールは、まず、ステムCNNの抽象表現と、効率的なマルチヘッドアテンションのためのICTブロックと、均質(H)および構造(S)操作を備えた構造化CNN層を統合する。
カスタマイズされたICTブロックは、グローバルなコンテキスト相互作用と局所的なテクスチャ抽出を学習する。
さらに、H層とS層はノイズを低減し、複雑な形態変化をモデル化することにより、空間的均一性と微細構造の詳細を学習する。
さらに、逆残差学習は消失勾配を高め、段階分解能の低下はスケール不変性を保証する。
さらに、RS-CA-HSICTフレームワークは、学習したHSICTチャネルをTL駆動のResidualとSpatial CNNマップで拡張し、グローバルおよびローカライズドな構造的手がかり、微妙なテクスチャ、コントラストのバリエーションをキャプチャするマルチスケールな特徴空間を実現する。
これらのチャネルは、増大前のチャネル・フュージョン・アンド・アテンションブロックによって洗練され、冗長なチャネルを抑えながら識別チャネルを保存し、効率的な計算を可能にする。
最後に、空間的注意機構により画素選択が洗練され、Mpoxの微妙なパターンやクラス内コントラストの変化を検出する。
Kaggleベンチマークと多種多様なMPoxデータセットの実験結果から、分類精度は98.30%、F1スコアは98.13%と報告され、既存のCNNやViTよりも優れていた。
関連論文リスト
- CE-RS-SBCIT A Novel Channel Enhanced Hybrid CNN Transformer with Residual, Spatial, and Boundary-Aware Learning for Brain Tumor MRI Analysis [0.7857499581522376]
このフレームワークは4つのコアイノベーションを通じて、局所的な細粒度とグローバルなコンテキストのキューを利用する。
このフレームワークは98.30%の精度、98.08%の感度、98.25%のF1スコア、98.43%の精度を実現している。
論文 参考訳(メタデータ) (2025-08-23T20:09:39Z) - A Novel Channel Boosted Residual CNN-Transformer with Regional-Boundary Learning for Breast Cancer Detection [6.6149904114661]
本研究では, CB-Res-RBCMTという新しいハイブリッドフレームワークを導入する。
提案したRBCMTは,CNN Meet Transformer (CMT) ブロックとステム畳み込みブロックを用いており,その後に新たなRegional and boundary (RB) 特徴抽出操作を行う。
提案されたCB-Res-RBCMTは、95.57%のF1スコア、95.63%の精度、96.42%の感度、標準ハーモナイズドストリジェントBUSIデータセットの94.79%の精度を達成した。
論文 参考訳(メタデータ) (2025-03-19T08:59:02Z) - CSHNet: A Novel Information Asymmetric Image Translation Method [57.22010952287759]
Swin Embedded CNN (SEC) と CNN Embedded Swin (CES) の2つの主要なモジュールを組み合わせた CNN-Swin Hybrid Network (CSHNet) を提案する。
CSHNetは、シーンレベルのデータセットとインスタンスレベルのデータセットで、視覚的品質とパフォーマンスのメトリクスの両方において、既存のメソッドよりも優れています。
論文 参考訳(メタデータ) (2025-01-17T13:44:54Z) - CNN-Transformer Rectified Collaborative Learning for Medical Image Segmentation [60.08541107831459]
本稿では,医用画像セグメンテーションのための強力なCNNベースモデルとトランスフォーマーベースモデルを学習するための,CNN-Transformer修正協調学習フレームワークを提案する。
具体的には,学生ソフトラベルの誤り領域を適応的に選択・修正する基礎的真理を取り入れた修正ロジット・ワイド・コラボレーティブ・ラーニング(RLCL)戦略を提案する。
また,機能空間におけるCNNベースモデルとTransformerベースモデル間の効果的な知識伝達を実現するために,クラス認識型特徴量協調学習(CFCL)戦略を提案する。
論文 参考訳(メタデータ) (2024-08-25T01:27:35Z) - A Novel Feature Map Enhancement Technique Integrating Residual CNN and Transformer for Alzheimer Diseases Diagnosis [1.2432046687586285]
アルツハイマー病(AD)は認知機能低下と異常な脳タンパクの蓄積を伴い、効果的な治療のために時間的診断を必要とする。
ディープラーニングの進歩を活かしたCADシステムはAD検出に成功しているが、計算精度とデータセットの微妙なコントラスト、構造、テクスチャの変化を呈している。
このアプローチは、新しいCNN Meet Transformer(HSCMT)、カスタマイズされた残留学習CNN、ADの多様な形態、コントラスト、テクスチャのバリエーションを学ぶための新しい特徴マップ拡張(FME)戦略の3つの異なる要素を統合する。
論文 参考訳(メタデータ) (2024-03-30T10:17:13Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - A heterogeneous group CNN for image super-resolution [127.2132400582117]
畳み込みニューラルネットワーク(CNN)は、深いアーキテクチャを通して顕著な性能を得た。
異種グループSR CNN(HGSRCNN)を,異なるタイプの構造情報を利用して高品質な画像を得る。
論文 参考訳(メタデータ) (2022-09-26T04:14:59Z) - Learning A 3D-CNN and Transformer Prior for Hyperspectral Image
Super-Resolution [80.93870349019332]
本稿では,CNN の代わりに Transformer を用いて HSI の事前学習を行う新しい HSISR 手法を提案する。
具体的には、まず勾配アルゴリズムを用いてHSISRモデルを解き、次に展開ネットワークを用いて反復解過程をシミュレートする。
論文 参考訳(メタデータ) (2021-11-27T15:38:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。