論文の概要: RSwinV2-MD: An Enhanced Residual SwinV2 Transformer for Monkeypox Detection from Skin Images
- arxiv url: http://arxiv.org/abs/2601.01835v1
- Date: Mon, 05 Jan 2026 06:57:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-06 16:25:22.828281
- Title: RSwinV2-MD: An Enhanced Residual SwinV2 Transformer for Monkeypox Detection from Skin Images
- Title(参考訳): RSwinV2-MD:皮膚画像からのサルポックス検出のための残留SwinV2変換器
- Authors: Rashid Iqbal, Saddam Hussain Khan,
- Abstract要約: 本稿では,RSwinV2 (Customized Residual SwinTransformerV2) と呼ばれるMpox診断のための深層学習手法を提案する。
このRSwinV2アプローチでは、入力画像を非重複パッチに分割し、シフトウィンドウを用いて処理し、これらのパッチに注意を払う。
RSwinV2はさらにSwinTransformerをベースとして開発され、トランスフォーマーのグローバルリンク機能を利用するためのパッチと位置埋め込みが含まれている。
- 参考スコア(独自算出の注目度): 0.7857499581522376
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In this paper, a deep learning approach for Mpox diagnosis named Customized Residual SwinTransformerV2 (RSwinV2) has been proposed, trying to enhance the capability of lesion classification by employing the RSwinV2 tool-assisted vision approach. In the RSwinV2 method, a hierarchical structure of the transformer has been customized based on the input dimensionality, embedding structure, and output targeted by the method. In this RSwinV2 approach, the input image has been split into non-overlapping patches and processed using shifted windows and attention in these patches. This process has helped the method link all the windows efficiently by avoiding the locality issues of non-overlapping regions in attention, while being computationally efficient. RSwinV2 has further developed based on SwinTransformer and has included patch and position embeddings to take advantage of the transformer global-linking capability by employing multi-head attention in these embeddings. Furthermore, RSwinV2 has developed and incorporated the Inverse Residual Block (IRB) into this method, which utilizes convolutional skip connections with these inclusive designs to address the vanishing gradient issues during processing. RSwinV2 inclusion of IRB has therefore facilitated this method to link global patterns as well as local patterns; hence, its integrity has helped improve lesion classification capability by minimizing variability of Mpox and increasing differences of Mpox, chickenpox, measles, and cowpox. In testing SwinV2, its accuracy of 96.21 and an F1score of 95.62 have been achieved on the Kaggle public dataset, which has outperformed standard CNN models and SwinTransformers; RSwinV2 vector has thus proved its valiance as a computer-assisted tool for Mpox lesion observation interpretation.
- Abstract(参考訳): 本稿では、RSwinV2ツールアシスト視覚アプローチを用いて、病変分類の能力を高めるために、RSwinV2(Customized Residual SwinTransformerV2)と呼ばれるMpox診断のための深層学習手法を提案する。
RSwinV2法では, 入力次元, 埋め込み構造, 出力に基づいて, トランスの階層構造をカスタマイズした。
このRSwinV2アプローチでは、入力画像を非重複パッチに分割し、シフトウィンドウを用いて処理し、これらのパッチに注意を払う。
このプロセスは、計算的に効率的でありながら、重複しない領域の局所性問題を回避し、全てのウィンドウを効率的にリンクするのに役立つ。
RSwinV2はさらにSwinTransformerをベースとして開発され、これらの埋め込みにマルチヘッドの注意を払って、トランスフォーマーのグローバルリンク機能を活用するパッチと位置埋め込みが組み込まれている。
さらに、RSwinV2は、これらの包摂的設計との畳み込みスキップ接続を利用して、処理中に消失する勾配問題に対処する逆Residual Block (IRB) をこの手法に組み込んだ。
RSwinV2によるIRBの包接化により、この手法は局所パターンとグローバルパターンを結びつけることが容易となり、その完全性はMpoxの多様性を最小化し、Mpox、チキンポックス、麻疹、牛痘の差異を増大させることにより、病変分類能力の向上に寄与した。
SwinV2のテストにおいて、96.21の精度と95.62のF1スコアは、標準的なCNNモデルやSwinTransformerよりも優れているKaggleの公開データセットで達成されている。
関連論文リスト
- AVP-Fusion: Adaptive Multi-Modal Fusion and Contrastive Learning for Two-Stage Antiviral Peptide Identification [2.242125769416219]
AVP-Fusionは、適応的な特徴融合と対照的な学習を統合した、新しい2段階のディープラーニングフレームワークである。
精度は 0.9531 であり、MCC は 0.9064 であり、最先端の手法を著しく上回っている。
移行学習を利用する第2段階では、このモデルは6つのウイルスファミリーと8つの特定のウイルスの正確なサブクラス予測を可能にする。
論文 参考訳(メタデータ) (2025-12-25T07:29:39Z) - DAPE V2: Process Attention Score as Feature Map for Length Extrapolation [63.87956583202729]
我々は特徴写像としての注意を概念化し、コンピュータビジョンにおける処理方法を模倣するために畳み込み演算子を適用した。
様々な注意関係のモデルに適応できる新しい洞察は、現在のTransformerアーキテクチャがさらなる進化の可能性があることを示している。
論文 参考訳(メタデータ) (2024-10-07T07:21:49Z) - RS-FME-SwinT: A Novel Feature Map Enhancement Framework Integrating Customized SwinT with Residual and Spatial CNN for Monkeypox Diagnosis [1.0523436939538895]
Monkeypox(MPox)は世界的な重要な関心事として現れており、ケースは毎日着実に増えている。
ディープラーニングは自動化されたソリューションを提供するが、データセットにはデータ不足、テクスチャ、コントラスト、クラス間の多様性、その他の皮膚感染症との類似性が含まれる。
残留学習と空間爆発的畳み込みニューラルネットワーク(CNN)の学習能力と、カスタマイズされたスウィントランスフォーマー(RS-FME-SwinT)を統合してMPox診断を捉えるハイブリッドアプローチが提案されている。
論文 参考訳(メタデータ) (2024-10-02T03:57:57Z) - Leveraging Swin Transformer for Local-to-Global Weakly Supervised
Semantic Segmentation [12.103012959947055]
本研究では、初期シードCAMの精度を高めるために「SWTformer」を提案することで、Swin Transformerの使用について検討する。
SWTformer-V1は、精度0.98%のmAPを実現し、最先端モデルより優れている。
SWTformer-V2は、追加情報を抽出するためにマルチスケールの機能融合機構を組み込んでいる。
論文 参考訳(メタデータ) (2024-01-31T13:41:17Z) - Cross-Dataset Adaptation for Instrument Classification in Cataract
Surgery Videos [54.1843419649895]
特定のデータセットでこのタスクをうまく実行する最先端モデルでは、別のデータセットでテストすると、パフォーマンスが低下する。
本稿では,Barlow Adaptorと呼ばれる新しいエンドツーエンドのUnsupervised Domain Adaptation (UDA)手法を提案する。
さらに,BFAL(Barlow Feature Alignment Loss)と呼ばれる,異なるドメインにまたがる特徴を整列させる新たな損失を導入する。
論文 参考訳(メタデータ) (2023-07-31T18:14:18Z) - Two-Stream Regression Network for Dental Implant Position Prediction [29.864052654136614]
インプラント補綴治療において,手術ガイドの設計はインプラント位置のマニュアル位置に大きく依存している。
ディープラーニングに基づく手法が、この問題に対処するために適用され始めている。
歯間の空間は様々であり、実際のインプラント領域と類似したテクスチャ特性を示すものもある。
論文 参考訳(メタデータ) (2023-05-17T08:37:26Z) - X-volution: On the unification of convolution and self-attention [52.80459687846842]
本稿では,畳み込み操作と自己注意操作の両方からなるマルチブランチ基本モジュールを提案する。
提案したX-進化は、非常に競争力のある視覚的理解の改善を実現する。
論文 参考訳(メタデータ) (2021-06-04T04:32:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。