論文の概要: A Cascaded Dilated Convolution Approach for Mpox Lesion Classification
- arxiv url: http://arxiv.org/abs/2412.10106v2
- Date: Sat, 28 Dec 2024 14:07:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-31 16:16:53.696721
- Title: A Cascaded Dilated Convolution Approach for Mpox Lesion Classification
- Title(参考訳): Mpox 病変分類のためのカスケード型拡張畳み込み法
- Authors: Ayush Deshmukh,
- Abstract要約: Mpoxウイルスは、他の皮膚疾患と視覚的に類似しているため、重要な診断上の課題を呈する。
深層学習に基づく皮膚病変分類のアプローチは、有望な代替手段を提供する。
本稿では,これらの課題に対処するためのCascaded Atrous Group Attentionフレームワークを紹介する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The global outbreak of the Mpox virus, classified as a Public Health Emergency of International Concern (PHEIC) by the World Health Organization, presents significant diagnostic challenges due to its visual similarity to other skin lesion diseases. Traditional diagnostic methods for Mpox, which rely on clinical symptoms and laboratory tests, are slow and labor intensive. Deep learning-based approaches for skin lesion classification offer a promising alternative. However, developing a model that balances efficiency with accuracy is crucial to ensure reliable and timely diagnosis without compromising performance. This study introduces the Cascaded Atrous Group Attention (CAGA) framework to address these challenges, combining the Cascaded Atrous Attention module and the Cascaded Group Attention mechanism. The Cascaded Atrous Attention module utilizes dilated convolutions and cascades the outputs to enhance multi-scale representation. This is integrated into the Cascaded Group Attention mechanism, which reduces redundancy in Multi-Head Self-Attention. By integrating the Cascaded Atrous Group Attention module with EfficientViT-L1 as the backbone architecture, this approach achieves state-of-the-art performance, reaching an accuracy of 98% on the Mpox Close Skin Image (MCSI) dataset while reducing model parameters by 37.5% compared to the original EfficientViT-L1. The model's robustness is demonstrated through extensive validation on two additional benchmark datasets, where it consistently outperforms existing approaches.
- Abstract(参考訳): 世界保健機関(WHO)による公衆衛生緊急事態(PHEIC)に分類されるMpoxウイルスの世界的な流行は、他の皮膚疾患と視覚的に類似していることから、重要な診断上の課題を呈している。
Mpoxの従来の診断方法は、臨床症状や検査に頼っているが、遅く、労働集約的である。
深層学習に基づく皮膚病変分類のアプローチは、有望な代替手段を提供する。
しかし,効率と精度のバランスをとるモデルの開発は,性能を損なうことなく信頼性とタイムリーな診断を確実にする上で重要である。
本研究では,Cascaded Atrous Group Attention(CAGA)フレームワークを導入し,Cascaded Atrous AttentionモジュールとCascaded Group Attentionメカニズムを組み合わせる。
Cascaded Atrous Attentionモジュールは拡張畳み込みを利用して出力をカスケードしてマルチスケール表現を強化する。
これはカスケードグループ注意機構に統合され、マルチヘッド・セルフ・アテンションにおける冗長性を減少させる。
Cascaded Atrous Group AttentionモジュールとEfficientViT-L1をバックボーンアーキテクチャとして統合することにより、Mpox Close Skin Image (MCSI)データセットで98%の精度を実現し、オリジナルのEfficientViT-L1と比較してモデルパラメータを37.5%削減する。
このモデルの堅牢性は、既存のアプローチを一貫して上回る2つのベンチマークデータセットに対する広範な検証を通じて実証されている。
関連論文リスト
- Efficient Epistemic Uncertainty Estimation in Cerebrovascular Segmentation [1.3980986259786223]
ベイズ近似とディープアンサンブルの利点を組み合わせた効率的なアンサンブルモデルを提案する。
高モデル不確実性と誤予測の領域は一致しており、このアプローチの有効性と信頼性を示している。
論文 参考訳(メタデータ) (2025-03-28T09:39:37Z) - MExD: An Expert-Infused Diffusion Model for Whole-Slide Image Classification [46.89908887119571]
Whole Slide Image (WSI) の分類は、画像サイズと多数の非表現領域が原因で、ユニークな課題を生んでいる。
本稿では,Mixture-of-Experts(MoE)機構の強度と拡張分類のための拡散モデルを組み合わせたエキスパート拡散モデルMExDを提案する。
論文 参考訳(メタデータ) (2025-03-16T08:04:17Z) - RURANET++: An Unsupervised Learning Method for Diabetic Macular Edema Based on SCSE Attention Mechanisms and Dynamic Multi-Projection Head Clustering [13.423253964156117]
RURANET++は、糖尿病黄斑浮腫(DME)の教師なし学習に基づく自動診断システムである
特徴処理中、トレーニング済みのGoogLeNetモデルは網膜画像から深い特徴を抽出し、PCAベースの次元を50次元に減らして計算効率を向上する。
実験の結果,複数の測定値に対して優れた性能を示し,最大精度(0.8411),精度(0.8593),リコール(0.8411),F1スコアを異常なクラスタリング品質で達成した。
論文 参考訳(メタデータ) (2025-02-27T16:06:57Z) - ActiveSSF: An Active-Learning-Guided Self-Supervised Framework for Long-Tailed Megakaryocyte Classification [3.6535793744942318]
本研究では,能動学習と自己教師付き事前学習を統合したActiveSSFフレームワークを提案する。
臨床用巨核球データセットによる実験結果から,ActiveSSFは最先端の性能を発揮することが示された。
さらなる研究を促進するため、コードとデータセットは将来的に一般公開される予定だ。
論文 参考訳(メタデータ) (2025-02-12T08:24:36Z) - Efficient and Comprehensive Feature Extraction in Large Vision-Language Model for Clinical Pathology Analysis [34.199766079609795]
病理診断は疾患の特徴の決定、治療指導、予後評価に不可欠である。
従来の純粋な視覚モデルは、冗長な特徴抽出の課題に直面している。
既存の視覚言語モデル(LVLM)は、入力解像度の制約によって制限され、その効率と精度を損なう。
課題誘導型機能拡張と課題誘導型詳細機能補完の2つの革新的戦略を提案する。
論文 参考訳(メタデータ) (2024-12-12T18:07:23Z) - Multimodal Outer Arithmetic Block Dual Fusion of Whole Slide Images and Omics Data for Precision Oncology [6.418265127069878]
本稿では, 局所(パッチレベル)から大域(スライダーレベル)の相互作用の相補的な情報を取得するために, 早期・後期融合におけるオミック埋め込みの利用を提案する。
この二重融合戦略は、解釈可能性と分類性能を高め、臨床診断の可能性を強調している。
論文 参考訳(メタデータ) (2024-11-26T13:25:53Z) - EfficientNet with Hybrid Attention Mechanisms for Enhanced Breast Histopathology Classification: A Comprehensive Approach [0.0]
本稿では,ハイブリット・エフィシエント・ネットモデルと高度な注意機構を統合し,特徴抽出を強化し,重要な画像領域に焦点を当てた新しいアプローチを提案する。
利用可能な病理組織学データセットを用いて,複数の拡大スケールでモデルの性能を評価する。
その結果, 精度, F1スコア, 精度, リコールなどの指標を用いて評価し, 診断精度を向上させる上での本モデルの有効性を実証した。
論文 参考訳(メタデータ) (2024-10-29T17:56:05Z) - Memory-efficient High-resolution OCT Volume Synthesis with Cascaded Amortized Latent Diffusion Models [48.87160158792048]
本稿では,高分解能CTボリュームをメモリ効率よく合成できるCA-LDM(Cascaded amortized Latent diffusion model)を提案する。
公開高解像度OCTデータセットを用いた実験により、我々の合成データは、既存の手法の能力を超越した、現実的な高解像度かつグローバルな特徴を持つことが示された。
論文 参考訳(メタデータ) (2024-05-26T10:58:22Z) - Super-resolution of biomedical volumes with 2D supervision [84.5255884646906]
超解像のための仮設スライス拡散は、生物学的標本のすべての空間次元にわたるデータ生成分布の固有同値性を利用する。
我々は,高解像度2次元画像の高速取得を特徴とするSliceRの組織学的刺激(SRH)への応用に着目する。
論文 参考訳(メタデータ) (2024-04-15T02:41:55Z) - Monkeypox disease recognition model based on improved SE-InceptionV3 [0.0]
本研究はSE-InceptionV3モデルを改良し,SENetモジュールを組み込み,インセプションV3フレームワークにL2正規化を組み込むことでサルポックス病の検出を向上する。
本モデルは,テストセットにおいて96.71%の精度を示し,従来の手法やディープラーニングモデルよりも優れていた。
論文 参考訳(メタデータ) (2024-03-15T08:01:44Z) - Spatial-aware Transformer-GRU Framework for Enhanced Glaucoma Diagnosis
from 3D OCT Imaging [1.8416014644193066]
本稿では3次元光コヒーレンス・トモグラフィー(OCT)画像の診断値を利用した新しいディープラーニングフレームワークを提案する。
我々は、リッチスライスな特徴抽出のための網膜データに事前学習された視覚変換器と、スライス間空間依存性をキャプチャするための双方向Gated Recurrent Unitを統合する。
大規模データセットに対する実験結果から,提案手法の最先端手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-03-08T22:25:15Z) - OCT-SelfNet: A Self-Supervised Framework with Multi-Modal Datasets for
Generalized and Robust Retinal Disease Detection [2.3349787245442966]
本研究は、眼疾患を検出するための自己教師付き堅牢な機械学習フレームワークであるOCT-SelfNetに貢献する。
本手法は,自己指導型事前学習と教師型微調整を組み合わせた2段階学習手法を用いてこの問題に対処する。
AUC-PR測定では,提案手法は42%を超え,ベースラインに比べて10%以上の性能向上を示した。
論文 参考訳(メタデータ) (2024-01-22T20:17:14Z) - Improving Multiple Sclerosis Lesion Segmentation Across Clinical Sites:
A Federated Learning Approach with Noise-Resilient Training [75.40980802817349]
深層学習モデルは、自動的にMS病変を分節する約束を示しているが、正確な注釈付きデータの不足は、この分野の進歩を妨げている。
我々は,MS病変の不均衡分布とファジィ境界を考慮したDecoupled Hard Label Correction(DHLC)戦略を導入する。
また,集約型中央モデルを利用したCELC(Centrally Enhanced Label Correction)戦略も導入した。
論文 参考訳(メタデータ) (2023-08-31T00:36:10Z) - Automatic diagnosis of knee osteoarthritis severity using Swin
transformer [55.01037422579516]
変形性膝関節症 (KOA) は膝関節の慢性的な痛みと硬直を引き起こす疾患である。
我々は,Swin Transformer を用いて KOA の重大度を予測する自動手法を提案する。
論文 参考訳(メタデータ) (2023-07-10T09:49:30Z) - Brain Imaging-to-Graph Generation using Adversarial Hierarchical Diffusion Models for MCI Causality Analysis [44.45598796591008]
機能的磁気共鳴画像(fMRI)を軽度認知障害解析のための効果的な接続性にマッピングするために,脳画像から画像へのBIGG(Brain Imaging-to-graph generation)フレームワークを提案する。
発電機の階層変換器は、複数のスケールでノイズを推定するように設計されている。
ADNIデータセットの評価は,提案モデルの有効性と有効性を示す。
論文 参考訳(メタデータ) (2023-05-18T06:54:56Z) - Boundary Guided Semantic Learning for Real-time COVID-19 Lung Infection
Segmentation System [69.40329819373954]
新型コロナウイルス(COVID-19)は、世界中の医療システムに悪影響を及ぼし続けている。
現段階では、新型コロナウイルスの診断と治療には、CT画像から肺感染症領域を自動的に分離することが不可欠である。
本稿では,境界案内型セマンティックラーニングネットワーク(BSNet)を提案する。
論文 参考訳(メタデータ) (2022-09-07T05:01:38Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - Statistical control for spatio-temporal MEG/EEG source imaging with
desparsified multi-task Lasso [102.84915019938413]
脳磁図(MEG)や脳電図(EEG)のような非侵襲的手法は、非侵襲的手法を約束する。
ソースローカライゼーション(ソースイメージング)の問題は、しかしながら、高次元の統計的推測問題を引き起こす。
この問題に対処するために,分離されたマルチタスクラッソ(ecd-MTLasso)のアンサンブルを提案する。
論文 参考訳(メタデータ) (2020-09-29T21:17:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。