論文の概要: A Novel Multi-branch ConvNeXt Architecture for Identifying Subtle Pathological Features in CT Scans
- arxiv url: http://arxiv.org/abs/2510.09107v1
- Date: Fri, 10 Oct 2025 08:00:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 00:38:48.399367
- Title: A Novel Multi-branch ConvNeXt Architecture for Identifying Subtle Pathological Features in CT Scans
- Title(参考訳): CTスキャンにおける新しいマルチブランチ ConvNeXt アーキテクチャ
- Authors: Irash Perera, Uthayasanker Thayasivam,
- Abstract要約: 本稿では,医療画像解析の難題に特化して設計されたマルチブランチConvNeXtアーキテクチャを提案する。
提案モデルでは,厳密なデータ前処理から拡張まで,厳格なエンドツーエンドパイプラインを組み込んでいる。
実験結果から、最終的なROC-AUCは0.9937、バリデーション精度は0.9757、F1スコアは0.9825である。
- 参考スコア(独自算出の注目度): 1.2461503242570642
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Intelligent analysis of medical imaging plays a crucial role in assisting clinical diagnosis, especially for identifying subtle pathological features. This paper introduces a novel multi-branch ConvNeXt architecture designed specifically for the nuanced challenges of medical image analysis. While applied here to the specific problem of COVID-19 diagnosis, the methodology offers a generalizable framework for classifying a wide range of pathologies from CT scans. The proposed model incorporates a rigorous end-to-end pipeline, from meticulous data preprocessing and augmentation to a disciplined two-phase training strategy that leverages transfer learning effectively. The architecture uniquely integrates features extracted from three parallel branches: Global Average Pooling, Global Max Pooling, and a new Attention-weighted Pooling mechanism. The model was trained and validated on a combined dataset of 2,609 CT slices derived from two distinct datasets. Experimental results demonstrate a superior performance on the validation set, achieving a final ROC-AUC of 0.9937, a validation accuracy of 0.9757, and an F1-score of 0.9825 for COVID-19 cases, outperforming all previously reported models on this dataset. These findings indicate that a modern, multi-branch architecture, coupled with careful data handling, can achieve performance comparable to or exceeding contemporary state-of-the-art models, thereby proving the efficacy of advanced deep learning techniques for robust medical diagnostics.
- Abstract(参考訳): 医用画像のインテリジェント解析は臨床診断,特に微妙な病理像の同定に重要な役割を担っている。
本稿では,医療画像解析の難題に特化して設計されたマルチブランチConvNeXtアーキテクチャを提案する。
ここでは、新型コロナウイルスの診断の特定の問題に適用されているが、この方法論は、CTスキャンから幅広い病理を分類するための一般化可能なフレームワークを提供する。
提案モデルは、厳密なデータ前処理や拡張から、転送学習を効果的に活用する規律付き2段階トレーニング戦略まで、厳密なエンドツーエンドパイプラインを組み込んでいる。
このアーキテクチャは,Global Average Pooling,Global Max Pooling,および新しいAttention-weighted Poolingメカニズムという,3つの並列ブランチから抽出された機能を独自に統合している。
このモデルは、2つの異なるデータセットから得られた2,609個のCTスライスを組み合わせたデータセットでトレーニングされ、検証された。
実験結果は、最終的なROC-AUCが0.9937、バリデーション精度が0.9757、F1スコアが0.9825であり、これまでに報告されたすべてのモデルよりも優れた性能を示した。
これらの結果から,最新のマルチブランチアーキテクチャと慎重なデータハンドリングが相まって,現代の最先端モデルに匹敵する性能を達成できることが示唆された。
関連論文リスト
- Automated Multi-label Classification of Eleven Retinal Diseases: A Benchmark of Modern Architectures and a Meta-Ensemble on a Large Synthetic Dataset [1.996975578218265]
我々は、11の網膜疾患を分類するエンドツーエンドのディープラーニングパイプラインを開発した。
合成データのみに訓練されたモデルは,複数の病態を正確に分類し,実際の臨床画像に効果的に一般化できることを示す。
論文 参考訳(メタデータ) (2025-08-21T22:09:53Z) - A Cascaded Dilated Convolution Approach for Mpox Lesion Classification [0.0]
Mpoxウイルスは、他の皮膚疾患と視覚的に類似しているため、重要な診断上の課題を呈する。
深層学習に基づく皮膚病変分類のアプローチは、有望な代替手段を提供する。
本稿では,これらの課題に対処するためのCascaded Atrous Group Attentionフレームワークを紹介する。
論文 参考訳(メタデータ) (2024-12-13T12:47:30Z) - Large-scale Long-tailed Disease Diagnosis on Radiology Images [51.453990034460304]
RadDiagは、様々なモダリティと解剖学にわたる2Dおよび3D入力をサポートする基礎モデルである。
私たちのデータセットであるRP3D-DiagDSは、5,568の障害をカバーする195,010のスキャンで40,936の症例を含む。
論文 参考訳(メタデータ) (2023-12-26T18:20:48Z) - The Utility of the Virtual Imaging Trials Methodology for Objective Characterization of AI Systems and Training Data [1.6040478776985583]
臨床および仮想CTとCXRを用いた畳み込みニューラルネットワークを用いた新型コロナウイルスの診断例について検討した。
複数のAIモデルは、多様なデータセットにわたる3D ResNet-likeと2D EfficientNetv2アーキテクチャを使用して開発、テストされた。
VITアプローチは、モデルの透明性と信頼性を高めるために使用することができ、AIのパフォーマンスを駆動する要因に関する微妙な洞察を提供し、実験的および臨床的設定のギャップを埋める。
論文 参考訳(メタデータ) (2023-08-17T19:12:32Z) - A multi-stage machine learning model on diagnosis of esophageal
manometry [50.591267188664666]
このフレームワークには、飲み込みレベルにおけるディープラーニングモデルと、学習レベルにおける機能ベースの機械学習モデルが含まれている。
これは、生のマルチスワローデータからHRM研究のCC診断を自動的に予測する最初の人工知能モデルである。
論文 参考訳(メタデータ) (2021-06-25T20:09:23Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - Fader Networks for domain adaptation on fMRI: ABIDE-II study [68.5481471934606]
我々は3次元畳み込みオートエンコーダを用いて、無関係な空間画像表現を実現するとともに、ABIDEデータ上で既存のアプローチより優れていることを示す。
論文 参考訳(メタデータ) (2020-10-14T16:50:50Z) - Predicting Clinical Diagnosis from Patients Electronic Health Records
Using BERT-based Neural Networks [62.9447303059342]
医療コミュニティにおけるこの問題の重要性を示す。
本稿では,変換器 (BERT) モデルによる2方向表現の分類順序の変更について述べる。
約400万人のユニークな患者訪問からなる、大規模なロシアのEHRデータセットを使用します。
論文 参考訳(メタデータ) (2020-07-15T09:22:55Z) - Exploration of Interpretability Techniques for Deep COVID-19
Classification using Chest X-ray Images [10.01138352319106]
5種類のディープラーニングモデル(ResNet18、ResNet34、InceptionV3、InceptionResNetV2、DenseNet161)とそれらのEnsembleは、Chest X-Ray画像を用いて、新型コロナウイルス、肺炎、健康な被験者を分類するために使用されている。
新型コロナウイルスの分類における平均的なMicro-F1スコアは0.66から0.875の範囲で、ネットワークモデルのアンサンブルは0.89である。
論文 参考訳(メタデータ) (2020-06-03T22:55:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。