論文の概要: Novel Pooling-based VGG-Lite for Pneumonia and Covid-19 Detection from Imbalanced Chest X-Ray Datasets
- arxiv url: http://arxiv.org/abs/2504.07468v1
- Date: Thu, 10 Apr 2025 05:38:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-11 12:24:51.766352
- Title: Novel Pooling-based VGG-Lite for Pneumonia and Covid-19 Detection from Imbalanced Chest X-Ray Datasets
- Title(参考訳): 不均衡胸部X線データからの肺炎とコビッド-19検出のための新しいプール型VGGライト
- Authors: Santanu Roy, Ashvath Suresh, Palak Sahu, Tulika Rudra Gupta,
- Abstract要約: 本稿では,Chest X-Ray(CXR)データセットにおけるクラス不均衡問題を軽減するために,新しいプール型VGG-Liteモデルを提案する。
提案するフレームワークを2つの別々のCXRデータセット上に実装した。
このフレームワークは、95%の精度、97.1%の精度、96.1%のリコール、96.6%のF1スコアを達成した。
- 参考スコア(独自算出の注目度): 1.6874375111244329
- License:
- Abstract: This paper proposes a novel pooling-based VGG-Lite model in order to mitigate class imbalance issues in Chest X-Ray (CXR) datasets. Automatic Pneumonia detection from CXR images by deep learning model has emerged as a prominent and dynamic area of research, since the inception of the new Covid-19 variant in 2020. However, the standard Convolutional Neural Network (CNN) models encounter challenges associated with class imbalance, a prevalent issue found in many medical datasets. The innovations introduced in the proposed model architecture include: (I) A very lightweight CNN model, `VGG-Lite', is proposed as a base model, inspired by VGG-16 and MobileNet-V2 architecture. (II) On top of this base model, we leverage an ``Edge Enhanced Module (EEM)" through a parallel branch, consisting of a ``negative image layer", and a novel custom pooling layer ``2Max-Min Pooling". This 2Max-Min Pooling layer is entirely novel in this investigation, providing more attention to edge components within pneumonia CXR images. Thus, it works as an efficient spatial attention module (SAM). We have implemented the proposed framework on two separate CXR datasets. The first dataset is obtained from a readily available source on the internet, and the second dataset is a more challenging CXR dataset, assembled by our research team from three different sources. Experimental results reveal that our proposed framework has outperformed pre-trained CNN models, and three recent trend existing models ``Vision Transformer", ``Pooling-based Vision Transformer (PiT)'' and ``PneuNet", by substantial margins on both datasets. The proposed framework VGG-Lite with EEM, has achieved a macro average of 95% accuracy, 97.1% precision, 96.1% recall, and 96.6% F1 score on the ``Pneumonia Imbalance CXR dataset", without employing any pre-processing technique.
- Abstract(参考訳): 本稿では,Chest X-Ray(CXR)データセットにおけるクラス不均衡問題を軽減するために,新しいプール型VGG-Liteモデルを提案する。
深層学習モデルによるCXR画像の自動肺炎検出は、2020年に新しいCovid-19が誕生して以来、顕著かつダイナミックな研究領域として現れてきた。
しかし、標準の畳み込みニューラルネットワーク(CNN)モデルは、多くの医学データセットでよく見られる問題であるクラス不均衡に関連する問題に遭遇する。
I)非常に軽量なCNNモデル `VGG-Lite' は、VGG-16とMobileNet-V2アーキテクチャにインスパイアされたベースモデルとして提案されている。
(II)
このベースモデルの上に、'`Edge Enhanced Module (EEM)'という並列ブランチと、'`2Max-Min Pooling'という新しいカスタムプーリング層を使って、"`2Max-Min Pooling"というパラレルブランチを活用しています。この2Max-Min Poolingレイヤは、肺炎CXRイメージ内のエッジコンポーネントに注意を向け、この調査においてまったく新しいものです。それゆえ、効率的な空間的注意モジュール(SAM)として機能します。提案されたフレームワークは、2つの異なるCXRデータセットに対して実装されました。第1のデータセットは、インターネット上で利用可能なソースから取得され、第2のデータセットは、我々の研究チームが収集したより難しいCXRデータセットです。実験の結果、提案されたフレームワークは、3つの異なるソースから、より優れたCNNモデル、最新のトレンドである ``Vision Pretrained CNNモデル、そして最新の3つのモデルである ‘`Vision Transformer-Transformer' Transformer'(PiP.P.P.
関連論文リスト
- Edge Attention Module for Object Classification [1.8434042562191815]
本研究では,物体分類タスクにおいて,新しいエッジアテンションに基づく畳み込みニューラルネットワーク(CNN)'を提案する。
我々は、Max-Minプーリング層と畳み込み層からなるEdge Attention Module (EAM)'を初めて紹介する。
我々は、Caltech-101、Caltech-256、CIFAR-100、Tiny ImageNet-200データセットの標準トレーニング済みCNNモデルにEAMまたは2EAMを実装した。
論文 参考訳(メタデータ) (2025-02-05T11:59:47Z) - Lightweight Weighted Average Ensemble Model for Pneumonia Detection in Chest X-Ray Images [0.0]
肺炎は小児の病気や死亡の主な原因であり、早期かつ正確な検出の必要性を暗示している。
胸部X線画像を用いた小児の肺炎検出のための軽量アンサンブルモデルを提案する。
論文 参考訳(メタデータ) (2025-01-27T17:51:29Z) - Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - LiteNeXt: A Novel Lightweight ConvMixer-based Model with Self-embedding Representation Parallel for Medical Image Segmentation [2.0901574458380403]
医用画像分割のための軽量だが効率的な新しいモデル LiteNeXt を提案する。
このモデルは、少量のパラメータ (0.71M) とギガ浮動小数点演算 (0.42) でスクラッチから訓練されている。
Data Science Bowls、GlaS、ISIC2018、PH2、Sunnybrook、Lung X-rayといった公開データセットの実験は有望な結果を示している。
論文 参考訳(メタデータ) (2024-04-04T01:59:19Z) - Towards Robust and Efficient Cloud-Edge Elastic Model Adaptation via Selective Entropy Distillation [56.79064699832383]
Cloud-Edge Elastic Model Adaptation (CEMA)パラダイムを確立し、エッジモデルが前方伝播のみを実行するようにします。
CEMAでは,通信負担を軽減するため,不要なサンプルをクラウドにアップロードすることを避けるための2つの基準を考案した。
論文 参考訳(メタデータ) (2024-02-27T08:47:19Z) - A novel method to enhance pneumonia detection via a model-level
ensembling of CNN and vision transformer [0.7499722271664147]
肺炎は世界中で致死率と死亡率の主要な原因である。
深層学習は胸部X線(CXR)画像から肺炎を検出する大きな可能性を示している。
我々は,モデルレベルのアンサンブルにより,畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマーネットワークを融合させる新しいモデルを開発した。
論文 参考訳(メタデータ) (2024-01-04T16:58:31Z) - The Languini Kitchen: Enabling Language Modelling Research at Different
Scales of Compute [66.84421705029624]
本稿では,アクセル時間で測定された等価計算に基づくモデル比較を可能にする実験的プロトコルを提案する。
私たちは、既存の学術的ベンチマークを上回り、品質、多様性、文書の長さで上回る、大規模で多様で高品質な書籍データセットを前処理します。
この研究は、GPT-2アーキテクチャから派生したフィードフォワードモデルと、10倍のスループットを持つ新しいLSTMの形式でのリカレントモデルという2つのベースラインモデルも提供する。
論文 参考訳(メタデータ) (2023-09-20T10:31:17Z) - Challenging the Myth of Graph Collaborative Filtering: a Reasoned and Reproducibility-driven Analysis [50.972595036856035]
本稿では,6つの人気グラフと最近のグラフ推薦モデルの結果を再現するコードを提案する。
これらのグラフモデルと従来の協調フィルタリングモデルを比較する。
ユーザの近所からの情報フローを調べることにより,データセット構造における内在的特徴にどのようなモデルが影響するかを同定することを目的とする。
論文 参考訳(メタデータ) (2023-08-01T09:31:44Z) - Accurate deep learning sub-grid scale models for large eddy simulations [0.0]
大型渦流シミュレーション(LES)のために開発されたサブグリッドスケール(SGS)乱流モデルについて述べる。
彼らの開発には、物理インフォームド・ロバストで効率的なDeep Learning (DL)アルゴリズムの定式化が必要だった。
2つの摩擦レイノルズ数における正準流路流れの直接シミュレーションによるデータの明示的なフィルタリングは、訓練と試験のための正確なデータを提供した。
論文 参考訳(メタデータ) (2023-07-19T15:30:06Z) - Boosting Low-Data Instance Segmentation by Unsupervised Pre-training
with Saliency Prompt [103.58323875748427]
この研究は、低データ体制のための新しい教師なし事前学習ソリューションを提供する。
近年のPrompting技術の成功に触発されて,QEISモデルを強化した新しい事前学習手法を導入する。
実験結果から,本手法は3つのデータセット上でのいくつかのQEISモデルを大幅に向上させることが示された。
論文 参考訳(メタデータ) (2023-02-02T15:49:03Z) - ANNETTE: Accurate Neural Network Execution Time Estimation with Stacked
Models [56.21470608621633]
本稿では,アーキテクチャ検索を対象ハードウェアから切り離すための時間推定フレームワークを提案する。
提案手法は,マイクロカーネルと多層ベンチマークからモデルの集合を抽出し,マッピングとネットワーク実行時間推定のためのスタックモデルを生成する。
生成した混合モデルの推定精度と忠実度, 統計モデルとルーフラインモデル, 評価のための洗練されたルーフラインモデルを比較した。
論文 参考訳(メタデータ) (2021-05-07T11:39:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。