論文の概要: LungX: A Hybrid EfficientNet-Vision Transformer Architecture with Multi-Scale Attention for Accurate Pneumonia Detection
- arxiv url: http://arxiv.org/abs/2511.18425v1
- Date: Sun, 23 Nov 2025 12:44:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-25 18:34:24.837196
- Title: LungX: A Hybrid EfficientNet-Vision Transformer Architecture with Multi-Scale Attention for Accurate Pneumonia Detection
- Title(参考訳): LungX: 高精度肺炎検出のためのマルチスケール注意型ハイブリッド高能率Net-Vision Transformerアーキテクチャ
- Authors: Mansur Yerzhanuly,
- Abstract要約: 肺炎は、タイムリーな診断が重要な世界的な死亡原因である。
我々は,EfficientNetのマルチスケール機能,CBAMアテンション機構,Vision Transformerのグローバルコンテキストモデリングを組み合わせた,新しいハイブリッドアーキテクチャであるLungXを紹介する。
LungXは最先端のパフォーマンス(86.5%の精度、0.943のAUC)を達成し、効率の良いNet-B0ベースラインよりも6.7%のAUCを改善した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Pneumonia remains a leading global cause of mortality where timely diagnosis is critical. We introduce LungX, a novel hybrid architecture combining EfficientNet's multi-scale features, CBAM attention mechanisms, and Vision Transformer's global context modeling for enhanced pneumonia detection. Evaluated on 20,000 curated chest X-rays from RSNA and CheXpert, LungX achieves state-of-the-art performance (86.5 percent accuracy, 0.943 AUC), representing a 6.7 percent AUC improvement over EfficientNet-B0 baselines. Visual analysis demonstrates superior lesion localization through interpretable attention maps. Future directions include multi-center validation and architectural optimizations targeting 88 percent accuracy for clinical deployment as an AI diagnostic aid.
- Abstract(参考訳): 肺炎は、タイムリーな診断が重要な世界的な死亡原因である。
我々は,EfficientNetのマルチスケール機能,CBAMアテンション機構,Vision Transformerのグローバルコンテキストモデリングを組み合わせた新しいハイブリッドアーキテクチャであるLungXを紹介した。
RSNAとCheXpertの2万個の胸部X線で評価され、LungXは最先端のパフォーマンス(86.5%の精度、0.943のAUC)を達成し、効率の良いNet-B0ベースラインよりも6.7%改善した。
視覚解析は、解釈可能なアテンションマップを通して、より優れた病変の局在を示す。
将来的には、AI診断支援として、多施設のバリデーションと、臨床展開の88%の精度を目標としたアーキテクチャ最適化が予定されている。
関連論文リスト
- Cancer-Net PCa-MultiSeg: Multimodal Enhancement of Prostate Cancer Lesion Segmentation Using Synthetic Correlated Diffusion Imaging [55.62977326180104]
前立腺癌病変の分節化に対する近年の深層学習アプローチは,限られた性能を達成している。
本稿では,標準拡散型プロトコルの拡張として,合成相関拡散イメージング(CDI$s$)について検討する。
以上の結果から,PCa病変セグメント化タスクの実践的ドロップイン強化として,CDI$s$に対する検証済み統合経路が確立された。
論文 参考訳(メタデータ) (2025-11-11T04:16:12Z) - Weakly Supervised Pneumonia Localization from Chest X-Rays Using Deep Neural Network and Grad-CAM Explanations [0.0]
本研究は,胸部X線からの肺炎の分類と局在化のための弱教師付き深層学習フレームワークを提案する。
コストのかかるピクセルレベルのアノテーションの代わりに,画像レベルのラベルを用いて臨床的に意味のあるヒートマップを生成する。
論文 参考訳(メタデータ) (2025-11-01T08:44:24Z) - An Explainable Hybrid AI Framework for Enhanced Tuberculosis and Symptom Detection [55.35661671061754]
結核は、特に資源に制限された遠隔地において、重要な世界的な健康問題である。
本稿では, 胸部X線による疾患および症状の検出を, 2つの頭部と自己監督頭部を統合することで促進する枠組みを提案する。
本モデルでは, 新型コロナウイルス, 結核, 正常症例の鑑別で98.85%の精度が得られ, マルチラベル症状検出では90.09%のマクロF1スコアが得られた。
論文 参考訳(メタデータ) (2025-10-21T17:18:55Z) - REN: Anatomically-Informed Mixture-of-Experts for Interstitial Lung Disease Diagnosis [32.83724094606554]
医用画像分類に特化した最初の解剖学的インフォームドMOEフレームワークであるRegional Expert Networks (REN)を紹介した。
RENは解剖学の先行技術を利用して7人の専門専門家を訓練し、それぞれ異なる肺葉と両側の肺の組み合わせに特化している。
厳密な患者レベルのクロスバリデーションを通じて、RENは強力な一般化性と臨床解釈可能性を示す。
論文 参考訳(メタデータ) (2025-10-06T15:35:08Z) - A Disease-Centric Vision-Language Foundation Model for Precision Oncology in Kidney Cancer [54.58205672910646]
RenalCLIPは、腎腫瘤の特徴、診断、予後のための視覚言語基盤モデルである。
腎がんの完全な臨床ワークフローにまたがる10のコアタスクにおいて、優れたパフォーマンスと優れた一般化性を実現した。
論文 参考訳(メタデータ) (2025-08-22T17:48:19Z) - XAI-Guided Analysis of Residual Networks for Interpretable Pneumonia Detection in Paediatric Chest X-rays [0.0]
胸部X線で小児肺炎を自動的に診断するためのResidual Networks(ResNets)の解釈可能なディープラーニングモデルを提案する。
我々のResNet-50モデルは、大きな小児の胸部X線データセットに基づいて訓練され、高い分類精度(95.94%)、AUC-ROC(98.91%)、Cohen's Kappa(0.913)を実現し、臨床的に意味のある視覚的説明を伴う。
論文 参考訳(メタデータ) (2025-07-18T21:19:26Z) - Comparative Analysis of Vision Transformers and Traditional Deep Learning Approaches for Automated Pneumonia Detection in Chest X-Rays [1.2310316230437004]
肺炎は、特に新型コロナウイルスなどの疾患によって引き起こされた場合、迅速かつ正確な診断を必要とする世界的な健康上の重要な課題である。
本研究は,胸部X線を用いた自動肺炎検出のための従来の機械学習と最先端の深層学習の総合的な比較を行った。
我々はビジョントランスフォーマー、特にクロスビットアーキテクチャが88.25%の精度と99.42%のリコールで優れた性能を発揮することを示した。
論文 参考訳(メタデータ) (2025-07-11T16:26:24Z) - RadFabric: Agentic AI System with Reasoning Capability for Radiology [61.25593938175618]
RadFabricは、総合的なCXR解釈のための視覚的およびテキスト分析を統合するマルチエージェント、マルチモーダル推論フレームワークである。
システムは、病理診断に特殊なCXRエージェント、正確な解剖学的構造に視覚所見をマッピングする解剖学的解釈エージェント、および視覚的、解剖学的、臨床データを透明かつ証拠に基づく診断に合成する大規模なマルチモーダル推論モデルを利用した推論エージェントを使用する。
論文 参考訳(メタデータ) (2025-06-17T03:10:33Z) - Lung Disease Detection with Vision Transformers: A Comparative Study of Machine Learning Methods [0.0]
本研究では,機械学習における最先端アーキテクチャであるビジョントランスフォーマー(ViT)の胸部X線解析への応用について検討する。
胸部X線像と肺分画領域に焦点を当てた2つのViT法の比較検討を行った。
論文 参考訳(メタデータ) (2024-11-18T08:40:25Z) - Deep learning in computed tomography pulmonary angiography imaging: a
dual-pronged approach for pulmonary embolism detection [0.0]
本研究の目的は,深層学習技術を活用し,肺塞栓症(PE)のコンピュータ支援診断(CAD)を強化することである。
我々の分類システムは、注意機構を用いて局所的な文脈を利用する注意誘導畳み込みニューラルネットワーク(AG-CNN)を含む。
AG-CNNはFUMPEデータセット上で堅牢なパフォーマンスを実現し、AUROCは0.927、感度は0.862、特異性は0.879、F1スコアは0.805、Inception-v3バックボーンアーキテクチャは0.805である。
論文 参考訳(メタデータ) (2023-11-09T08:23:44Z) - Differentiable Topology-Preserved Distance Transform for Pulmonary
Airway Segmentation [34.22415353209505]
気道セグメンテーションの性能を向上させるために, 位相保存距離変換(DTPDT)フレームワークを提案する。
The Topology-Preserved Surrogate (TPS) learning strategy was first proposed to balance the training progress within-class distribution。
The Convolutional Distance Transform (CDT) is designed to identify the breakage phenomenon with superior sensitivity and minimize the variation of the distance map between the prediction and ground-truth。
論文 参考訳(メタデータ) (2022-09-17T15:47:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。