論文の概要: RepViT-CXR: A Channel Replication Strategy for Vision Transformers in Chest X-ray Tuberculosis and Pneumonia Classification
- arxiv url: http://arxiv.org/abs/2509.08234v1
- Date: Wed, 10 Sep 2025 02:28:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-11 17:24:19.827883
- Title: RepViT-CXR: A Channel Replication Strategy for Vision Transformers in Chest X-ray Tuberculosis and Pneumonia Classification
- Title(参考訳): RepViT-CXR:胸部X線結核におけるビジョントランスフォーマーのチャネル複製戦略と肺炎の分類
- Authors: Faisal Ahmed,
- Abstract要約: RepViT-CXRは、追加情報を失うことなく、シングルチャネルのCXR画像をViT互換のフォーマットに適合させる。
3つのベンチマークデータセットからRepViT-CXRを評価する。
- 参考スコア(独自算出の注目度): 0.8374077003751697
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Chest X-ray (CXR) imaging remains one of the most widely used diagnostic tools for detecting pulmonary diseases such as tuberculosis (TB) and pneumonia. Recent advances in deep learning, particularly Vision Transformers (ViTs), have shown strong potential for automated medical image analysis. However, most ViT architectures are pretrained on natural images and require three-channel inputs, while CXR scans are inherently grayscale. To address this gap, we propose RepViT-CXR, a channel replication strategy that adapts single-channel CXR images into a ViT-compatible format without introducing additional information loss. We evaluate RepViT-CXR on three benchmark datasets. On the TB-CXR dataset,our method achieved an accuracy of 99.9% and an AUC of 99.9%, surpassing prior state-of-the-art methods such as Topo-CXR (99.3% accuracy, 99.8% AUC). For the Pediatric Pneumonia dataset, RepViT-CXR obtained 99.0% accuracy, with 99.2% recall, 99.3% precision, and an AUC of 99.0%, outperforming strong baselines including DCNN and VGG16. On the Shenzhen TB dataset, our approach achieved 91.1% accuracy and an AUC of 91.2%, marking a performance improvement over previously reported CNN-based methods. These results demonstrate that a simple yet effective channel replication strategy allows ViTs to fully leverage their representational power on grayscale medical imaging tasks. RepViT-CXR establishes a new state of the art for TB and pneumonia detection from chest X-rays, showing strong potential for deployment in real-world clinical screening systems.
- Abstract(参考訳): 胸部X線画像(CXR)は、結核(TB)や肺炎などの肺疾患を検出する最も広く用いられている診断ツールの1つである。
近年のディープラーニング、特にビジョントランスフォーマー(ViT)の進歩は、自動化された医用画像解析の強力な可能性を示している。
しかし、ほとんどのViTアーキテクチャは自然画像で事前訓練されており、3チャンネルの入力を必要とするが、CXRスキャンは本質的にグレースケールである。
このギャップに対処するために,単一チャネルCXR画像を付加的な情報損失を伴わずにViT互換のフォーマットに適応するチャネルレプリケーション戦略であるRepViT-CXRを提案する。
3つのベンチマークデータセットからRepViT-CXRを評価する。
TB-CXRデータセットの精度は99.9%、AUCは99.9%に達し、Topo-CXR(99.3%の精度、99.8%のAUC)のような最先端の手法を上回った。
小児肺炎データセットでは、RepViT-CXRは99.0%の精度、99.2%のリコール、99.3%の精度、AUCは99.0%となり、DCNNやVGG16などの強力なベースラインを上回った。
深センTBデータセットでは、我々のアプローチは91.1%の精度と91.2%のAUCを達成した。
これらの結果から, ViTsは, グレースケールな医用画像タスクにおいて, 表現力を完全に活用できる簡易かつ効果的なチャネル複製戦略を実証した。
RepViT-CXRは、胸部X線からのTBと肺炎検出のための新しい最先端技術を確立し、実際の臨床スクリーニングシステムへの展開の可能性を示す。
関連論文リスト
- A Novel Attention-Augmented Wavelet YOLO System for Real-time Brain Vessel Segmentation on Transcranial Color-coded Doppler [49.03919553747297]
我々は,脳動脈を効率よく捉えることができるAIを利用したリアルタイムCoW自動分割システムを提案する。
Transcranial Color-coded Doppler (TCCD) を用いたAIによる脳血管セグメンテーションの事前研究は行われていない。
提案したAAW-YOLOは, 異方性および対側性CoW容器のセグメンテーションにおいて高い性能を示した。
論文 参考訳(メタデータ) (2025-08-19T14:41:22Z) - Lung Disease Detection with Vision Transformers: A Comparative Study of Machine Learning Methods [0.0]
本研究では,機械学習における最先端アーキテクチャであるビジョントランスフォーマー(ViT)の胸部X線解析への応用について検討する。
胸部X線像と肺分画領域に焦点を当てた2つのViT法の比較検討を行った。
論文 参考訳(メタデータ) (2024-11-18T08:40:25Z) - Revisiting Computer-Aided Tuberculosis Diagnosis [56.80999479735375]
結核(TB)は世界的な健康上の脅威であり、毎年何百万人もの死者を出している。
深層学習を用いたコンピュータ支援結核診断 (CTD) は有望であるが, 限られたトレーニングデータによって進行が妨げられている。
結核X線(TBX11K)データセットは11,200個の胸部X線(CXR)画像とそれに対応するTB領域のバウンディングボックスアノテーションを含む。
このデータセットは、高品質なCTDのための洗練された検出器のトレーニングを可能にする。
論文 参考訳(メタデータ) (2023-07-06T08:27:48Z) - Attention-based Saliency Maps Improve Interpretability of Pneumothorax
Classification [52.77024349608834]
視覚変換器(ViT)の胸部X線撮影(CXR)分類性能と注意ベース唾液の解釈可能性について検討する。
ViTは、CheXpert、Chest X-Ray 14、MIMIC CXR、VinBigDataの4つの公開データセットを用いて、肺疾患分類のために微調整された。
ViTsは最先端のCNNと比べてCXR分類AUCに匹敵するものであった。
論文 参考訳(メタデータ) (2023-03-03T12:05:41Z) - Optimising Chest X-Rays for Image Analysis by Identifying and Removing
Confounding Factors [49.005337470305584]
新型コロナウイルス(COVID-19)のパンデミック(パンデミック)の間、新型コロナウイルス(COVID-19)の診断のための緊急設定で実施される画像の量は、臨床用CXRの取得が広範囲に及んだ。
公開データセット内の臨床的に取得されたCXRの変動品質は、アルゴリズムのパフォーマンスに大きな影響を及ぼす可能性がある。
我々は、新型コロナウイルスの胸部X線データセットを前処理し、望ましくないバイアスを取り除くための、シンプルで効果的なステップワイズアプローチを提案する。
論文 参考訳(メタデータ) (2022-08-22T13:57:04Z) - A Novel Implementation of Machine Learning for the Efficient,
Explainable Diagnosis of COVID-19 from Chest CT [0.0]
本研究の目的は、胸部CTスキャンから新型コロナウイルスを機械学習で検出することである。
提案したモデルは0.927の総合精度と0.958の感度を得た。
論文 参考訳(メタデータ) (2022-06-15T18:35:22Z) - Chest X-ray Image Phase Features for Improved Diagnosis of COVID-19
Using Convolutional Neural Network [2.752817022620644]
最近の研究で、新型コロナウイルス患者のX線写真には、新型コロナウイルスに関する情報が含まれていることが示されている。
胸部X線(CXR)は、高速な撮像時間、広範囲の可用性、低コスト、可搬性から注目されている。
本研究では、CXR画像から新型コロナウイルスの分類を改善するために、新しい多機能畳み込みニューラルネットワーク(CNN)アーキテクチャを設計する。
論文 参考訳(メタデータ) (2020-11-06T20:26:26Z) - Improving performance of CNN to predict likelihood of COVID-19 using
chest X-ray images with preprocessing algorithms [0.3180570080674292]
本研究は,胸部X線画像のコンピュータ支援診断手法の開発の可能性を示した。
8,474個の胸部X線画像のデータセットを使用して、CNNベースのCADスキームをトレーニングし、テストする。
検査結果は、3つのクラスを分類する際の総合的精度の94.0%、コビッドウイルスの感染者を検出する際の精度の98.6%を達成している。
論文 参考訳(メタデータ) (2020-06-11T16:45:46Z) - CovidCTNet: An Open-Source Deep Learning Approach to Identify Covid-19
Using CT Image [2.9198506350988933]
コロナウイルス病2019(Covid-19)は、治療の選択肢が限られているため、非常に伝染性が高い。
Covid-19の早期かつ正確な診断は、病気の拡散とそれに伴う死亡を減少させるのに不可欠である。
そこで我々は,CT画像検出の精度を高めるために,CovidCTNetというオープンソースのアルゴリズムセットを開発した。
論文 参考訳(メタデータ) (2020-05-06T18:16:59Z) - JCS: An Explainable COVID-19 Diagnosis System by Joint Classification
and Segmentation [95.57532063232198]
新型コロナウイルス感染症2019(COVID-19)は、200カ国以上でパンデミックの流行を引き起こしている。
感染を制御するためには、感染した人々を識別し、分離することが最も重要なステップである。
本稿では,新型コロナウイルスの胸部CT診断をリアルタイムかつ説明可能な,新しい関節分類システム(JCS)を開発した。
論文 参考訳(メタデータ) (2020-04-15T12:30:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。