論文の概要: A Multi-Stage Hybrid CNN-Transformer Network for Automated Pediatric Lung Sound Classification
- arxiv url: http://arxiv.org/abs/2507.20408v1
- Date: Sun, 27 Jul 2025 20:36:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-29 16:23:57.573816
- Title: A Multi-Stage Hybrid CNN-Transformer Network for Automated Pediatric Lung Sound Classification
- Title(参考訳): 小児肺音自動分類のための多段階ハイブリッドCNN変換器ネットワーク
- Authors: Samiul Based Shuvo, Taufiq Hasan,
- Abstract要約: 頭蓋骨画像を用いた小児呼吸器疾患の分類のためのハイブリッドCNN-Transformerフレームワークを提案する。
本モデルでは,2進イベント分類では0.9039,多進イベント分類では0.8448であった。
- 参考スコア(独自算出の注目度): 2.034969618183334
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Automated analysis of lung sound auscultation is essential for monitoring respiratory health, especially in regions facing a shortage of skilled healthcare workers. While respiratory sound classification has been widely studied in adults, its ap plication in pediatric populations, particularly in children aged <6 years, remains an underexplored area. The developmental changes in pediatric lungs considerably alter the acoustic proper ties of respiratory sounds, necessitating specialized classification approaches tailored to this age group. To address this, we propose a multistage hybrid CNN-Transformer framework that combines CNN-extracted features with an attention-based architecture to classify pediatric respiratory diseases using scalogram images from both full recordings and individual breath events. Our model achieved an overall score of 0.9039 in binary event classifi cation and 0.8448 in multiclass event classification by employing class-wise focal loss to address data imbalance. At the recording level, the model attained scores of 0.720 for ternary and 0.571 for multiclass classification. These scores outperform the previous best models by 3.81% and 5.94%, respectively. This approach offers a promising solution for scalable pediatric respiratory disease diagnosis, especially in resource-limited settings.
- Abstract(参考訳): 特に熟練医療従事者の不足に直面する地域では,呼吸の健康状態を監視するために,肺音聴診の自動解析が不可欠である。
成人では呼吸音の分類が広く研究されているが、小児、特に6歳未満の小児では、その重要性は未発見の領域である。
小児肺の発達的変化は呼吸音の音響的適切な結びつきを大きく変え、この年齢層に合わせた専門的な分類アプローチを必要とする。
そこで本研究では,CNN抽出特徴と注意に基づくアーキテクチャを組み合わせた多段階ハイブリッドCNN-Transformerフレームワークを提案する。
データ不均衡に対処するために、クラスワイド・フォーカス・ロスを用いて、連立イベント・クラスイフィ・カチオンで0.9039、マルチクラスイベント分類で0.8448のスコアを得た。
記録レベルでは、3次分類では0.720、マルチクラス分類では0.571となった。
これらのスコアは、それぞれ3.81%と5.94%で前のベストモデルを上回った。
このアプローチは、特にリソース制限の設定において、スケーラブルな小児呼吸器疾患の診断に有望なソリューションを提供する。
関連論文リスト
- Pediatric Asthma Detection with Googles HeAR Model: An AI-Driven Respiratory Sound Classifier [0.8463972278020965]
この研究は、小児の呼吸音から喘息の早期徴候を検出するために、AIを利用した診断パイプラインを提供する。
SPRSoundデータセットは、ホイーズ、クラックル、ロンチ、ストリドール、ノーマルとラベル付けされた2秒のオーディオセグメントを抽出するために使用される。
このシステムは91%以上の精度を達成し、正の場合の精度・リコールの指標に対して高い性能を発揮する。
論文 参考訳(メタデータ) (2025-04-28T12:52:17Z) - Respiratory Inhaler Sound Event Classification Using Self-Supervised Learning [43.83039192442981]
喘息は世界中の何百万人もの人に影響を及ぼす慢性呼吸器疾患である。
我々は,このモデルを吸入音の事前学習と微調整により,吸入音分類のためのwav2vec 2.0自己教師学習モデルを適用した。
提案モデルでは、ドライパウダー吸入器とスマートウォッチデバイスを用いて収集したデータセットに対して、バランスの取れた精度が98%であることを示す。
論文 参考訳(メタデータ) (2025-04-15T14:44:47Z) - Machine learning-based algorithms for at-home respiratory disease monitoring and respiratory assessment [45.104212062055424]
本研究の目的は、在宅呼吸器疾患のモニタリングと評価を容易にする機械学習ベースのアルゴリズムを開発することである。
健常成人30名を対象に, 呼吸圧, 血流, 胸腹部周囲の動的計測を行った。
ランダムフォレスト分類器、ロジスティック回帰、サポートベクターマシン(SVM)など、さまざまな機械学習モデルをトレーニングし、呼吸タイプを予測する。
論文 参考訳(メタデータ) (2024-09-05T02:14:31Z) - Contrasting Deep Learning Models for Direct Respiratory Insufficiency Detection Versus Blood Oxygen Saturation Estimation [1.4149417323913716]
RI検出のための事前学習型音声ニューラルネットワーク(CNN6,CNN10,CNN14)とMasked Autoencoder(Audio-MAE)について検討した。
SpO2レベルを推定する回帰タスクでは、指のオキシメータの3.5%以上の根平均2乗誤差値が得られる。
我々はSpO2-regressionを92%の閾値でSpO2-Thresholdバイナリ分類問題に変換する。
論文 参考訳(メタデータ) (2024-07-30T17:26:16Z) - Attention-based Saliency Maps Improve Interpretability of Pneumothorax
Classification [52.77024349608834]
視覚変換器(ViT)の胸部X線撮影(CXR)分類性能と注意ベース唾液の解釈可能性について検討する。
ViTは、CheXpert、Chest X-Ray 14、MIMIC CXR、VinBigDataの4つの公開データセットを用いて、肺疾患分類のために微調整された。
ViTsは最先端のCNNと比べてCXR分類AUCに匹敵するものであった。
論文 参考訳(メタデータ) (2023-03-03T12:05:41Z) - Validated respiratory drug deposition predictions from 2D and 3D medical
images with statistical shape models and convolutional neural networks [47.187609203210705]
患者固有の沈着モデリングのための自動計算フレームワークを開発し,検証することを目的としている。
2次元胸部X線と3次元CT画像から3次元患者の呼吸動態を生成できる画像処理手法が提案されている。
論文 参考訳(メタデータ) (2023-03-02T07:47:07Z) - Significantly improving zero-shot X-ray pathology classification via fine-tuning pre-trained image-text encoders [50.689585476660554]
本稿では,正対損失緩和とランダムな文サンプリングを含む新たな微調整手法を提案する。
提案手法は,胸部X線データセットと3つの事前訓練モデル間のゼロショット病理分類を一貫して改善する。
論文 参考訳(メタデータ) (2022-12-14T06:04:18Z) - TotalSegmentator: robust segmentation of 104 anatomical structures in CT
images [48.50994220135258]
身体CT画像の深層学習セグメント化モデルを提案する。
このモデルは、臓器の容積、疾患の特徴、外科的または放射線療法計画などのユースケースに関連する104の解剖学的構造を区分することができる。
論文 参考訳(メタデータ) (2022-08-11T15:16:40Z) - Preservation of High Frequency Content for Deep Learning-Based Medical
Image Classification [74.84221280249876]
大量の胸部ラジオグラフィーの効率的な分析は、医師や放射線技師を助けることができる。
本稿では,視覚情報の効率的な識別と符号化のための離散ウェーブレット変換(DWT)を提案する。
論文 参考訳(メタデータ) (2022-05-08T15:29:54Z) - Osteoporosis Prescreening using Panoramic Radiographs through a Deep
Convolutional Neural Network with Attention Mechanism [65.70943212672023]
注意モジュールを持つディープ畳み込みニューラルネットワーク(CNN)はパノラマX線写真上で骨粗しょう症を検出することができる。
49歳から60歳までの70種類のパノラマX線写真(PR)のデータセットを用いて検討した。
論文 参考訳(メタデータ) (2021-10-19T00:03:57Z) - Medulloblastoma Tumor Classification using Deep Transfer Learning with
Multi-Scale EfficientNets [63.62764375279861]
本稿では,エンド・ツー・エンドのMB腫瘍分類を提案し,様々な入力サイズとネットワーク次元の一致した移動学習を提案する。
161ケースのデータセットを用いて、より大規模な入力解像度を持つ事前学習されたEfficientNetが、大幅な性能改善をもたらすことを実証した。
論文 参考訳(メタデータ) (2021-09-10T13:07:11Z) - Learning to Automatically Diagnose Multiple Diseases in Pediatric Chest
Radiographs Using Deep Convolutional Neural Networks [0.4697611383288171]
ディープ畳み込みニューラルネットワーク(D-CNN)は成人の胸部X線写真(CXR)スキャンにおいて顕著な性能を示した。
本稿では,5,017名の小児CXRスキャンの大規模なデータセットを遡及的に収集し,それぞれを経験者によって手動でラベル付けする。
その後、D-CNNモデルは3,550個の注釈付きスキャンで訓練され、複数の小児肺病理を自動分類する。
論文 参考訳(メタデータ) (2021-08-14T08:14:52Z) - Deep Neural Network Based Respiratory Pathology Classification Using
Cough Sounds [6.376404422444008]
本研究では,健常児と病的児を区別できる深層学習に基づく音分類モデルを提案する。
我々は,臨床医の診断とラベル付きで,新しいうっつき音のデータセットを収集した。
論文 参考訳(メタデータ) (2021-06-23T05:49:20Z) - The Diagnosis of Asthma using Hilbert-Huang Transform and Deep Learning
on Lung Sounds [2.294014185517203]
ヒルベルト変換を肺音に適用することにより抽出される固有モード関数から統計的特徴を算出した。
喘息および健常者からの肺音の分類はDeep Belief Networks(DBN)を用いて行われる。
論文 参考訳(メタデータ) (2021-01-20T19:04:33Z) - Detecting COVID-19 from Breathing and Coughing Sounds using Deep Neural
Networks [68.8204255655161]
私たちは、Convolutional Neural Networksのアンサンブルを適応させて、スピーカーがCOVID-19に感染しているかどうかを分類します。
最終的には、74.9%のUnweighted Average Recall(UAR)、またはニューラルネットワークをアンサンブルすることで、ROC曲線(AUC)の80.7%を達成する。
論文 参考訳(メタデータ) (2020-12-29T01:14:17Z) - 1-D Convlutional Neural Networks for the Analysis of Pupil Size
Variations in Scotopic Conditions [79.71065005161566]
1次元畳み込みニューラルネットワークモデルは、短距離配列の分類のために訓練されている。
モデルは、ホールドアウトテストセット上で、高い平均精度で予測を提供する。
論文 参考訳(メタデータ) (2020-02-06T17:25:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。