論文の概要: Pediatric Asthma Detection with Googles HeAR Model: An AI-Driven Respiratory Sound Classifier
- arxiv url: http://arxiv.org/abs/2504.20124v1
- Date: Mon, 28 Apr 2025 12:52:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:54.610696
- Title: Pediatric Asthma Detection with Googles HeAR Model: An AI-Driven Respiratory Sound Classifier
- Title(参考訳): GoogleのHeARモデルを用いた小児喘息検出:AI駆動呼吸音分類器
- Authors: Abul Ehtesham, Saket Kumar, Aditi Singh, Tala Talaei Khoei,
- Abstract要約: この研究は、小児の呼吸音から喘息の早期徴候を検出するために、AIを利用した診断パイプラインを提供する。
SPRSoundデータセットは、ホイーズ、クラックル、ロンチ、ストリドール、ノーマルとラベル付けされた2秒のオーディオセグメントを抽出するために使用される。
このシステムは91%以上の精度を達成し、正の場合の精度・リコールの指標に対して高い性能を発揮する。
- 参考スコア(独自算出の注目度): 0.8463972278020965
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Early detection of asthma in children is crucial to prevent long-term respiratory complications and reduce emergency interventions. This work presents an AI-powered diagnostic pipeline that leverages Googles Health Acoustic Representations (HeAR) model to detect early signs of asthma from pediatric respiratory sounds. The SPRSound dataset, the first open-access collection of annotated respiratory sounds in children aged 1 month to 18 years, is used to extract 2-second audio segments labeled as wheeze, crackle, rhonchi, stridor, or normal. Each segment is embedded into a 512-dimensional representation using HeAR, a foundation model pretrained on 300 million health-related audio clips, including 100 million cough sounds. Multiple classifiers, including SVM, Random Forest, and MLP, are trained on these embeddings to distinguish between asthma-indicative and normal sounds. The system achieves over 91\% accuracy, with strong performance on precision-recall metrics for positive cases. In addition to classification, learned embeddings are visualized using PCA, misclassifications are analyzed through waveform playback, and ROC and confusion matrix insights are provided. This method demonstrates that short, low-resource pediatric recordings, when powered by foundation audio models, can enable fast, noninvasive asthma screening. The approach is especially promising for digital diagnostics in remote or underserved healthcare settings.
- Abstract(参考訳): 小児の喘息の早期発見は、長期の呼吸器合併症を予防し、緊急介入を減らすために重要である。
この研究は、GoogleのHealth Acoustic Representations(HeAR)モデルを利用して、小児呼吸音から喘息の早期徴候を検出するAIを利用した診断パイプラインを提供する。
SPRSoundデータセットは、1か月から18歳までの小児に初めて注釈付き呼吸音のオープン・アクセス・コレクションであり、Wheze, crackle, rhonchi, stridor, normalとラベル付けされた2秒の音声セグメントを抽出するために使用される。
それぞれのセグメントはHeARを使って512次元の表現に埋め込まれている。
SVM、ランダムフォレスト、MPPを含む複数の分類器は、これらの埋め込みに基づいて、喘息指示音と正常音の区別を訓練する。
このシステムは、正の場合の精度-リコール測定値において、91 %以上の精度を達成している。
分類に加えて、学習した埋め込みをPCAを用いて可視化し、波形再生によって誤分類を分析し、ROCと混乱行列の洞察を提供する。
本手法は, 基礎的オーディオモデルを用いた短時間で低リソースの小児記録が, 高速で非侵襲的な喘息スクリーニングを可能にすることを実証する。
このアプローチは、遠隔または保存されていない医療環境におけるデジタル診断に特に有望である。
関連論文リスト
- Respiratory Inhaler Sound Event Classification Using Self-Supervised Learning [43.83039192442981]
喘息は世界中の何百万人もの人に影響を及ぼす慢性呼吸器疾患である。
我々は,このモデルを吸入音の事前学習と微調整により,吸入音分類のためのwav2vec 2.0自己教師学習モデルを適用した。
提案モデルでは、ドライパウダー吸入器とスマートウォッチデバイスを用いて収集したデータセットに対して、バランスの取れた精度が98%であることを示す。
論文 参考訳(メタデータ) (2025-04-15T14:44:47Z) - Pre-Trained Foundation Model representations to uncover Breathing patterns in Speech [2.935056044470713]
呼吸速度(英: respiratory rate, RR)は、個人の健康、フィットネス、健康全般を評価するために用いられる重要な指標である。
RRを測定するための既存のアプローチは、特殊装備や訓練を用いて実施されている。
機械学習アルゴリズムは、バイオセンサー信号を入力としてRRを推定できることを示した。
論文 参考訳(メタデータ) (2024-07-17T21:57:18Z) - Rene: A Pre-trained Multi-modal Architecture for Auscultation of Respiratory Diseases [5.810320353233697]
本稿では,呼吸音の認識に適した大規模モデルであるReneを紹介する。
我々の革新的なアプローチは、事前訓練された音声認識モデルを用いて呼吸音を処理している。
我々は,Reneアーキテクチャを用いた実時間呼吸音識別システムを開発した。
論文 参考訳(メタデータ) (2024-05-13T03:00:28Z) - COVID-19 Detection System: A Comparative Analysis of System Performance Based on Acoustic Features of Cough Audio Signals [0.6963971634605796]
本研究は、新型コロナウイルス検出における機械学習(ML)モデルの性能向上を図ることを目的としている。
MFCC(Mel Frequency Cepstral Coefficients)、クロマ(Chroma)、スペクトルコントラスト(Spectral Contrast)の3つの特徴抽出手法の有効性について検討し、2つの機械学習アルゴリズム、SVM(Support Vector Machine)とMLP(Multilayer Perceptron)に適用した。
提案システムでは,COUGHVIDデータセットでは0.843,Virufyでは0.953,最先端の分類性能を示す。
論文 参考訳(メタデータ) (2023-09-08T08:33:24Z) - Patch-Mix Contrastive Learning with Audio Spectrogram Transformer on Respiratory Sound Classification [18.56326840619165]
本稿では,潜在空間における混合表現を識別するために,新規かつ効果的なパッチ・ミクス・コントラスト学習を提案する。
提案手法はICBHIデータセット上での最先端性能を実現し,4.08%の改善により先行先行スコアを上回った。
論文 参考訳(メタデータ) (2023-05-23T13:04:07Z) - Deep Feature Learning for Medical Acoustics [78.56998585396421]
本研究の目的は,医療音響の課題における学習内容の比較である。
ヒトの呼吸音と心臓の鼓動を健康的または病態の影響の2つのカテゴリに分類する枠組みが実装されている。
論文 参考訳(メタデータ) (2022-08-05T10:39:37Z) - Preservation of High Frequency Content for Deep Learning-Based Medical
Image Classification [74.84221280249876]
大量の胸部ラジオグラフィーの効率的な分析は、医師や放射線技師を助けることができる。
本稿では,視覚情報の効率的な識別と符号化のための離散ウェーブレット変換(DWT)を提案する。
論文 参考訳(メタデータ) (2022-05-08T15:29:54Z) - Lung Cancer Lesion Detection in Histopathology Images Using Graph-Based
Sparse PCA Network [93.22587316229954]
ヘマトキシリンとエオシン(H&E)で染色した組織学的肺スライドにおける癌病変の自動検出のためのグラフベーススパース成分分析(GS-PCA)ネットワークを提案する。
我々は,SVM K-rasG12D肺がんモデルから得られたH&Eスライダーの精度・リコール率,Fスコア,谷本係数,レシーバ演算子特性(ROC)の曲線下領域を用いて,提案アルゴリズムの性能評価を行った。
論文 参考訳(メタデータ) (2021-10-27T19:28:36Z) - Detecting COVID-19 from Breathing and Coughing Sounds using Deep Neural
Networks [68.8204255655161]
私たちは、Convolutional Neural Networksのアンサンブルを適応させて、スピーカーがCOVID-19に感染しているかどうかを分類します。
最終的には、74.9%のUnweighted Average Recall(UAR)、またはニューラルネットワークをアンサンブルすることで、ROC曲線(AUC)の80.7%を達成する。
論文 参考訳(メタデータ) (2020-12-29T01:14:17Z) - Identification of deep breath while moving forward based on multiple
body regions and graph signal analysis [45.62293065676075]
本稿では,世界深度カメラを通り過ぎているときの深呼吸を自動的に識別できる非閉塞性ソリューションを提案する。
検証実験において、提案手法は、それぞれ75.5%、76.2%、75.0%、75.2%の精度、精度、リコール、F1の比較手法よりも優れている。
論文 参考訳(メタデータ) (2020-10-20T08:26:50Z) - Respiratory Sound Classification Using Long-Short Term Memory [62.997667081978825]
本稿では,呼吸器疾患の分類に関連して,音の分類を行おうとする際の問題点について検討する。
このようなタスクをどのように実装できるかを特定するために、ディープラーニングと長期短期記憶ネットワークの使用の検討を行う。
論文 参考訳(メタデータ) (2020-08-06T23:11:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。