論文の概要: Cough activity detection for automatic tuberculosis screening
- arxiv url: http://arxiv.org/abs/2603.11241v1
- Date: Wed, 11 Mar 2026 19:09:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-13 14:46:25.602226
- Title: Cough activity detection for automatic tuberculosis screening
- Title(参考訳): 結核検診におけるカフ活性検出
- Authors: Joshua Jansen van Vüren, Devendra Singh Parihar, Daphne Naidoo, Kimsey Zajac, Willy Ssengooba, Grant Theron, Thomas Niesler,
- Abstract要約: 本稿では,現在の2つの事前学習型アーキテクチャのコークス活動検出への応用を提案する。
結核に症状のある患者からのうっ血を含む記録のデータセットを用いる。
XLS−Rを用いて自動開始点と終了点が決定されると、テストセットに対して平均精度0.96、受信動作特性0.99の領域が達成される。
- 参考スコア(独自算出の注目度): 4.3095698855138815
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The automatic identification of cough segments in audio through the determination of start and end points is pivotal to building scalable screening tools in health technologies for pulmonary related diseases. We propose the application of two current pre-trained architectures to the task of cough activity detection. A dataset of recordings containing cough from patients symptomatic for tuberculosis (TB) who self-present at community-level care centres in South Africa and Uganda is employed. When automatic start and end points are determined using XLS-R, an average precision of 0.96 and an area under the receiver-operating characteristic of 0.99 are achieved for the test set. We show that best average precision is achieved by utilising only the first three layers of the network, which has the dual benefits of reduced computational and memory requirements, pivotal for smartphone-based applications. This XLS-R configuration is shown to outperform an audio spectrogram transformer (AST) as well as a logistic regression baseline by 9% and 27% absolute in test set average precision respectively. Furthermore, a downstream TB classification model trained using the coughs automatically isolated by XLS-R comfortably outperforms a model trained on the coughs isolated by AST, and is only narrowly outperformed by a classifier trained on the ground truth coughs. We conclude that the application of large pre-trained transformer models is an effective approach to identifying cough end-points and that the integration of such a model into a screening tool is feasible.
- Abstract(参考訳): 開始点と終了点の判定による音声中のコーグセグメントの自動識別は、肺疾患の健康技術にスケーラブルなスクリーニングツールを構築する上で重要である。
本稿では,現在の2つの事前学習型アーキテクチャのコークス活動検出への応用を提案する。
南アフリカとウガンダの地域医療センターで自己表現する結核(TB)患者からのうっ血を含む記録のデータセットを用いる。
XLS−Rを用いて自動開始点と終了点が決定されると、テストセットに対して平均精度0.96、受信動作特性0.99の領域が達成される。
ネットワークの最初の3層のみを利用することで,スマートフォンベースのアプリケーションにおいて,計算およびメモリ要求の低減という2つの利点を生かして,最良平均精度を実現することを示す。
このXLS-R構成は、オーディオスペクトログラム変換器(AST)とロジスティック回帰ベースラインを、それぞれテストセット平均精度で9%および27%の絶対値で上回る。
さらに、XLS-Rで自動的に分離されたコークスを用いて訓練された下流TB分類モデルは、ASTで分離されたコークスで訓練されたモデルを快適に上回り、基底真理で訓練された分類器でのみ狭く上回ります。
我々は,大規模な事前学習型トランスフォーマーモデルの適用は,粗い終点を同定するための効果的なアプローチであり,そのようなモデルをスクリーニングツールに統合することは可能であると結論付けた。
関連論文リスト
- Towards Clinical Practice in CT-Based Pulmonary Disease Screening: An Efficient and Reliable Framework [16.98886836566185]
クラスタベースサブサンプリング(CSS)法は,CTスライスをコンパクトかつ包括的に選択する。
ハイブリッド不確実性定量化(HUQ)メカニズムは、Aleatoric Uncertainty(AU)とEpistemic Uncertainty(EU)の両方を最小の計算オーバーヘッドで評価する。
論文 参考訳(メタデータ) (2024-12-02T14:18:17Z) - Self-Supervised Pretraining Improves Performance and Inference
Efficiency in Multiple Lung Ultrasound Interpretation Tasks [65.23740556896654]
肺超音波検査における複数分類課題に適用可能なニューラルネットワーク特徴抽出器を,自己指導型プレトレーニングで作成できるかどうかを検討した。
3つの肺超音波のタスクを微調整すると、事前訓練されたモデルにより、各テストセットの受信操作曲線(AUC)における平均クロスタスク面積は、それぞれ0.032と0.061に改善された。
論文 参考訳(メタデータ) (2023-09-05T21:36:42Z) - Application of the nnU-Net for automatic segmentation of lung lesion on
CT images, and implication on radiomic models [1.8231394717039833]
非小細胞肺癌患者のCT画像にディープラーニング自動分画法を適用した。
生存放射線モデルの性能評価において,手動と自動セグメンテーションの併用も検討した。
論文 参考訳(メタデータ) (2022-09-24T15:04:23Z) - Improving Classification Model Performance on Chest X-Rays through Lung
Segmentation [63.45024974079371]
本稿では, セグメンテーションによる異常胸部X線(CXR)識別性能を向上させるための深層学習手法を提案する。
提案手法は,CXR画像中の肺領域を局所化するための深層ニューラルネットワーク(XLSor)と,大規模CXRデータセットで事前学習した自己教師あり運動量コントラスト(MoCo)モデルのバックボーンを用いたCXR分類モデルである。
論文 参考訳(メタデータ) (2022-02-22T15:24:06Z) - Lung Cancer Lesion Detection in Histopathology Images Using Graph-Based
Sparse PCA Network [93.22587316229954]
ヘマトキシリンとエオシン(H&E)で染色した組織学的肺スライドにおける癌病変の自動検出のためのグラフベーススパース成分分析(GS-PCA)ネットワークを提案する。
我々は,SVM K-rasG12D肺がんモデルから得られたH&Eスライダーの精度・リコール率,Fスコア,谷本係数,レシーバ演算子特性(ROC)の曲線下領域を用いて,提案アルゴリズムの性能評価を行った。
論文 参考訳(メタデータ) (2021-10-27T19:28:36Z) - Cough Detection Using Selected Informative Features from Audio Signals [24.829135966052142]
モデルは、ESC-50データセットと自己記録コークス記録を組み合わせたデータセットでトレーニングされる。
最高のコー検出モデルは、それぞれ94.9%、97.1%、93.1%、0.95の精度、リコール、精度、F1スコアを実現する。
論文 参考訳(メタデータ) (2021-08-07T23:05:18Z) - Development of a Multi-Task Learning V-Net for Pulmonary Lobar
Segmentation on Computed Tomography and Application to Diseased Lungs [0.19573380763700707]
疾患のある肺領域は、しばしばCT画像に高密度ゾーンを生成し、損傷した葉を特定するアルゴリズムの実行を制限する。
この影響は、肺葉を分節する機械学習手法の改善を動機づけた。
このアプローチは、放射線科医のロバストなツールとして臨床現場で容易に採用することができる。
論文 参考訳(メタデータ) (2021-05-11T17:10:25Z) - Automatic Cough Classification for Tuberculosis Screening in a
Real-World Environment [5.6663315405998365]
結核(tb)患者と他の肺疾患患者が発する発声音とを自動的に判別することが可能であることを示す第1報を報告する。
本実験は, TB患者16名, 呼吸器疾患患者33名, TB以外の患者33名を対象に, 実世界の診療所で得られたコークス記録のデータセットに基づいて行った。
以上の結果から, 音素の自動分類は, TBの低コストで展開可能なフロントラインスクリーニングの手段として有望であり, 開発途上国のTB負荷に大きく貢献すると考えられる。
論文 参考訳(メタデータ) (2021-03-23T15:03:52Z) - Detecting COVID-19 from Breathing and Coughing Sounds using Deep Neural
Networks [68.8204255655161]
私たちは、Convolutional Neural Networksのアンサンブルを適応させて、スピーカーがCOVID-19に感染しているかどうかを分類します。
最終的には、74.9%のUnweighted Average Recall(UAR)、またはニューラルネットワークをアンサンブルすることで、ROC曲線(AUC)の80.7%を達成する。
論文 参考訳(メタデータ) (2020-12-29T01:14:17Z) - CovidDeep: SARS-CoV-2/COVID-19 Test Based on Wearable Medical Sensors
and Efficient Neural Networks [51.589769497681175]
新型コロナウイルス(SARS-CoV-2)がパンデミックを引き起こしている。
SARS-CoV-2の逆転写-ポリメラーゼ連鎖反応に基づく現在の試験体制は、試験要求に追いついていない。
我々は,効率的なDNNと市販のWMSを組み合わせたCovidDeepというフレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-20T21:47:28Z) - Self-Training with Improved Regularization for Sample-Efficient Chest
X-Ray Classification [80.00316465793702]
挑戦的なシナリオで堅牢なモデリングを可能にするディープラーニングフレームワークを提案する。
その結果,85%のラベル付きデータを用いて,大規模データ設定で学習した分類器の性能に適合する予測モデルを構築することができた。
論文 参考訳(メタデータ) (2020-05-03T02:36:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。