論文の概要: Sound Signal Synthesis with Auxiliary Classifier GAN, COVID-19 cough as an example
- arxiv url: http://arxiv.org/abs/2508.08892v1
- Date: Tue, 12 Aug 2025 12:29:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-13 21:07:34.422068
- Title: Sound Signal Synthesis with Auxiliary Classifier GAN, COVID-19 cough as an example
- Title(参考訳): Auxiliary Classifier GAN, COVID-19 cough を用いた音声信号合成
- Authors: Yahya Sherif Solayman Mohamed Saleh, Ahmed Mohammed Dabbous, Lama Alkhaled, Hum Yan Chai, Muhammad Ehsan Rana, Hamam Mokayed,
- Abstract要約: 本稿では,Auxiliary Classification GAN (ACGAN) を用いて, 健常者および新型コロナウイルス患者の新しいMel Spectrogramを条件付きで生成する方法について述べる。
この作業は、トレーニングにおける予想される混乱と不整合を強調し、そのような欠点を検出し、対処するための洞察を提供する。
- 参考スコア(独自算出の注目度): 0.45866218969311584
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: One of the fastest-growing domains in AI is healthcare. Given its importance, it has been the interest of many researchers to deploy ML models into the ever-demanding healthcare domain to aid doctors and increase accessibility. Delivering reliable models, however, demands a sizable amount of data, and the recent COVID-19 pandemic served as a reminder of the rampant and scary nature of healthcare that makes training models difficult. To alleviate such scarcity, many published works attempted to synthesize radiological cough data to train better COVID-19 detection models on the respective radiological data. To accommodate the time sensitivity expected during a pandemic, this work focuses on detecting COVID-19 through coughs using synthetic data to improve the accuracy of the classifier. The work begins by training a CNN on a balanced subset of the Coughvid dataset, establishing a baseline classification test accuracy of 72%. The paper demonstrates how an Auxiliary Classification GAN (ACGAN) may be trained to conditionally generate novel synthetic Mel Spectrograms of both healthy and COVID-19 coughs. These coughs are used to augment the training dataset of the CNN classifier, allowing it to reach a new test accuracy of 75%. The work highlights the expected messiness and inconsistency in training and offers insights into detecting and handling such shortcomings.
- Abstract(参考訳): AIの急成長する分野の1つは医療だ。
その重要性から、多くの研究者が、医師を助け、アクセシビリティを高めるために、オンデマンドの医療ドメインにMLモデルをデプロイすることに興味を持っている。
新型コロナウイルス(COVID-19)のパンデミックは、トレーニングモデルを難しくする医療の急増と恐ろしい性質を思い出させるのに役立ちました。
このような不足を緩和するために、多くの論文が、それぞれの放射線学的データに基づいて、より優れた新型コロナウイルス検出モデルを訓練するために、放射線学的コーデータを合成しようと試みた。
パンデミックで期待される時間感度に対応するため、この研究は、合成データを用いて新型コロナウイルスの検出に焦点を当て、分類器の精度を向上させる。
この作業は、Coughvidデータセットのバランスのとれたサブセット上でCNNをトレーニングすることから始まり、ベースライン分類テストの精度を72%に設定する。
この論文は、Auxiliary Classification GAN (ACGAN) が、健康と新型コロナウイルスの両方で新規な合成メルスペクトログラムを条件付きで生成するためにどのように訓練されているかを示す。
これらのコーズは、CNN分類器のトレーニングデータセットを強化するために使用され、新しいテスト精度75%に達することができる。
この作業は、トレーニングにおける予想される混乱と不整合を強調し、そのような欠点を検出し、対処するための洞察を提供する。
関連論文リスト
- Transfer Learning to Detect COVID-19 Coughs with Incremental Addition of
Patient Coughs to Healthy People's Cough Detection Models [0.6554326244334866]
Coughingは、スマートフォンのマイクセンサーから客観的に検出しようとしている一般的な症状の1つだ。
本研究は, 健康な患者と新型コロナウイルス患者との関係を生かした, インクリメンタルトランスファー学習手法を提案する。
論文 参考訳(メタデータ) (2023-11-12T02:01:24Z) - When Accuracy Meets Privacy: Two-Stage Federated Transfer Learning
Framework in Classification of Medical Images on Limited Data: A COVID-19
Case Study [77.34726150561087]
新型コロナウイルスのパンデミックが急速に広がり、世界の医療資源が不足している。
CNNは医療画像の解析に広く利用され、検証されている。
論文 参考訳(メタデータ) (2022-03-24T02:09:41Z) - EIHW-MTG DiCOVA 2021 Challenge System Report [2.3544007354006706]
本研究の目的は、うずまに埋め込まれた音響情報を分析することで、COVID-19患者を自動的に検出することである。
本研究は、新型コロナウイルスがこれらの信号の周波数量を変化させるかどうかを調べることを目的として、試料の分光図表現の分析に焦点をあてる。
論文 参考訳(メタデータ) (2021-10-13T07:38:54Z) - The pitfalls of using open data to develop deep learning solutions for
COVID-19 detection in chest X-rays [64.02097860085202]
深層学習モデルは、胸部X線から新型コロナウイルスを識別するために開発された。
オープンソースデータのトレーニングやテストでは,結果は異例です。
データ分析とモデル評価は、人気のあるオープンソースデータセットであるCOVIDxが実際の臨床問題を代表していないことを示している。
論文 参考訳(メタデータ) (2021-09-14T10:59:11Z) - Cough Detection Using Selected Informative Features from Audio Signals [24.829135966052142]
モデルは、ESC-50データセットと自己記録コークス記録を組み合わせたデータセットでトレーニングされる。
最高のコー検出モデルは、それぞれ94.9%、97.1%、93.1%、0.95の精度、リコール、精度、F1スコアを実現する。
論文 参考訳(メタデータ) (2021-08-07T23:05:18Z) - Project Achoo: A Practical Model and Application for COVID-19 Detection
from Recordings of Breath, Voice, and Cough [55.45063681652457]
コンシューマー端末で録音した音声を用いて、新型コロナウイルスを迅速にトリアージする機械学習手法を提案する。
この手法は,信号処理手法と微調整深層学習ネットワークを組み合わせることで,信号の識別,コークス検出,分類を行う手法を提供する。
我々はまた、症状チェッカーと音声、息、うず信号を使って新型コロナウイルスの感染を検知するモバイルアプリケーションを開発し、展開した。
論文 参考訳(メタデータ) (2021-07-12T08:07:56Z) - Exploring Self-Supervised Representation Ensembles for COVID-19 Cough
Classification [5.469841541565308]
そこで本研究では,新しい自己教師付き学習フレームワークを提案する。
非ラベルデータでトランスフォーマベースの特徴エンコーダを訓練するために、コントラストプレトレーニングフェーズを導入する。
提案したコントラスト事前学習,ランダムマスキング機構,アンサンブルアーキテクチャが,コークス分類性能の向上に寄与していることを示す。
論文 参考訳(メタデータ) (2021-05-17T01:27:20Z) - Virufy: A Multi-Branch Deep Learning Network for Automated Detection of
COVID-19 [1.9899603776429056]
研究者は、臨床設定で記録された音声サンプルを使用して新型コロナウイルス感染状態を検出するモデルを提示しました。
そこで本研究では,クラウドソースデータを用いて,手作業によるデータ処理やクリーン化を行わないマルチブランチ深層学習ネットワークを提案する。
論文 参考訳(メタデータ) (2021-03-02T15:31:09Z) - Detecting COVID-19 from Breathing and Coughing Sounds using Deep Neural
Networks [68.8204255655161]
私たちは、Convolutional Neural Networksのアンサンブルを適応させて、スピーカーがCOVID-19に感染しているかどうかを分類します。
最終的には、74.9%のUnweighted Average Recall(UAR)、またはニューラルネットワークをアンサンブルすることで、ROC曲線(AUC)の80.7%を達成する。
論文 参考訳(メタデータ) (2020-12-29T01:14:17Z) - CovidDeep: SARS-CoV-2/COVID-19 Test Based on Wearable Medical Sensors
and Efficient Neural Networks [51.589769497681175]
新型コロナウイルス(SARS-CoV-2)がパンデミックを引き起こしている。
SARS-CoV-2の逆転写-ポリメラーゼ連鎖反応に基づく現在の試験体制は、試験要求に追いついていない。
我々は,効率的なDNNと市販のWMSを組み合わせたCovidDeepというフレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-20T21:47:28Z) - Self-Training with Improved Regularization for Sample-Efficient Chest
X-Ray Classification [80.00316465793702]
挑戦的なシナリオで堅牢なモデリングを可能にするディープラーニングフレームワークを提案する。
その結果,85%のラベル付きデータを用いて,大規模データ設定で学習した分類器の性能に適合する予測モデルを構築することができた。
論文 参考訳(メタデータ) (2020-05-03T02:36:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。