論文の概要: A Semi-Supervised Algorithm for Improving the Consistency of
Crowdsourced Datasets: The COVID-19 Case Study on Respiratory Disorder
Classification
- arxiv url: http://arxiv.org/abs/2209.04360v1
- Date: Fri, 9 Sep 2022 15:44:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-12 13:12:23.579314
- Title: A Semi-Supervised Algorithm for Improving the Consistency of
Crowdsourced Datasets: The COVID-19 Case Study on Respiratory Disorder
Classification
- Title(参考訳): クラウドソーシングデータセットの一貫性向上のための半監督的アルゴリズム : 呼吸器障害分類におけるCOVID-19事例研究
- Authors: Lara Orlandic, Tomas Teijeiro, David Atienza
- Abstract要約: 聴覚信号の分類は、新型コロナウイルス(COVID-19)などの呼吸器疾患のスクリーニングに有用なツールである。
多くの研究チームは、COUGHVIDデータセットを生成するために行われたように、音声データを素早く収集するためにクラウドソーシングに移行した。
COUGHVIDデータセットは、専門家の医師に、限られた数のアップロードされた記録に存在する基礎疾患の診断を依頼した。
この研究は、半教師付き学習(SSL)アプローチを使用して、COUGHVIDデータセットのラベル付け一貫性を改善し、新型コロナウイルスの健全な音分類に対する堅牢性を向上させる。
- 参考スコア(独自算出の注目度): 4.431270735024064
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cough audio signal classification is a potentially useful tool in screening
for respiratory disorders, such as COVID-19. Since it is dangerous to collect
data from patients with such contagious diseases, many research teams have
turned to crowdsourcing to quickly gather cough sound data, as it was done to
generate the COUGHVID dataset. The COUGHVID dataset enlisted expert physicians
to diagnose the underlying diseases present in a limited number of uploaded
recordings. However, this approach suffers from potential mislabeling of the
coughs, as well as notable disagreement between experts. In this work, we use a
semi-supervised learning (SSL) approach to improve the labeling consistency of
the COUGHVID dataset and the robustness of COVID-19 versus healthy cough sound
classification. First, we leverage existing SSL expert knowledge aggregation
techniques to overcome the labeling inconsistencies and sparsity in the
dataset. Next, our SSL approach is used to identify a subsample of re-labeled
COUGHVID audio samples that can be used to train or augment future cough
classification models. The consistency of the re-labeled data is demonstrated
in that it exhibits a high degree of class separability, 3x higher than that of
the user-labeled data, despite the expert label inconsistency present in the
original dataset. Furthermore, the spectral differences in the user-labeled
audio segments are amplified in the re-labeled data, resulting in significantly
different power spectral densities between healthy and COVID-19 coughs, which
demonstrates both the increased consistency of the new dataset and its
explainability from an acoustic perspective. Finally, we demonstrate how the
re-labeled dataset can be used to train a cough classifier. This SSL approach
can be used to combine the medical knowledge of several experts to improve the
database consistency for any diagnostic classification task.
- Abstract(参考訳): cough audio signal classificationは、新型コロナウイルスなどの呼吸器疾患のスクリーニングに有用である。
このような伝染性疾患の患者からデータを集めるのは危険であるため、多くの研究チームは、COUGHVIDデータセットを生成するために行われたように、クラウドソーシングに移行した。
COUGHVIDデータセットは、専門家の医師に、限られた数のアップロードされた記録に存在する基礎疾患の診断を依頼した。
しかし、このアプローチは干ばつを誤記する可能性や専門家間の顕著な意見の相違に苦しめられている。
本研究では, COUGHVIDデータセットのラベル付け一貫性の向上と, 健全な音分類に対する新型コロナウイルスの堅牢性向上のために, 半教師付き学習(SSL)アプローチを用いる。
まず、既存のSSL専門家知識集約技術を活用して、データセットのラベル付けの不整合とスパーシリティを克服する。
次に、我々のSSLアプローチは、将来のコークス分類モデルをトレーニングまたは拡張するために使用可能な、再ラベルされたCOUGHVIDオーディオサンプルのサブサンプルを特定するために使用される。
元のデータセットに専門家ラベルの不整合があるにもかかわらず、再ラベルデータの一貫性は、ユーザラベルデータよりも3倍高い高い高いクラス分離性を示すことを示す。
さらに、ユーザラベル付き音声セグメントのスペクトル差は、再ラベルされたデータに増幅され、その結果、健康と新型コロナウイルス間のパワースペクトル密度が著しく異なり、新しいデータセットの一貫性の増大と、音響的視点からの説明可能性の両方が示される。
最後に、再ラベルされたデータセットを使用してcough分類器をトレーニングする方法をデモする。
このsslアプローチは、診断分類タスクのデータベース一貫性を改善するために、複数の専門家の医療知識を組み合わせるために使用できる。
関連論文リスト
- Towards reliable respiratory disease diagnosis based on cough sounds and vision transformers [14.144599890583308]
本稿では,大規模コークスデータセットを用いた自己教師型学習と教師型学習を併用したコークス病分類手法を提案する。
提案手法は、新型コロナウイルスの診断のための2つのベンチマークデータセットと、AUROC 92.5% の COPD/non-COPD 分類のためのプロプライエタリデータセットにおいて、先行技術よりも一貫して優れていることを示す実験結果を得た。
論文 参考訳(メタデータ) (2024-08-28T09:40:40Z) - Improving Multiple Sclerosis Lesion Segmentation Across Clinical Sites:
A Federated Learning Approach with Noise-Resilient Training [75.40980802817349]
深層学習モデルは、自動的にMS病変を分節する約束を示しているが、正確な注釈付きデータの不足は、この分野の進歩を妨げている。
我々は,MS病変の不均衡分布とファジィ境界を考慮したDecoupled Hard Label Correction(DHLC)戦略を導入する。
また,集約型中央モデルを利用したCELC(Centrally Enhanced Label Correction)戦略も導入した。
論文 参考訳(メタデータ) (2023-08-31T00:36:10Z) - Synthetic Augmentation with Large-scale Unconditional Pre-training [4.162192894410251]
アノテーション付きデータへの依存性を低減するため,HistoDiffusionという合成拡張手法を提案する。
HistoDiffusionは、大規模にラベル付けされていないデータセットで事前トレーニングし、その後、拡張トレーニングのために小さなラベル付きデータセットに適用することができる。
本手法は,3つの病理組織学的データセットを事前学習し,大腸癌の病理組織学的データセット(CRC)を事前学習データセットから除外して評価する。
論文 参考訳(メタデータ) (2023-08-08T03:34:04Z) - Semi-Supervised Learning for Multi-Label Cardiovascular Diseases
Prediction:A Multi-Dataset Study [17.84069222975825]
現在の心電図に基づく診断システムは,ディープラーニング技術の急速な発展により,有望な性能を示す。
ラベル不足、複数のCVDの共起、目に見えないデータセットのパフォーマンスの低下は、ディープラーニングベースのモデルの普及を妨げる。
本稿では,複数のCVDを同時に認識するマルチラベル半教師付きモデル(ECGMatch)を提案する。
論文 参考訳(メタデータ) (2023-06-18T07:46:19Z) - Patch-Mix Contrastive Learning with Audio Spectrogram Transformer on Respiratory Sound Classification [18.56326840619165]
本稿では,潜在空間における混合表現を識別するために,新規かつ効果的なパッチ・ミクス・コントラスト学習を提案する。
提案手法はICBHIデータセット上での最先端性能を実現し,4.08%の改善により先行先行スコアを上回った。
論文 参考訳(メタデータ) (2023-05-23T13:04:07Z) - Improving Medical Image Classification with Label Noise Using
Dual-uncertainty Estimation [72.0276067144762]
医用画像における2種類のラベルノイズについて論じ,定義する。
医用画像分類作業中にこれら2つのラベルノイズを処理する不確実性推定に基づくフレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-28T14:56:45Z) - Correcting Data Imbalance for Semi-Supervised Covid-19 Detection Using
X-ray Chest Images [4.1950566803514935]
半教師付きディープラーニングアーキテクチャMixMatchの性能評価を行った。
新しいデータセットは、コスタリカの成人患者の胸部X線画像からなる検証データセットに含まれる。
論文 参考訳(メタデータ) (2020-08-19T15:16:57Z) - Deep Mining External Imperfect Data for Chest X-ray Disease Screening [57.40329813850719]
我々は、外部のCXRデータセットを組み込むことで、不完全なトレーニングデータにつながると論じ、課題を提起する。
本研究は,多ラベル病分類問題を重み付き独立二分課題として分類する。
我々のフレームワークは、ドメインとラベルの相違を同時にモデル化し、対処し、優れた知識マイニング能力を実現する。
論文 参考訳(メタデータ) (2020-06-06T06:48:40Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z) - Predictive Modeling of ICU Healthcare-Associated Infections from
Imbalanced Data. Using Ensembles and a Clustering-Based Undersampling
Approach [55.41644538483948]
本研究は,集中治療室における危険因子の同定と医療関連感染症の予測に焦点をあてる。
感染発生率の低減に向けた意思決定を支援することを目的とする。
論文 参考訳(メタデータ) (2020-05-07T16:13:12Z) - Self-Training with Improved Regularization for Sample-Efficient Chest
X-Ray Classification [80.00316465793702]
挑戦的なシナリオで堅牢なモデリングを可能にするディープラーニングフレームワークを提案する。
その結果,85%のラベル付きデータを用いて,大規模データ設定で学習した分類器の性能に適合する予測モデルを構築することができた。
論文 参考訳(メタデータ) (2020-05-03T02:36:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。