論文の概要: Conditional Generative Data Augmentation for Clinical Audio Datasets
- arxiv url: http://arxiv.org/abs/2203.11570v1
- Date: Tue, 22 Mar 2022 09:47:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-23 15:36:59.538303
- Title: Conditional Generative Data Augmentation for Clinical Audio Datasets
- Title(参考訳): 臨床音声データセットのための条件付き生成データ拡張
- Authors: Matthias Seibold, Armando Hoch, Mazda Farshad, Nassir Navab, Philipp
F\"urnstahl
- Abstract要約: 本稿では,重み付き条件付きWasserstein Generative Adversarial Networkに基づく臨床オーディオデータセットのための新しいデータ拡張手法を提案する。
本手法を検証するため,THA(Total Hipplasty)手術中に実世界の手術室で記録された臨床オーディオデータセットを作成した。
生成した強化サンプルによるトレーニングは、分類精度の点で古典的な音声強調法よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 36.45569352490318
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In this work, we propose a novel data augmentation method for clinical audio
datasets based on a conditional Wasserstein Generative Adversarial Network with
Gradient Penalty (cWGAN-GP), operating on log-mel spectrograms. To validate our
method, we created a clinical audio dataset which was recorded in a real-world
operating room during Total Hip Arthroplasty (THA) procedures and contains
typical sounds which resemble the different phases of the intervention. We
demonstrate the capability of the proposed method to generate realistic
class-conditioned samples from the dataset distribution and show that training
with the generated augmented samples outperforms classical audio augmentation
methods in terms of classification accuracy. The performance was evaluated
using a ResNet-18 classifier which shows a mean per-class accuracy improvement
of 1.51% in a 5-fold cross validation experiment using the proposed
augmentation method. Because clinical data is often expensive to acquire, the
development of realistic and high-quality data augmentation methods is crucial
to improve the robustness and generalization capabilities of learning-based
algorithms which is especially important for safety-critical medical
applications. Therefore, the proposed data augmentation method is an important
step towards improving the data bottleneck for clinical audio-based machine
learning systems. The code and dataset will be published upon acceptance.
- Abstract(参考訳): 本研究では,ログメルスペクトルを用いた条件付きWasserstein Generative Adversarial Network with Gradient Penalty (cWGAN-GP)に基づく臨床オーディオデータセットの新たなデータ拡張手法を提案する。
本手法の有効性を検証するため,THA(Total Hip Arthroplasty, THA)術中に実環境の手術室で記録された臨床オーディオデータセットを作成し, 介入の相違に類似した典型的な音を収録した。
提案手法は,データセット分布からリアルなクラス条件付きサンプルを生成する能力を示し,生成した拡張サンプルを用いたトレーニングは,分類精度の観点から古典的なオーディオ拡張法よりも優れていることを示す。
提案手法を用いた5倍のクロス検証実験において,クラス毎の平均精度が1.51%向上したResNet-18分類器を用いて評価を行った。
臨床データを取得するのにはしばしば費用がかかるため、特に安全クリティカルな医療応用において重要な学習アルゴリズムの堅牢性と一般化能力を向上させるために、現実的で高品質なデータ拡張手法の開発が不可欠である。
したがって,本手法は,臨床音声ベースの機械学習システムにおけるデータボトルネックを改善するための重要なステップである。
コードとデータセットは受理時に公開される。
関連論文リスト
- Tuning In: Analysis of Audio Classifier Performance in Clinical Settings with Limited Data [3.0113849517062303]
本研究では,小データセットの制約を考慮した臨床環境下での音声分類のためのディープラーニングモデルの評価を行う。
我々は、DenseNetやConvNeXtを含むCNNを、ViT、SWIN、ASTといったトランスフォーマーモデルとともに分析する。
本手法は,特定の臨床データを微調整する前に,大規模データセットで事前トレーニングを行うことの利点を強調した。
論文 参考訳(メタデータ) (2024-02-07T16:41:11Z) - Textual Data Augmentation for Patient Outcomes Prediction [67.72545656557858]
本稿では,患者の電子カルテに人工的な臨床ノートを作成するための新しいデータ拡張手法を提案する。
生成言語モデルGPT-2を微調整し、ラベル付きテキストを元のトレーニングデータで合成する。
今回,最も多い患者,すなわち30日間の寛解率について検討した。
論文 参考訳(メタデータ) (2022-11-13T01:07:23Z) - Improved Techniques for the Conditional Generative Augmentation of
Clinical Audio Data [36.45569352490318]
本稿では,学習したデータ分布からメルスペクトルを合成できる条件付き逆方向ニューラルネットワークによる拡張法を提案する。
提案手法は,従来の音質向上手法よりも優れていることを示す。
提案モデルは,臨床オーディオデータの増大における最先端の進歩と,臨床音響センシングシステムの設計におけるデータのボトルネックを改善する。
論文 参考訳(メタデータ) (2022-11-05T10:58:04Z) - Decision Forest Based EMG Signal Classification with Low Volume Dataset
Augmented with Random Variance Gaussian Noise [51.76329821186873]
我々は6種類の手振りを限定的なサンプル数で分類できるモデルを作成し、より広い聴衆によく一般化する。
信号のランダムなバウンドの使用など、より基本的な手法のセットにアピールするが、これらの手法がオンライン環境で持てる力を示したいと考えている。
論文 参考訳(メタデータ) (2022-06-29T23:22:18Z) - Mixing Signals: Data Augmentation Approach for Deep Learning Based Modulation Recognition [5.816418334578875]
無線信号のAMRに対する混合信号に基づくデータ拡張戦略を提案する。
実験の結果,提案手法は深層学習に基づくAMRモデルの分類精度を向上させることができることがわかった。
論文 参考訳(メタデータ) (2022-04-05T07:40:16Z) - Improved Speech Emotion Recognition using Transfer Learning and
Spectrogram Augmentation [56.264157127549446]
音声感情認識(SER)は、人間とコンピュータの相互作用において重要な役割を果たす課題である。
SERの主な課題の1つは、データの不足である。
本稿では,スペクトログラム拡張と併用した移動学習戦略を提案する。
論文 参考訳(メタデータ) (2021-08-05T10:39:39Z) - Accuracy Improvement for Fully Convolutional Networks via Selective
Augmentation with Applications to Electrocardiogram Data [0.0]
提案手法の精度は, 信頼度の低い試料に対する上限値付近で最適であり, 信頼度の高い試料を含むように, この閾値が上昇するにつれて低下した。
これは、フルコンボリューションネットワークによる心電図データ分類のための明確な利点を有するデータ増強のための低信頼サンプルを独占的に選択することを示唆している。
論文 参考訳(メタデータ) (2021-04-25T23:01:27Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Data augmentation using generative networks to identify dementia [20.137419355252362]
生成モデルはデータ拡張の効果的なアプローチとして利用できることを示す。
本稿では,認知症自動検出システムから抽出した音声と音声の異なる特徴に対する類似したアプローチの適用について検討する。
論文 参考訳(メタデータ) (2020-04-13T15:05:24Z) - Automatic Data Augmentation via Deep Reinforcement Learning for
Effective Kidney Tumor Segmentation [57.78765460295249]
医用画像セグメンテーションのための新しい学習ベースデータ拡張法を開発した。
本手法では,データ拡張モジュールと後続のセグメンテーションモジュールをエンドツーエンドのトレーニング方法で一貫した損失と,革新的に組み合わせる。
提案法の有効性を検証したCT腎腫瘍分節法について,本法を広範囲に評価した。
論文 参考訳(メタデータ) (2020-02-22T14:10:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。