論文の概要: Improved Techniques for the Conditional Generative Augmentation of
Clinical Audio Data
- arxiv url: http://arxiv.org/abs/2211.02874v1
- Date: Sat, 5 Nov 2022 10:58:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 17:57:17.220827
- Title: Improved Techniques for the Conditional Generative Augmentation of
Clinical Audio Data
- Title(参考訳): 臨床音声データの条件付生成増強のための改良技術
- Authors: Mane Margaryan, Matthias Seibold, Indu Joshi, Mazda Farshad, Philipp
F\"urnstahl, Nassir Navab
- Abstract要約: 本稿では,学習したデータ分布からメルスペクトルを合成できる条件付き逆方向ニューラルネットワークによる拡張法を提案する。
提案手法は,従来の音質向上手法よりも優れていることを示す。
提案モデルは,臨床オーディオデータの増大における最先端の進歩と,臨床音響センシングシステムの設計におけるデータのボトルネックを改善する。
- 参考スコア(独自算出の注目度): 36.45569352490318
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Data augmentation is a valuable tool for the design of deep learning systems
to overcome data limitations and stabilize the training process. Especially in
the medical domain, where the collection of large-scale data sets is
challenging and expensive due to limited access to patient data, relevant
environments, as well as strict regulations, community-curated large-scale
public datasets, pretrained models, and advanced data augmentation methods are
the main factors for developing reliable systems to improve patient care.
However, for the development of medical acoustic sensing systems, an emerging
field of research, the community lacks large-scale publicly available data sets
and pretrained models. To address the problem of limited data, we propose a
conditional generative adversarial neural network-based augmentation method
which is able to synthesize mel spectrograms from a learned data distribution
of a source data set. In contrast to previously proposed fully convolutional
models, the proposed model implements residual Squeeze and Excitation modules
in the generator architecture. We show that our method outperforms all
classical audio augmentation techniques and previously published generative
methods in terms of generated sample quality and a performance improvement of
2.84% of Macro F1-Score for a classifier trained on the augmented data set, an
enhancement of $1.14\%$ in relation to previous work. By analyzing the
correlation of intermediate feature spaces, we show that the residual Squeeze
and Excitation modules help the model to reduce redundancy in the latent
features. Therefore, the proposed model advances the state-of-the-art in the
augmentation of clinical audio data and improves the data bottleneck for the
design of clinical acoustic sensing systems.
- Abstract(参考訳): データ拡張は、データ制限を克服し、トレーニングプロセスを安定化するために、ディープラーニングシステムの設計に有用なツールである。
特に、患者データへのアクセスが限られているため、大規模データセットの収集が困難で高価である医療領域では、関連する環境、厳格な規制、コミュニティによって調整された大規模公開データセット、事前訓練されたモデル、高度なデータ拡張手法が、患者ケアを改善するための信頼性の高いシステムを開発する主な要因となっている。
しかし, 医療用音響センシングシステムの開発, 研究の新たな分野として, 大規模公開データセットや事前学習モデルが欠落している。
限られたデータの問題に対処するために,情報源データセットの学習データ分布からメル・スペクトログラムを合成できる条件付き生成逆ニューラルネットワークに基づく拡張法を提案する。
前述した完全畳み込みモデルとは対照的に、提案モデルはジェネレータアーキテクチャにおいて残留スクイーズと励磁モジュールを実装している。
本手法は, 従来の音声拡張手法と, 生成したサンプル品質と, 拡張データセット上で訓練された分類器に対するマクロf1-scoreの2.84%の性能向上により, 従来の作業に関連して1.14\$$$向上することを示す。
中間特徴空間の相関を解析することにより,残留スクイーズと励磁モジュールが潜在特徴の冗長性を減少させるのに役立つことを示す。
そこで,提案モデルでは,臨床音声データの強化と,臨床音響センシングシステムの設計のためのデータボトルネックの改善が期待できる。
関連論文リスト
- Multi-OCT-SelfNet: Integrating Self-Supervised Learning with Multi-Source Data Fusion for Enhanced Multi-Class Retinal Disease Classification [2.5091334993691206]
網膜疾患診断のための堅牢なディープラーニングモデルの開発には、トレーニングのためのかなりのデータセットが必要である。
より小さなデータセットで効果的に一般化する能力は、依然として永続的な課題である。
さまざまなデータソースを組み合わせて、パフォーマンスを改善し、新しいデータに一般化しています。
論文 参考訳(メタデータ) (2024-09-17T17:22:35Z) - Synthesizing Multimodal Electronic Health Records via Predictive Diffusion Models [69.06149482021071]
EHRPDと呼ばれる新しいEHRデータ生成モデルを提案する。
時間間隔推定を組み込んだ拡散モデルである。
我々は2つの公開データセットで実験を行い、忠実さ、プライバシー、実用性の観点からEPHPDを評価する。
論文 参考訳(メタデータ) (2024-06-20T02:20:23Z) - Improving SMOTE via Fusing Conditional VAE for Data-adaptive Noise Filtering [0.5735035463793009]
変分オートエンコーダ(VAE)を用いたSMOTEアルゴリズムの拡張フレームワークを提案する。
本稿では,VAEを用いて低次元潜在空間におけるデータ点密度を体系的に定量化し,クラスラベル情報と分類困難度を同時に統合する手法を提案する。
いくつかの不均衡データセットに関する実証的研究は、この単純なプロセスが、ディープラーニングモデルよりも従来のSMOTEアルゴリズムを革新的に改善することを示している。
論文 参考訳(メタデータ) (2024-05-30T07:06:02Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Learnable Weight Initialization for Volumetric Medical Image Segmentation [66.3030435676252]
本稿では,学習可能な重みに基づくハイブリッド医療画像セグメンテーション手法を提案する。
我々のアプローチはどんなハイブリッドモデルにも簡単に統合でき、外部のトレーニングデータを必要としない。
多臓器・肺がんセグメンテーションタスクの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-06-15T17:55:05Z) - Application of federated learning techniques for arrhythmia
classification using 12-lead ECG signals [0.11184789007828977]
この作業では、フェデレートラーニング(FL)プライバシ保護方法論を使用して、高定義のECGの異種集合上でAIモデルをトレーニングする。
CL, IID, 非IIDアプローチを用いて訓練したモデルと比較した。
論文 参考訳(メタデータ) (2022-08-23T14:21:16Z) - Ultrasound Signal Processing: From Models to Deep Learning [64.56774869055826]
医用超音波画像は、信頼性と解釈可能な画像再構成を提供するために、高品質な信号処理に大きく依存している。
データ駆動方式で最適化されたディープラーニングベースの手法が人気を集めている。
比較的新しいパラダイムは、データ駆動型ディープラーニングの活用とドメイン知識の活用という2つのパワーを組み合わせたものだ。
論文 参考訳(メタデータ) (2022-04-09T13:04:36Z) - Conditional Generative Data Augmentation for Clinical Audio Datasets [36.45569352490318]
本稿では,重み付き条件付きWasserstein Generative Adversarial Networkに基づく臨床オーディオデータセットのための新しいデータ拡張手法を提案する。
本手法を検証するため,THA(Total Hipplasty)手術中に実世界の手術室で記録された臨床オーディオデータセットを作成した。
生成した強化サンプルによるトレーニングは、分類精度の点で古典的な音声強調法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-03-22T09:47:31Z) - The Imaginative Generative Adversarial Network: Automatic Data
Augmentation for Dynamic Skeleton-Based Hand Gesture and Human Action
Recognition [27.795763107984286]
本稿では、入力データの分布を近似し、この分布から新しいデータをサンプリングする新しい自動データ拡張モデルを提案する。
以上の結果から,拡張戦略は訓練が高速であり,ニューラルネットワークと最先端手法の両方の分類精度を向上させることが可能であることが示唆された。
論文 参考訳(メタデータ) (2021-05-27T11:07:09Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Generative Data Augmentation for Commonsense Reasoning [75.26876609249197]
G-DAUGCは、低リソース環境でより正確で堅牢な学習を実現することを目的とした、新しい生成データ拡張手法である。
G-DAUGCは、バックトランスレーションに基づく既存のデータ拡張手法を一貫して上回っている。
分析の結果,G-DAUGCは多種多様な流線型学習例を産出し,その選択と学習アプローチが性能向上に重要であることが示された。
論文 参考訳(メタデータ) (2020-04-24T06:12:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。