論文の概要: Lungmix: A Mixup-Based Strategy for Generalization in Respiratory Sound Classification
- arxiv url: http://arxiv.org/abs/2501.00064v1
- Date: Sun, 29 Dec 2024 12:44:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-05 20:43:20.506913
- Title: Lungmix: A Mixup-Based Strategy for Generalization in Respiratory Sound Classification
- Title(参考訳): Lungmix: 呼吸音の分類における一般化のための混合型戦略
- Authors: Shijia Ge, Weixiang Zhang, Shuzhao Xie, Baixu Yan, Zhi Wang,
- Abstract要約: Lungmixは、Mixupにインスパイアされた、新しいデータ拡張テクニックである。
意味に基づいてラベルを補間しながら、大音量とランダムマスクを用いて波形をブレンドして拡張データを生成する。
4クラスの分類スコアを最大3.55%向上させ、ターゲットデータセット上で直接トレーニングされたモデルに匹敵するパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 3.879898053132466
- License:
- Abstract: Respiratory sound classification plays a pivotal role in diagnosing respiratory diseases. While deep learning models have shown success with various respiratory sound datasets, our experiments indicate that models trained on one dataset often fail to generalize effectively to others, mainly due to data collection and annotation \emph{inconsistencies}. To address this limitation, we introduce \emph{Lungmix}, a novel data augmentation technique inspired by Mixup. Lungmix generates augmented data by blending waveforms using loudness and random masks while interpolating labels based on their semantic meaning, helping the model learn more generalized representations. Comprehensive evaluations across three datasets, namely ICBHI, SPR, and HF, demonstrate that Lungmix significantly enhances model generalization to unseen data. In particular, Lungmix boosts the 4-class classification score by up to 3.55\%, achieving performance comparable to models trained directly on the target dataset.
- Abstract(参考訳): 呼吸音分類は呼吸器疾患の診断において重要な役割を担っている。
深層学習モデルは様々な呼吸音データセットで成功しているが,本実験では,データ収集やアノテーションが原因で,あるデータセットで訓練されたモデルが他のデータセットに効果的に一般化できない場合が多いことを示唆している。
この制限に対処するために、Mixupにインスパイアされた新しいデータ拡張技術である \emph{Lungmix} を紹介する。
Lungmixは、大音量とランダムマスクを使って波形をブレンドし、意味に基づくラベルを補間することで拡張データを生成し、モデルがより一般化された表現を学習するのに役立つ。
ICBHI(英語版)、SPR(英語版)、HF(英語版)の3つのデータセットの総合的な評価は、Lungmixがモデル一般化を未確認のデータに大きく拡張することを示した。
特に、Lungmixは4クラスの分類スコアを最大3.55\%向上させ、ターゲットデータセット上で直接トレーニングされたモデルに匹敵するパフォーマンスを達成する。
関連論文リスト
- RespLLM: Unifying Audio and Text with Multimodal LLMs for Generalized Respiratory Health Prediction [20.974460332254544]
RespLLMは、呼吸健康予測のためのテキストと音声の表現を統一する新しいフレームワークである。
我々の研究は、異種データの知覚、聴取、理解が可能なマルチモーダルモデルの基礎を築いた。
論文 参考訳(メタデータ) (2024-10-07T17:06:11Z) - Learning with Noisy Foundation Models [95.50968225050012]
本論文は、事前学習データセットにおけるノイズの性質を包括的に理解し分析する最初の研究である。
雑音の悪影響を緩和し、一般化を改善するため、特徴空間に適応するチューニング法(NMTune)を提案する。
論文 参考訳(メタデータ) (2024-03-11T16:22:41Z) - Adversarial Fine-tuning using Generated Respiratory Sound to Address
Class Imbalance [1.3686993145787067]
本稿では,条件付きニューラルボコーダとして音声拡散モデルを用いて,不均衡な呼吸音データを増やすための簡単なアプローチを提案する。
また, 合成音と実呼吸音の特徴を整合させ, 呼吸音の分類性能を向上させるために, 簡易かつ効果的な対向微調整法を実証した。
論文 参考訳(メタデータ) (2023-11-11T05:02:54Z) - Patch-Mix Contrastive Learning with Audio Spectrogram Transformer on Respiratory Sound Classification [18.56326840619165]
本稿では,潜在空間における混合表現を識別するために,新規かつ効果的なパッチ・ミクス・コントラスト学習を提案する。
提案手法はICBHIデータセット上での最先端性能を実現し,4.08%の改善により先行先行スコアを上回った。
論文 参考訳(メタデータ) (2023-05-23T13:04:07Z) - Self-Evolution Learning for Mixup: Enhance Data Augmentation on Few-Shot
Text Classification Tasks [75.42002070547267]
テキスト分類におけるデータ拡張のための自己進化学習(SE)に基づくミックスアップ手法を提案する。
モデル出力と原サンプルの1つのホットラベルを線形に補間して,新しい軟質なラベル混在を生成する,新しいインスタンス固有ラベル平滑化手法を提案する。
論文 参考訳(メタデータ) (2023-05-22T23:43:23Z) - Boosting Differentiable Causal Discovery via Adaptive Sample Reweighting [62.23057729112182]
異なるスコアに基づく因果探索法は観測データから有向非巡回グラフを学習する。
本稿では,Reweighted Score関数ReScoreの適応重みを動的に学習することにより因果発見性能を向上させるためのモデルに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-06T14:49:59Z) - ScoreMix: A Scalable Augmentation Strategy for Training GANs with
Limited Data [93.06336507035486]
GAN(Generative Adversarial Networks)は通常、限られたトレーニングデータが利用できる場合、過度に適合する。
ScoreMixは、様々な画像合成タスクのための、新しくスケーラブルなデータ拡張手法である。
論文 参考訳(メタデータ) (2022-10-27T02:55:15Z) - DoubleMix: Simple Interpolation-Based Data Augmentation for Text
Classification [56.817386699291305]
本稿では,DoubleMixと呼ばれる単純なデータ拡張手法を提案する。
DoubleMixはまず、トレーニングデータごとにいくつかの摂動サンプルを生成する。
次に、摂動データと元のデータを使って、隠れたニューラルネットワークの空間で2段階のステップを実行する。
論文 参考訳(メタデータ) (2022-09-12T15:01:04Z) - Lung Sound Classification Using Co-tuning and Stochastic Normalization [26.399917342840265]
事前学習されたモデルの知識は、バニラファインチューニング、コチューニング、正規化、コチューニングと正規化の組み合わせを用いて伝達される。
提案システムは, 両データセットの異常な肺音と呼吸器疾患に対して, 最先端の肺音分類システムよりも優れていた。
論文 参考訳(メタデータ) (2021-08-04T12:16:02Z) - Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。
我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。
その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文 参考訳(メタデータ) (2020-10-12T03:27:07Z) - CNN-MoE based framework for classification of respiratory anomalies and
lung disease detection [33.45087488971683]
本稿では,聴取分析のための頑健な深層学習フレームワークを提示し,検討する。
呼吸周期の異常を分類し、呼吸音の記録から病気を検出することを目的としている。
論文 参考訳(メタデータ) (2020-04-04T21:45:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。