論文の概要: CycleGuardian: A Framework for Automatic RespiratorySound classification Based on Improved Deep clustering and Contrastive Learning
- arxiv url: http://arxiv.org/abs/2502.00734v1
- Date: Sun, 02 Feb 2025 09:56:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-05 14:56:15.429231
- Title: CycleGuardian: A Framework for Automatic RespiratorySound classification Based on Improved Deep clustering and Contrastive Learning
- Title(参考訳): CycleGuardian: 改良された深層クラスタリングとコントラスト学習に基づく自動呼吸音分類フレームワーク
- Authors: Yun Chu, Qiuhao Wang, Enze Zhou, Ling Fu, Qian Liu, Gang Zheng,
- Abstract要約: 早期の呼吸器および肺疾患の診断において,聴診は重要な役割を担っている。
既存の最先端モデルは過剰なパラメータサイズに悩まされており、リソース制約のあるモバイルプラットフォームへのデプロイを妨げている。
改良されたディープクラスタリングとコントラスト学習に基づくフレームワークを提案する。
われわれはこのネットワークをAndroidデバイスに展開し、総合的なインテリジェントな呼吸音聴取システムを示す。
- 参考スコア(独自算出の注目度): 9.215130010602634
- License:
- Abstract: Auscultation plays a pivotal role in early respiratory and pulmonary disease diagnosis. Despite the emergence of deep learning-based methods for automatic respiratory sound classification post-Covid-19, limited datasets impede performance enhancement. Distinguishing between normal and abnormal respiratory sounds poses challenges due to the coexistence of normal respiratory components and noise components in both types. Moreover, different abnormal respiratory sounds exhibit similar anomalous features, hindering their differentiation. Besides, existing state-of-the-art models suffer from excessive parameter size, impeding deployment on resource-constrained mobile platforms. To address these issues, we design a lightweight network CycleGuardian and propose a framework based on an improved deep clustering and contrastive learning. We first generate a hybrid spectrogram for feature diversity and grouping spectrograms to facilitating intermittent abnormal sound capture.Then, CycleGuardian integrates a deep clustering module with a similarity-constrained clustering component to improve the ability to capture abnormal features and a contrastive learning module with group mixing for enhanced abnormal feature discernment. Multi-objective optimization enhances overall performance during training. In experiments we use the ICBHI2017 dataset, following the official split method and without any pre-trained weights, our method achieves Sp: 82.06 $\%$, Se: 44.47$\%$, and Score: 63.26$\%$ with a network model size of 38M, comparing to the current model, our method leads by nearly 7$\%$, achieving the current best performances. Additionally, we deploy the network on Android devices, showcasing a comprehensive intelligent respiratory sound auscultation system.
- Abstract(参考訳): 早期の呼吸器および肺疾患の診断において,聴診は重要な役割を担っている。
ディープラーニングに基づく自動呼吸音分類法がCovid-19以降に出現したにもかかわらず、限られたデータセットは性能向上を妨げる。
正常な呼吸成分と異常な呼吸成分の共存により、正常な呼吸成分と異常な呼吸音の区別が困難となる。
さらに、異なる異常な呼吸音は、類似した異常な特徴を示し、その分化を妨げる。
さらに、既存の最先端モデルは過剰なパラメータサイズに悩まされており、リソース制約のあるモバイルプラットフォームへのデプロイを妨げている。
これらの問題に対処するため、我々は軽量ネットワークCycleGuardianを設計し、改良されたディープクラスタリングとコントラスト学習に基づくフレームワークを提案する。
そこでCycleGuardianは,間欠的な異常音の捕捉を容易にするために,特徴の多様性とグループ化のためのハイブリッド・スペクトログラムを作成し,類似性に制約のあるクラスタリング・コンポーネントと深層クラスタリング・モジュールを統合し,異常音の捕捉能力を向上させる。
マルチオブジェクト最適化は、トレーニング中の全体的なパフォーマンスを向上させる。
実験では、ICBHI2017データセットを使用し、公式な分割法に従い、トレーニング済みの重みなしでSp: 82.06$\%$、Se: 44.47$\%$、Score: 63.26$\%$を38Mのネットワークモデルサイズで達成し、現在のモデルと比較すると、我々のメソッドは7$$%$に近い結果となり、現在の最高のパフォーマンスを達成する。
さらに,Androidデバイスにネットワークを配置し,総合的なインテリジェントな呼吸音聴取システムを示す。
関連論文リスト
- Lungmix: A Mixup-Based Strategy for Generalization in Respiratory Sound Classification [3.879898053132466]
Lungmixは、Mixupにインスパイアされた、新しいデータ拡張テクニックである。
意味に基づいてラベルを補間しながら、大音量とランダムマスクを用いて波形をブレンドして拡張データを生成する。
4クラスの分類スコアを最大3.55%向上させ、ターゲットデータセット上で直接トレーニングされたモデルに匹敵するパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-12-29T12:44:13Z) - Adversarial Fine-tuning using Generated Respiratory Sound to Address
Class Imbalance [1.3686993145787067]
本稿では,条件付きニューラルボコーダとして音声拡散モデルを用いて,不均衡な呼吸音データを増やすための簡単なアプローチを提案する。
また, 合成音と実呼吸音の特徴を整合させ, 呼吸音の分類性能を向上させるために, 簡易かつ効果的な対向微調整法を実証した。
論文 参考訳(メタデータ) (2023-11-11T05:02:54Z) - Knowledge Diffusion for Distillation [53.908314960324915]
知識蒸留(KD)における教師と学生の表現ギャップ
これらの手法の本質は、ノイズ情報を捨て、その特徴の貴重な情報を蒸留することである。
DiffKDと呼ばれる新しいKD手法を提案し、拡散モデルを用いて特徴を明示的に識別し一致させる。
論文 参考訳(メタデータ) (2023-05-25T04:49:34Z) - Fuzzy Attention Neural Network to Tackle Discontinuity in Airway
Segmentation [67.19443246236048]
気道セグメンテーションは肺疾患の検査、診断、予後に重要である。
いくつかの小型の気道支線(気管支や終端など)は自動セグメンテーションの難しさを著しく増す。
本稿では,新しいファジィアテンションニューラルネットワークと包括的損失関数を備える,気道セグメンテーションの効率的な手法を提案する。
論文 参考訳(メタデータ) (2022-09-05T16:38:13Z) - Exploring Self-Supervised Representation Ensembles for COVID-19 Cough
Classification [5.469841541565308]
そこで本研究では,新しい自己教師付き学習フレームワークを提案する。
非ラベルデータでトランスフォーマベースの特徴エンコーダを訓練するために、コントラストプレトレーニングフェーズを導入する。
提案したコントラスト事前学習,ランダムマスキング機構,アンサンブルアーキテクチャが,コークス分類性能の向上に寄与していることを示す。
論文 参考訳(メタデータ) (2021-05-17T01:27:20Z) - Detecting COVID-19 from Breathing and Coughing Sounds using Deep Neural
Networks [68.8204255655161]
私たちは、Convolutional Neural Networksのアンサンブルを適応させて、スピーカーがCOVID-19に感染しているかどうかを分類します。
最終的には、74.9%のUnweighted Average Recall(UAR)、またはニューラルネットワークをアンサンブルすることで、ROC曲線(AUC)の80.7%を達成する。
論文 参考訳(メタデータ) (2020-12-29T01:14:17Z) - Capturing scattered discriminative information using a deep architecture
in acoustic scene classification [49.86640645460706]
本研究では,識別情報を捕捉し,同時に過度に適合する問題を緩和する様々な手法について検討する。
我々は、ディープニューラルネットワークにおける従来の非線形アクティベーションを置き換えるために、Max Feature Map法を採用する。
2つのデータ拡張方法と2つの深いアーキテクチャモジュールは、システムの過度な適合を減らし、差別的なパワーを維持するためにさらに検討されている。
論文 参考訳(メタデータ) (2020-07-09T08:32:06Z) - Deep Neural Network for Respiratory Sound Classification in Wearable
Devices Enabled by Patient Specific Model Tuning [2.8935588665357077]
メル・スペクトログラムに基づく呼吸音を分類する深層CNN-RNNモデルを提案する。
また、まず呼吸器患者をスクリーニングし、次いで患者固有の分類モデルを構築する患者特化モデルチューニング戦略を実装した。
The proposed hybrid CNN-RNN model achieves 66.31% on four-class classification of breath cycles for ICBHI'17 scientific challenge respiratory sound database。
論文 参考訳(メタデータ) (2020-04-16T15:42:58Z) - Simultaneous Denoising and Dereverberation Using Deep Embedding Features [64.58693911070228]
ディープ埋め込み特徴を用いた同時発声・発声同時学習法を提案する。
ノイズ発生段階では、DCネットワークを利用してノイズのないディープ埋込み特性を抽出する。
残響段階では、教師なしのK平均クラスタリングアルゴリズムの代わりに、別のニューラルネットワークを用いて無響音声を推定する。
論文 参考訳(メタデータ) (2020-04-06T06:34:01Z) - CNN-MoE based framework for classification of respiratory anomalies and
lung disease detection [33.45087488971683]
本稿では,聴取分析のための頑健な深層学習フレームワークを提示し,検討する。
呼吸周期の異常を分類し、呼吸音の記録から病気を検出することを目的としている。
論文 参考訳(メタデータ) (2020-04-04T21:45:06Z) - Rectified Meta-Learning from Noisy Labels for Robust Image-based Plant
Disease Diagnosis [64.82680813427054]
植物病は食料安全保障と作物生産に対する主要な脅威の1つである。
1つの一般的なアプローチは、葉画像分類タスクとしてこの問題を変換し、強力な畳み込みニューラルネットワーク(CNN)によって対処できる。
本稿では,正規化メタ学習モジュールを共通CNNパラダイムに組み込んだ新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-17T09:51:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。