論文の概要: Patch-Mix Contrastive Learning with Audio Spectrogram Transformer on
Respiratory Sound Classification
- arxiv url: http://arxiv.org/abs/2305.14032v4
- Date: Wed, 22 Nov 2023 07:01:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-23 19:04:51.856441
- Title: Patch-Mix Contrastive Learning with Audio Spectrogram Transformer on
Respiratory Sound Classification
- Title(参考訳): 呼吸音分類における音声スペクトログラムトランスフォーマを用いたパッチミックスコントラスト学習
- Authors: Sangmin Bae, June-Woo Kim, Won-Yang Cho, Hyerim Baek, Soyoun Son,
Byungjo Lee, Changwan Ha, Kyongpil Tae, Sungnyun Kim, Se-Young Yun
- Abstract要約: 本稿では,潜在空間における混合表現を識別するために,新規かつ効果的なパッチ・ミクス・コントラスト学習を提案する。
提案手法はICBHIデータセット上での最先端性能を実現し,4.08%の改善により先行先行スコアを上回った。
- 参考スコア(独自算出の注目度): 19.180927437627282
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Respiratory sound contains crucial information for the early diagnosis of
fatal lung diseases. Since the COVID-19 pandemic, there has been a growing
interest in contact-free medical care based on electronic stethoscopes. To this
end, cutting-edge deep learning models have been developed to diagnose lung
diseases; however, it is still challenging due to the scarcity of medical data.
In this study, we demonstrate that the pretrained model on large-scale visual
and audio datasets can be generalized to the respiratory sound classification
task. In addition, we introduce a straightforward Patch-Mix augmentation, which
randomly mixes patches between different samples, with Audio Spectrogram
Transformer (AST). We further propose a novel and effective Patch-Mix
Contrastive Learning to distinguish the mixed representations in the latent
space. Our method achieves state-of-the-art performance on the ICBHI dataset,
outperforming the prior leading score by an improvement of 4.08%.
- Abstract(参考訳): 呼吸音は致命的な肺疾患の早期診断に重要な情報を含んでいる。
新型コロナウイルス(COVID-19)のパンデミック以降、電子聴診器に基づく非接触医療への関心が高まっている。
この目的のために、最先端の深層学習モデルが肺疾患の診断のために開発されたが、医療データの不足のため、依然として困難である。
本研究では,大規模視覚および音声データセットにおける事前学習モデルが呼吸音分類タスクに一般化できることを実証する。
さらに,Audio Spectrogram Transformer (AST) を用いて,異なるサンプル間のパッチをランダムに混合する,単純なPatch-Mix Augmentationを導入する。
さらに,潜在空間における混合表現を識別する新しいパッチ混合コントラスト学習を提案する。
提案手法はICBHIデータセット上での最先端性能を実現し,4.08%の改善により先行先行スコアを上回った。
関連論文リスト
- Stethoscope-guided Supervised Contrastive Learning for Cross-domain
Adaptation on Respiratory Sound Classification [1.690115983364313]
本稿では、ソースドメインから異なるターゲットドメインに知識を転送するクロスドメイン適応手法を提案する。
特に、個々の領域として異なる聴診器タイプを考慮し、新しい聴診器誘導型教師付きコントラスト学習手法を提案する。
ICBHIデータセットの実験結果から,提案手法はドメイン依存性の低減とICBHIスコア61.71%の達成に有効であることが示された。
論文 参考訳(メタデータ) (2023-12-15T08:34:31Z) - Adversarial Fine-tuning using Generated Respiratory Sound to Address
Class Imbalance [1.3686993145787067]
本稿では,条件付きニューラルボコーダとして音声拡散モデルを用いて,不均衡な呼吸音データを増やすための簡単なアプローチを提案する。
また, 合成音と実呼吸音の特徴を整合させ, 呼吸音の分類性能を向上させるために, 簡易かつ効果的な対向微調整法を実証した。
論文 参考訳(メタデータ) (2023-11-11T05:02:54Z) - Audio-Based Classification of Respiratory Diseases using Advanced Signal
Processing and Machine Learning for Assistive Diagnosis Support [1.9049294570026933]
我々の研究は、機械学習モデルをトレーニングするために、呼吸音の医用データベースとして最大規模のものを採用することに焦点を当てている。
実験モード分解とスペクトル分析を用いて,音響データから生理的関連バイオシグナーを抽出する。
健常者と疾患の鑑別において,バランスの取れた精度が87%のバイナリ分類モデルを用いている。
論文 参考訳(メタデータ) (2023-09-12T23:54:00Z) - Instrumental Variable Learning for Chest X-ray Classification [52.68170685918908]
本稿では,素因果関係を排除し,正確な因果表現を得るための解釈可能な機器変数(IV)学習フレームワークを提案する。
提案手法の性能はMIMIC-CXR,NIH ChestX-ray 14,CheXpertデータセットを用いて実証した。
論文 参考訳(メタデータ) (2023-05-20T03:12:23Z) - A Semi-Supervised Algorithm for Improving the Consistency of
Crowdsourced Datasets: The COVID-19 Case Study on Respiratory Disorder
Classification [4.431270735024064]
聴覚信号の分類は、新型コロナウイルス(COVID-19)などの呼吸器疾患のスクリーニングに有用なツールである。
多くの研究チームは、COUGHVIDデータセットを生成するために行われたように、音声データを素早く収集するためにクラウドソーシングに移行した。
COUGHVIDデータセットは、専門家の医師に、限られた数のアップロードされた記録に存在する基礎疾患の診断を依頼した。
この研究は、半教師付き学習(SSL)アプローチを使用して、COUGHVIDデータセットのラベル付け一貫性を改善し、新型コロナウイルスの健全な音分類に対する堅牢性を向上させる。
論文 参考訳(メタデータ) (2022-09-09T15:44:26Z) - Preservation of High Frequency Content for Deep Learning-Based Medical
Image Classification [74.84221280249876]
大量の胸部ラジオグラフィーの効率的な分析は、医師や放射線技師を助けることができる。
本稿では,視覚情報の効率的な識別と符号化のための離散ウェーブレット変換(DWT)を提案する。
論文 参考訳(メタデータ) (2022-05-08T15:29:54Z) - CoRSAI: A System for Robust Interpretation of CT Scans of COVID-19
Patients Using Deep Learning [133.87426554801252]
我々は,深部畳み込み神経網のアンサンブルを用いた肺CTスキャンのセグメンテーションによるアプローチを採用した。
本モデルを用いて, 病変の分類, 患者の動態の評価, 病変による肺の相対体積の推定, 肺の損傷ステージの評価が可能となった。
論文 参考訳(メタデータ) (2021-05-25T12:06:55Z) - Exploring Self-Supervised Representation Ensembles for COVID-19 Cough
Classification [5.469841541565308]
そこで本研究では,新しい自己教師付き学習フレームワークを提案する。
非ラベルデータでトランスフォーマベースの特徴エンコーダを訓練するために、コントラストプレトレーニングフェーズを導入する。
提案したコントラスト事前学習,ランダムマスキング機構,アンサンブルアーキテクチャが,コークス分類性能の向上に寄与していることを示す。
論文 参考訳(メタデータ) (2021-05-17T01:27:20Z) - Quantification of pulmonary involvement in COVID-19 pneumonia by means
of a cascade oftwo U-nets: training and assessment on multipledatasets using
different annotation criteria [83.83783947027392]
本研究は、新型コロナウイルスの肺病変の同定、セグメント化、定量化のために人工知能(AI)を活用することを目的とする。
2つのU-netのカスケードをベースとした自動解析パイプラインLungQuantシステムを開発した。
LungQuantシステムにおけるCT-Severity Score(CT-SS)の精度も評価した。
論文 参考訳(メタデータ) (2021-05-06T10:21:28Z) - Variational Knowledge Distillation for Disease Classification in Chest
X-Rays [102.04931207504173]
我々は,X線に基づく疾患分類のための新しい確率的推論フレームワークである反復的知識蒸留(VKD)を提案する。
提案手法の有効性を,X線画像とEHRを用いた3つの公開ベンチマークデータセットに示す。
論文 参考訳(メタデータ) (2021-03-19T14:13:56Z) - Detecting COVID-19 from Breathing and Coughing Sounds using Deep Neural
Networks [68.8204255655161]
私たちは、Convolutional Neural Networksのアンサンブルを適応させて、スピーカーがCOVID-19に感染しているかどうかを分類します。
最終的には、74.9%のUnweighted Average Recall(UAR)、またはニューラルネットワークをアンサンブルすることで、ROC曲線(AUC)の80.7%を達成する。
論文 参考訳(メタデータ) (2020-12-29T01:14:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。