論文の概要: Abnormal Respiratory Sound Identification Using Audio-Spectrogram Vision Transformer
- arxiv url: http://arxiv.org/abs/2405.08342v1
- Date: Tue, 14 May 2024 06:31:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-15 14:58:01.185088
- Title: Abnormal Respiratory Sound Identification Using Audio-Spectrogram Vision Transformer
- Title(参考訳): オーディオ・スペクトログラム・ビジョン・トランスを用いた呼吸音の異常同定
- Authors: Whenty Ariyanti, Kai-Chun Liu, Kuan-Yu Chen, Yu Tsao,
- Abstract要約: AS-ViT法は3つの指標を用いて評価され、60:40分割比が79.1%、59.8%、80:20分割比が86.4%、69.3%となった。
提案手法は3つの指標を用いて評価し,60:40分割比79.1%,59.8%,80:20分割比86.4%,69.3%を得た。
- 参考スコア(独自算出の注目度): 19.993594487490682
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Respiratory disease, the third leading cause of deaths globally, is considered a high-priority ailment requiring significant research on identification and treatment. Stethoscope-recorded lung sounds and artificial intelligence-powered devices have been used to identify lung disorders and aid specialists in making accurate diagnoses. In this study, audio-spectrogram vision transformer (AS-ViT), a new approach for identifying abnormal respiration sounds, was developed. The sounds of the lungs are converted into visual representations called spectrograms using a technique called short-time Fourier transform (STFT). These images are then analyzed using a model called vision transformer to identify different types of respiratory sounds. The classification was carried out using the ICBHI 2017 database, which includes various types of lung sounds with different frequencies, noise levels, and backgrounds. The proposed AS-ViT method was evaluated using three metrics and achieved 79.1% and 59.8% for 60:40 split ratio and 86.4% and 69.3% for 80:20 split ratio in terms of unweighted average recall and overall scores respectively for respiratory sound detection, surpassing previous state-of-the-art results.
- Abstract(参考訳): 世界第3位の死因である呼吸器疾患は、身元確認と治療に関する重要な研究を必要とする重篤な疾患であると考えられている。
ステソスコープで記録された肺の音と人工知能を利用した装置は、肺疾患を特定し、正確な診断を行うための専門家を助けるために使われてきた。
本研究では, 異常呼吸音を識別する新しい手法であるAS-ViTを開発した。
肺の音は、短時間フーリエ変換(STFT)と呼ばれる技術を用いて、分光図と呼ばれる視覚表現に変換される。
これらの画像は、視覚変換器と呼ばれるモデルを用いて分析され、異なる種類の呼吸音を識別する。
この分類は、周波数、騒音レベル、背景の異なる様々な種類の肺音を含むICBHI 2017データベースを用いて行われた。
提案手法は3つの測定値を用いて評価し,60:40分割比79.1%,59.8%,80:20分割比86.4%,69.3%,呼吸音検出率0。
関連論文リスト
- Machine Learning-based Estimation of Respiratory Fluctuations in a Healthy Adult Population using BOLD fMRI and Head Motion Parameters [39.96015789655091]
多くのfMRI研究では、呼吸信号が欠如しているか、品質が悪いことがしばしばある。
周辺記録装置を必要とせずに、fMRIデータから直接呼吸変動(RV)波形を抽出するツールを持つことは、非常に有益である。
本研究では,頭部運動パラメータとBOLD信号を用いたRV波形再構成のためのCNNモデルを提案する。
論文 参考訳(メタデータ) (2024-04-30T21:53:11Z) - Patch-Mix Contrastive Learning with Audio Spectrogram Transformer on
Respiratory Sound Classification [19.180927437627282]
本稿では,潜在空間における混合表現を識別するために,新規かつ効果的なパッチ・ミクス・コントラスト学習を提案する。
提案手法はICBHIデータセット上での最先端性能を実現し,4.08%の改善により先行先行スコアを上回った。
論文 参考訳(メタデータ) (2023-05-23T13:04:07Z) - Transfer Learning Based Diagnosis and Analysis of Lung Sound Aberrations [0.35232085374661276]
本研究は、聴診器と音声記録ソフトウェアによって得られた呼吸音を非侵襲的に識別する手法を開発することを目的とする。
各オーディオサンプルの視覚的表現が構築され、視覚を効果的に記述するために使用されるような方法を用いて、分類のためのリソース識別が可能である。
呼吸音響データベースは、95%の精度、88%の精度、86%のリコールスコア、81%のF1スコアを含む最先端の結果を得た。
論文 参考訳(メタデータ) (2023-03-15T04:46:57Z) - Validated respiratory drug deposition predictions from 2D and 3D medical
images with statistical shape models and convolutional neural networks [47.187609203210705]
患者固有の沈着モデリングのための自動計算フレームワークを開発し,検証することを目的としている。
2次元胸部X線と3次元CT画像から3次元患者の呼吸動態を生成できる画像処理手法が提案されている。
論文 参考訳(メタデータ) (2023-03-02T07:47:07Z) - The role of noise in denoising models for anomaly detection in medical
images [62.0532151156057]
病理脳病変は脳画像に多彩な外観を示す。
正規データのみを用いた教師なし異常検出手法が提案されている。
空間分解能の最適化と雑音の大きさの最適化により,異なるモデル学習体制の性能が向上することを示す。
論文 参考訳(メタデータ) (2023-01-19T21:39:38Z) - Preservation of High Frequency Content for Deep Learning-Based Medical
Image Classification [74.84221280249876]
大量の胸部ラジオグラフィーの効率的な分析は、医師や放射線技師を助けることができる。
本稿では,視覚情報の効率的な識別と符号化のための離散ウェーブレット変換(DWT)を提案する。
論文 参考訳(メタデータ) (2022-05-08T15:29:54Z) - Fused Audio Instance and Representation for Respiratory Disease
Detection [0.6827423171182154]
呼吸器疾患の検出方法としてFAIR(Fused Audio Instance and Representation)を提案する。
体音の波形とスペクトログラムの表現を組み合わせることで、COVID-19検出のユースケースについて実験を行った。
論文 参考訳(メタデータ) (2022-04-22T09:01:29Z) - The Diagnosis of Asthma using Hilbert-Huang Transform and Deep Learning
on Lung Sounds [2.294014185517203]
ヒルベルト変換を肺音に適用することにより抽出される固有モード関数から統計的特徴を算出した。
喘息および健常者からの肺音の分類はDeep Belief Networks(DBN)を用いて行われる。
論文 参考訳(メタデータ) (2021-01-20T19:04:33Z) - Inception-Based Network and Multi-Spectrogram Ensemble Applied For
Predicting Respiratory Anomalies and Lung Diseases [16.318395700171624]
本稿では,呼吸音入力を用いた肺疾患検出のためのインセプションベースディープニューラルネットワークを提案する。
患者から収集された呼吸音の記録はスペクトログラムに変換され、スペクトル情報と時間情報の両方が提示される。
これらのスペクトログラムは、肺関連疾患に罹患する患者を検出するために、バックエンド分類と呼ばれる提案されたネットワークに供給される。
論文 参考訳(メタデータ) (2020-12-26T08:25:02Z) - Identification of deep breath while moving forward based on multiple
body regions and graph signal analysis [45.62293065676075]
本稿では,世界深度カメラを通り過ぎているときの深呼吸を自動的に識別できる非閉塞性ソリューションを提案する。
検証実験において、提案手法は、それぞれ75.5%、76.2%、75.0%、75.2%の精度、精度、リコール、F1の比較手法よりも優れている。
論文 参考訳(メタデータ) (2020-10-20T08:26:50Z) - Machine-Learning-Based Multiple Abnormality Prediction with Large-Scale
Chest Computed Tomography Volumes [64.21642241351857]
19,993症例から36,316巻の胸部CTデータセットを収集,解析した。
自由テキストラジオグラフィーレポートから異常ラベルを自動的に抽出するルールベース手法を開発した。
胸部CTボリュームの多臓器・多臓器分類モデルも開発した。
論文 参考訳(メタデータ) (2020-02-12T00:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。