論文の概要: Audio MFCC-gram Transformers for respiratory insufficiency detection in
COVID-19
- arxiv url: http://arxiv.org/abs/2210.14085v1
- Date: Tue, 25 Oct 2022 15:11:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-26 16:26:07.981690
- Title: Audio MFCC-gram Transformers for respiratory insufficiency detection in
COVID-19
- Title(参考訳): COVID-19における呼吸不全検出のためのMFCC-gram変換器
- Authors: Marcelo Matheus Gauy and Marcelo Finger
- Abstract要約: 本研究は,バイオマーカーとしての音声を探索し,音声サンプルの分析により呼吸不全(RI)の検出について検討する。
以前の研究は、呼吸器不全の患者発話のデータセットを構築し、畳み込みニューラルネットワークを用いて分析した。
本稿では,Transformer ニューラルネットワークアーキテクチャが RI 検出の性能を向上する方法について検討する。
- 参考スコア(独自算出の注目度): 3.6042575355093907
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This work explores speech as a biomarker and investigates the detection of
respiratory insufficiency (RI) by analyzing speech samples. Previous work
\cite{spira2021} constructed a dataset of respiratory insufficiency COVID-19
patient utterances and analyzed it by means of a convolutional neural network
achieving an accuracy of $87.04\%$, validating the hypothesis that one can
detect RI through speech. Here, we study how Transformer neural network
architectures can improve the performance on RI detection. This approach
enables construction of an acoustic model. By choosing the correct pretraining
technique, we generate a self-supervised acoustic model, leading to improved
performance ($96.53\%$) of Transformers for RI detection.
- Abstract(参考訳): 本研究は, バイオマーカーとしての発話を探索し, 音声サンプル分析による呼吸不全(ri)の検出について検討する。
以前の研究 \cite{spira2021} は、呼吸器不全 COVID-19 患者の発話のデータセットを構築し、畳み込みニューラルネットワークを用いて分析し、音声を通してRIを検出できるという仮説を検証した。
本稿では,Transformer ニューラルネットワークアーキテクチャが RI 検出の性能を向上する方法について検討する。
このアプローチは音響モデルの構築を可能にする。
正しい事前学習手法を選択することで、自己教師付き音響モデルを生成し、RI検出のためのトランスフォーマーの性能(96.53\%$)を向上させる。
関連論文リスト
- Rene: A Pre-trained Multi-modal Architecture for Auscultation of Respiratory Diseases [5.810320353233697]
本稿では,呼吸音の認識に適した大規模モデルであるReneを紹介する。
我々の革新的なアプローチは、事前訓練された音声認識モデルを用いて呼吸音を処理している。
我々は,Reneアーキテクチャを用いた実時間呼吸音識別システムを開発した。
論文 参考訳(メタデータ) (2024-05-13T03:00:28Z) - CathFlow: Self-Supervised Segmentation of Catheters in Interventional Ultrasound Using Optical Flow and Transformers [66.15847237150909]
縦型超音波画像におけるカテーテルのセグメンテーションのための自己教師型ディープラーニングアーキテクチャを提案する。
ネットワークアーキテクチャは、Attention in Attentionメカニズムで構築されたセグメンテーショントランスフォーマであるAiAReSeg上に構築されている。
我々は,シリコンオルタファントムから収集した合成データと画像からなる実験データセット上で,我々のモデルを検証した。
論文 参考訳(メタデータ) (2024-03-21T15:13:36Z) - Fully Automated End-to-End Fake Audio Detection [57.78459588263812]
本稿では,完全自動エンドツーエンド音声検出手法を提案する。
まず、wav2vec事前学習モデルを用いて、音声の高レベル表現を得る。
ネットワーク構造には, Light-DARTS という異種アーキテクチャサーチ (DARTS) の修正版を用いる。
論文 参考訳(メタデータ) (2022-08-20T06:46:55Z) - Image Synthesis with Disentangled Attributes for Chest X-Ray Nodule
Augmentation and Detection [52.93342510469636]
肺癌早期検診では胸部X線像の肺結節検出が一般的である。
ディープラーニングに基づくコンピュータ支援診断(CAD)システムは、CXRの結節スクリーニングのために放射線科医をサポートすることができる。
このようなデータセットの可用性を損なうため,データ拡張のために肺結節合成法を提案する。
論文 参考訳(メタデータ) (2022-07-19T16:38:48Z) - Interpretable Acoustic Representation Learning on Breathing and Speech
Signals for COVID-19 Detection [37.01066509527848]
本稿では,新型コロナウイルス検出作業における音声信号の表現学習のアプローチについて述べる。
生音声サンプルは、コサイン変調ガウス関数としてパラメータ化される1次元畳み込みフィルタのバンクで処理される。
フィルタされた出力は、プールされ、ログ圧縮され、自己アテンションベースの関連重み付け機構で使用される。
論文 参考訳(メタデータ) (2022-06-27T15:20:51Z) - Preservation of High Frequency Content for Deep Learning-Based Medical
Image Classification [74.84221280249876]
大量の胸部ラジオグラフィーの効率的な分析は、医師や放射線技師を助けることができる。
本稿では,視覚情報の効率的な識別と符号化のための離散ウェーブレット変換(DWT)を提案する。
論文 参考訳(メタデータ) (2022-05-08T15:29:54Z) - EIHW-MTG DiCOVA 2021 Challenge System Report [2.3544007354006706]
本研究の目的は、うずまに埋め込まれた音響情報を分析することで、COVID-19患者を自動的に検出することである。
本研究は、新型コロナウイルスがこれらの信号の周波数量を変化させるかどうかを調べることを目的として、試料の分光図表現の分析に焦点をあてる。
論文 参考訳(メタデータ) (2021-10-13T07:38:54Z) - An Approach Towards Physics Informed Lung Ultrasound Image Scoring
Neural Network for Diagnostic Assistance in COVID-19 [0.0]
肺超音波(LUS)における胸膜下領域の音響伝搬に基づく特徴抽出のための新しいアプローチが提示された。
LUSNetと呼ばれるニューラルネットワークは、LUSイメージを、新型コロナウイルスの進行を追跡するために、肺感染症の重症度の異なる5つのクラスに分類するように訓練されている。
新型コロナウイルスの患者10名に対する全回復期間に対するLUS画像のアプローチに関する詳細な分析では、平均5倍のクロスバリデーション精度、感度、特異性はそれぞれ5000コマで97%、93%、98%となっている。
論文 参考訳(メタデータ) (2021-06-13T13:01:53Z) - Detecting COVID-19 from Breathing and Coughing Sounds using Deep Neural
Networks [68.8204255655161]
私たちは、Convolutional Neural Networksのアンサンブルを適応させて、スピーカーがCOVID-19に感染しているかどうかを分類します。
最終的には、74.9%のUnweighted Average Recall(UAR)、またはニューラルネットワークをアンサンブルすることで、ROC曲線(AUC)の80.7%を達成する。
論文 参考訳(メタデータ) (2020-12-29T01:14:17Z) - Cross-domain Adaptation with Discrepancy Minimization for
Text-independent Forensic Speaker Verification [61.54074498090374]
本研究では,複数の音響環境下で収集したCRSS-Forensicsオーディオデータセットを紹介する。
我々は、VoxCelebデータを用いてCNNベースのネットワークを事前訓練し、次に、CRSS-Forensicsのクリーンな音声で高レベルのネットワーク層の一部を微調整するアプローチを示す。
論文 参考訳(メタデータ) (2020-09-05T02:54:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。