論文の概要: Interpreting glottal flow dynamics for detecting COVID-19 from voice
- arxiv url: http://arxiv.org/abs/2010.16318v1
- Date: Thu, 29 Oct 2020 13:16:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-02 00:10:21.742906
- Title: Interpreting glottal flow dynamics for detecting COVID-19 from voice
- Title(参考訳): 音声からのCOVID-19検出のための声門血流動態の解釈
- Authors: Soham Deshmukh, Mahmoud Al Ismail, Rita Singh
- Abstract要約: 本稿では声門流波形(GFW)の発声時の微分力学を解析する手法を提案する。
録音音声信号から推定し,音素モデルから計算したGFWと比較する。
提案手法は,2つのGFWの差分において時間空間内の異常を検出するCNNベースの2ステップアテンションモデルを用いている。
- 参考スコア(独自算出の注目度): 18.387162887917164
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the pathogenesis of COVID-19, impairment of respiratory functions is often
one of the key symptoms. Studies show that in these cases, voice production is
also adversely affected -- vocal fold oscillations are asynchronous,
asymmetrical and more restricted during phonation. This paper proposes a method
that analyzes the differential dynamics of the glottal flow waveform (GFW)
during voice production to identify features in them that are most significant
for the detection of COVID-19 from voice. Since it is hard to measure this
directly in COVID-19 patients, we infer it from recorded speech signals and
compare it to the GFW computed from physical model of phonation. For normal
voices, the difference between the two should be minimal, since physical models
are constructed to explain phonation under assumptions of normalcy. Greater
differences implicate anomalies in the bio-physical factors that contribute to
the correctness of the physical model, revealing their significance indirectly.
Our proposed method uses a CNN-based 2-step attention model that locates
anomalies in time-feature space in the difference of the two GFWs, allowing us
to infer their potential as discriminative features for classification. The
viability of this method is demonstrated using a clinically curated dataset of
COVID-19 positive and negative subjects.
- Abstract(参考訳): 新型コロナウイルスの病原性では、呼吸機能の障害はしばしば重要な症状の1つである。
これらのケースでは、声帯の振動は非同期であり、非対称であり、発声中はより制限される。
本稿では,声道内における声門流波形(GFW)の動態を解析し,音声からのCOVID-19検出において最も重要な特徴を同定する手法を提案する。
新型コロナウイルス患者では直接測定することは困難であるため、録音された音声信号から推測し、物理モデルを用いて計算したGFWと比較する。
通常の声では、物理モデルが正規性の仮定の下での発声を説明するために構築されるため、両者の違いは最小限にすべきである。
より大きな差異は、物理的モデルの正しさに寄与する生体物理因子の異常を引き起こし、それらの意義を間接的に明らかにする。
提案手法は,2つのGFWの差分における時間空間の異常を検出するCNNベースの2ステップアテンションモデルを用いて,その可能性を識別的特徴として推定する。
本手法の有効性は、新型コロナウイルス陽性および陰性被験者の臨床試験データセットを用いて示される。
関連論文リスト
- Show from Tell: Audio-Visual Modelling in Clinical Settings [58.88175583465277]
臨床環境でのオーディオ・ビジュアル・モデリングを考察し、人間の専門的アノテーションを使わずに医学的表現を学習するためのソリューションを提供する。
この目的のために, 単純かつ効果的なマルチモーダル自己教師型学習フレームワークを提案する。
提案手法は,音声のみを基準として,超音波画像中の解剖学的関心領域をローカライズすることができる。
論文 参考訳(メタデータ) (2023-10-25T08:55:48Z) - Instrumental Variable Learning for Chest X-ray Classification [52.68170685918908]
本稿では,素因果関係を排除し,正確な因果表現を得るための解釈可能な機器変数(IV)学習フレームワークを提案する。
提案手法の性能はMIMIC-CXR,NIH ChestX-ray 14,CheXpertデータセットを用いて実証した。
論文 参考訳(メタデータ) (2023-05-20T03:12:23Z) - The role of noise in denoising models for anomaly detection in medical
images [62.0532151156057]
病理脳病変は脳画像に多彩な外観を示す。
正規データのみを用いた教師なし異常検出手法が提案されている。
空間分解能の最適化と雑音の大きさの最適化により,異なるモデル学習体制の性能が向上することを示す。
論文 参考訳(メタデータ) (2023-01-19T21:39:38Z) - Analyzing the impact of SARS-CoV-2 variants on respiratory sound signals [23.789227109218118]
新型コロナウイルス患者から収集した音響信号が、計算学的に識別可能な音響パターンを示すかどうかを探索する。
以上の結果から,オミクロンおよびデルタ変種との比較では,有意な音響的特徴の相違が示唆された。
論文 参考訳(メタデータ) (2022-06-24T14:10:31Z) - COVYT: Introducing the Coronavirus YouTube and TikTok speech dataset
featuring the same speakers with and without infection [4.894353840908006]
私たちは、65人の話者から8時間以上のスピーチを含む公開ソースから収集された新しい新型コロナウイルスデータセットであるCOVYTデータセットを紹介します。
他の既存のCOVID-19サウンドデータセットと比較すると、COVYTデータセットのユニークな特徴は、全65話者から陽性と陰性の両方のサンプルを含むことである。
論文 参考訳(メタデータ) (2022-06-20T16:26:51Z) - Exploiting Cross Domain Acoustic-to-articulatory Inverted Features For
Disordered Speech Recognition [57.15942628305797]
調音機能は音響信号歪みに不変であり、正常音声の自動音声認識システムにうまく組み込まれている。
本稿では,15時間 TORGO コーパスの並列音響・調音データをモデルトレーニングに用いるクロスドメイン音響・調音(A2A)インバージョン手法を提案する。
クロスドメインは102.7時間のUASpeechコーパスに適応し、調音的特徴を生産する。
論文 参考訳(メタデータ) (2022-03-19T08:47:18Z) - Continuous Speech for Improved Learning Pathological Voice Disorders [12.867900671251395]
本研究では,単一母音の代わりに連続マンダリン音声を用いて4つの共通音声障害を分類する手法を提案する。
提案手法では, 音響信号をメル周波数ケプストラム係数に変換し, 双方向長周期メモリネットワーク(BiLSTM)を採用して, 逐次的特徴をモデル化する。
論文 参考訳(メタデータ) (2022-02-22T09:58:31Z) - A Preliminary Study of a Two-Stage Paradigm for Preserving Speaker
Identity in Dysarthric Voice Conversion [50.040466658605524]
変形性音声変換(DVC)における話者同一性維持のための新しいパラダイムを提案する。
変形性音声の質は統計VCによって大幅に改善される。
しかし, 変形性関節症患者の通常の発話は, ほとんど収集できないため, 過去の研究は患者の個性を取り戻すことはできなかった。
論文 参考訳(メタデータ) (2021-06-02T18:41:03Z) - The voice of COVID-19: Acoustic correlates of infection [9.7390888107204]
COVID-19は、過去1年間を通じて私たちの日常生活の多くの側面に影響を与えてきた世界的な健康危機です。
i:/, /e:/, /o:/, /u:/, /a:/の母音から抽出された音響的特徴を,11の症状性covid-19陽性者および11人の陰性ドイツ語話者参加者で比較した。
論文 参考訳(メタデータ) (2020-12-17T10:12:41Z) - Detection of COVID-19 through the analysis of vocal fold oscillations [18.387162887917164]
声帯の振動は人間の発声における発声の主な原因である。
呼吸器機能障害の軽度から重度の症状を呈する症例が多いことから,声帯の振動を調べることで,新型コロナウイルスの症状を観察できる可能性が示唆された。
我々の目標は、この仮説を検証し、音声から新型コロナウイルスを検出するために観察された変化を定量的に特徴づけることである。
論文 参考訳(メタデータ) (2020-10-21T01:44:42Z) - COVID-DA: Deep Domain Adaptation from Typical Pneumonia to COVID-19 [92.4955073477381]
新型コロナウイルス感染症(COVID-19)の流行はすでに何百万人もの人々に感染しており、今でも世界中で急速に拡大している。
近年,ディープラーニングを効果的なコンピュータ支援手法として利用し,診断効率を向上している。
本稿では,新たな深部ドメイン適応手法,すなわちCOVID-DAを提案する。
論文 参考訳(メタデータ) (2020-04-30T03:13:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。