論文の概要: Respiratory Distress Detection from Telephone Speech using Acoustic and
Prosodic Features
- arxiv url: http://arxiv.org/abs/2011.09270v1
- Date: Sun, 15 Nov 2020 13:32:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-25 07:53:50.359832
- Title: Respiratory Distress Detection from Telephone Speech using Acoustic and
Prosodic Features
- Title(参考訳): 音響・韻律的特徴を用いた電話音声からの呼吸距離検出
- Authors: Meemnur Rashid, Kaisar Ahmed Alman, Khaled Hasan, John H.L. Hansen and
Taufiq Hasan
- Abstract要約: 本研究は,よく知られた音響・韻律的特徴を用いた呼吸困難の自動検出に関する予備的知見を要約する。
音声サンプルはバングラデシュの医療機関から未確認の遠隔医療電話から収集される。
呼吸困難は、声質、発声パターン、発声時間、発声時間などの音声特徴を変化させる可能性があると仮定する。
- 参考スコア(独自算出の注目度): 27.77184655808592
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the widespread use of telemedicine services, automatic assessment of
health conditions via telephone speech can significantly impact public health.
This work summarizes our preliminary findings on automatic detection of
respiratory distress using well-known acoustic and prosodic features. Speech
samples are collected from de-identified telemedicine phonecalls from a
healthcare provider in Bangladesh. The recordings include conversational speech
samples of patients talking to doctors showing mild or severe respiratory
distress or asthma symptoms. We hypothesize that respiratory distress may alter
speech features such as voice quality, speaking pattern, loudness, and
speech-pause duration. To capture these variations, we utilize a set of
well-known acoustic and prosodic features with a Support Vector Machine (SVM)
classifier for detecting the presence of respiratory distress. Experimental
evaluations are performed using a 3-fold cross-validation scheme, ensuring
patient-independent data splits. We obtained an overall accuracy of 86.4\% in
detecting respiratory distress from the speech recordings using the acoustic
feature set. Correlation analysis reveals that the top-performing features
include loudness, voice rate, voice duration, and pause duration.
- Abstract(参考訳): 遠隔医療サービスの普及に伴い、電話による健康状態の自動評価は公衆衛生に大きな影響を及ぼす可能性がある。
本研究は,よく知られた音響・韻律的特徴を用いた呼吸困難の自動検出に関する予備的知見を要約する。
音声サンプルはバングラデシュの医療機関から未確認の遠隔医療電話から収集される。
録音には、軽度または重度の呼吸困難または喘息症状を示す医師と話している患者の会話音声サンプルが含まれる。
呼吸困難は音声品質,発話パターン,ラウドネス,発話停止時間などの音声特徴を変化させる可能性があると仮定した。
これらの変動を捉えるために,支援ベクターマシン(svm)分類器を用いて,呼吸困難の有無を検出するための音響的特徴と韻律的特徴のセットを用いた。
患者非依存のデータ分割を確実にする3次元クロスバリデーションスキームを用いて実験的評価を行う。
音響特徴セットを用いた音声記録から呼吸困難の検出において,86.4\%の総合的精度を得た。
相関分析の結果, 発声時間, 発声時間, 発声時間, 発声時間, 発声時間, 発声時間,
関連論文リスト
- Self-supervised Speech Models for Word-Level Stuttered Speech Detection [66.46810024006712]
自己教師付き音声モデルを利用した単語レベルの発声音声検出モデルを提案する。
本評価は, 単語レベルの発声検出において, 従来の手法を超越していることを示す。
論文 参考訳(メタデータ) (2024-09-16T20:18:20Z) - Pre-Trained Foundation Model representations to uncover Breathing patterns in Speech [2.935056044470713]
呼吸速度(英: respiratory rate, RR)は、個人の健康、フィットネス、健康全般を評価するために用いられる重要な指標である。
RRを測定するための既存のアプローチは、特殊装備や訓練を用いて実施されている。
機械学習アルゴリズムは、バイオセンサー信号を入力としてRRを推定できることを示した。
論文 参考訳(メタデータ) (2024-07-17T21:57:18Z) - Sustained Vowels for Pre- vs Post-Treatment COPD Classification [11.153412281447029]
慢性閉塞性肺疾患(慢性閉塞性肺疾患、COPD)は、世界中の何百万人もの人が発症する重度の炎症性肺疾患である。
従来,読み上げ音声の自動解析により,前処理状態と後処理状態の区別が可能であった。
読み上げ音声を用いた71%のベースラインから、79%の未重み付き平均リコールに持続母音を含ませることにより、性能が向上することを示した。
論文 参考訳(メタデータ) (2024-06-10T15:17:17Z) - Show from Tell: Audio-Visual Modelling in Clinical Settings [58.88175583465277]
臨床環境でのオーディオ・ビジュアル・モデリングを考察し、人間の専門的アノテーションを使わずに医学的表現を学習するためのソリューションを提供する。
この目的のために, 単純かつ効果的なマルチモーダル自己教師型学習フレームワークを提案する。
提案手法は,音声のみを基準として,超音波画像中の解剖学的関心領域をローカライズすることができる。
論文 参考訳(メタデータ) (2023-10-25T08:55:48Z) - Fused Audio Instance and Representation for Respiratory Disease
Detection [0.6827423171182154]
呼吸器疾患の検出方法としてFAIR(Fused Audio Instance and Representation)を提案する。
体音の波形とスペクトログラムの表現を組み合わせることで、COVID-19検出のユースケースについて実験を行った。
論文 参考訳(メタデータ) (2022-04-22T09:01:29Z) - Investigation of Data Augmentation Techniques for Disordered Speech
Recognition [69.50670302435174]
本稿では,不規則音声認識のための一連のデータ拡張手法について検討する。
正常な音声と無秩序な音声の両方が増強過程に利用された。
UASpeechコーパスを用いた最終話者適応システムと、最大2.92%の絶対単語誤り率(WER)の速度摂動に基づく最良の拡張アプローチ
論文 参考訳(メタデータ) (2022-01-14T17:09:22Z) - A Machine Learning Approach for Delineating Similar Sound Symptoms of
Respiratory Conditions on a Smartphone [0.0]
我々は、現代のスマートフォンの計算能力と記憶能力の改善を活用し、機械学習アルゴリズムを用いて呼吸音の症状を識別する。
携帯電話上でのこれらのアルゴリズムの性能は、スマートフォンがリアルタイムシナリオにおける呼吸症状の認識と識別のための代替ツールであることを示している。
論文 参考訳(メタデータ) (2021-10-15T07:24:30Z) - A Preliminary Study of a Two-Stage Paradigm for Preserving Speaker
Identity in Dysarthric Voice Conversion [50.040466658605524]
変形性音声変換(DVC)における話者同一性維持のための新しいパラダイムを提案する。
変形性音声の質は統計VCによって大幅に改善される。
しかし, 変形性関節症患者の通常の発話は, ほとんど収集できないため, 過去の研究は患者の個性を取り戻すことはできなかった。
論文 参考訳(メタデータ) (2021-06-02T18:41:03Z) - Silent Speech Interfaces for Speech Restoration: A Review [59.68902463890532]
サイレント音声インタフェース (SSI) の研究は、重度音声障害の患者に対して、代替的で拡張的なコミュニケーション方法を提供することを目的としている。
SSIは、コミュニケーションを可能にするために、音声生成中に人体によって生成される非音響バイオシグナーに依存している。
現在、ほとんどのSSIは、健康なユーザーのために実験室でのみ検証されている。
論文 参考訳(メタデータ) (2020-09-04T11:05:50Z) - Respiratory Sound Classification Using Long-Short Term Memory [62.997667081978825]
本稿では,呼吸器疾患の分類に関連して,音の分類を行おうとする際の問題点について検討する。
このようなタスクをどのように実装できるかを特定するために、ディープラーニングと長期短期記憶ネットワークの使用の検討を行う。
論文 参考訳(メタデータ) (2020-08-06T23:11:57Z) - Speaker and Posture Classification using Instantaneous Intraspeech
Breathing Features [2.578242050187029]
音声内呼吸音を用いた話者と姿勢の分類法を提案する。
呼吸音,87%話者分類,98%姿勢分類の精度が得られた。
論文 参考訳(メタデータ) (2020-05-25T17:00:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。