論文の概要: Impact of Acoustic Noise on Alzheimer's Disease Detection from Speech:
Should You Let Baby Cry?
- arxiv url: http://arxiv.org/abs/2203.17110v1
- Date: Thu, 31 Mar 2022 15:30:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-01 16:15:32.374093
- Title: Impact of Acoustic Noise on Alzheimer's Disease Detection from Speech:
Should You Let Baby Cry?
- Title(参考訳): 音声からのアルツハイマー病検出における音響ノイズの影響:赤ちゃんを泣かせるべきか?
- Authors: Jekaterina Novikova
- Abstract要約: 音声処理と機械学習(ML)はアルツハイマー病(AD)を確実に検出するための有望な技術を提供する
5つのカテゴリーから15種類の雑音が3種類の音響表現を訓練した4種類のMLモデルの性能に及ぼす影響について検討した。
特定のノイズがAD検出モデルに有用であることを示し、精度を最大4.8%向上させる。
- 参考スコア(独自算出の注目度): 4.269268432906194
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Research related to automatically detecting Alzheimer's disease (AD) is
important, given the high prevalence of AD and the high cost of traditional
methods. Since AD significantly affects the acoustics of spontaneous speech,
speech processing and machine learning (ML) provide promising techniques for
reliably detecting AD. However, speech audio may be affected by different types
of background noise and it is important to understand how the noise influences
the accuracy of ML models detecting AD from speech. In this paper, we study the
effect of fifteen types of noise from five different categories on the
performance of four ML models trained with three types of acoustic
representations. We perform a thorough analysis showing how ML models and
acoustic features are affected by different types of acoustic noise. We show
that acoustic noise is not necessarily harmful - certain types of noise are
beneficial for AD detection models and help increasing accuracy by up to 4.8\%.
We provide recommendations on how to utilize acoustic noise in order to achieve
the best performance results with the ML models deployed in real world.
- Abstract(参考訳): アルツハイマー病(AD)を自動的に検出する研究は、ADの頻度が高く、従来の方法のコストが高いことを考えると、重要である。
ADは自然発話の音響に大きく影響するため、音声処理と機械学習(ML)はADを確実に検出する有望な技術を提供する。
しかし、音声は異なる種類の背景雑音に影響されうるため、音声からADを検出するMLモデルの精度にどのように影響するかを理解することが重要である。
本稿では,5つのカテゴリーから15種類の雑音が3種類の音響表現を訓練した4種類のMLモデルの性能に及ぼす影響について検討する。
MLモデルと音響特性が異なる種類の音響ノイズにどのように影響するかを網羅的に分析する。
音響ノイズは必ずしも有害ではなく、特定の種類のノイズはAD検出モデルに有用であり、最大4.8\%の精度向上に役立つ。
本稿では,実環境に展開するMLモデルにおいて,最高の性能を実現するために,音響ノイズの活用法を提案する。
関連論文リスト
- The Unreliability of Acoustic Systems in Alzheimer's Speech Datasets with Heterogeneous Recording Conditions [11.00082412847855]
MFCC と Wav2vec 2.0 の2つの音響特性に基づくシステムにより,AD 患者を上向きの性能制御から識別できることが示されている。
本研究は,非標準化記録に基づく患者同定のための音響システムの使用に対する警告である。
論文 参考訳(メタデータ) (2024-09-11T20:50:45Z) - BTS: Bridging Text and Sound Modalities for Metadata-Aided Respiratory Sound Classification [0.0]
音声サンプルのメタデータから派生した自由テキスト記述を用いて,事前学習したテキスト・オーディオ・マルチモーダルモデルを微調整する。
提案手法は,ICBHIデータセットの最先端性能を達成し,先行した最良値の1.17%を突破した。
論文 参考訳(メタデータ) (2024-06-10T20:49:54Z) - Comparative Study on the Effects of Noise in ML-Based Anxiety Detection [0.0]
ノイズがモデル性能にどのように影響するかを考察し、ノイズの多い実環境に頑健なモデルを開発する。
生理的覚醒のレベルを分類する機械学習モデルにおいて,様々なノイズの強度が与える影響を比較した。
論文 参考訳(メタデータ) (2023-06-01T19:52:24Z) - An Investigation of Noise in Morphological Inflection [21.411766936034]
本研究は, パイプライン内で発生するノイズの種類を, 真の教師なし形態素パラダイムの完成のために検討する。
異なる種類のノイズが複数の最先端インフレクションモデルに与える影響を比較した。
本稿では,文字レベルのマスク付き言語モデリング(CMLM)の事前学習手法を提案する。
論文 参考訳(メタデータ) (2023-05-26T02:14:34Z) - Analysing the Impact of Audio Quality on the Use of Naturalistic
Long-Form Recordings for Infant-Directed Speech Research [62.997667081978825]
早期言語習得のモデリングは、幼児が言語スキルをブートストラップする方法を理解することを目的としている。
近年の進歩により、より自然主義的なトレーニングデータを計算モデルに利用できるようになった。
音質がこれらのデータに対する分析やモデリング実験にどう影響するかは、現時点では不明である。
論文 参考訳(メタデータ) (2023-05-03T08:25:37Z) - Leveraging Pretrained Representations with Task-related Keywords for
Alzheimer's Disease Detection [69.53626024091076]
アルツハイマー病(AD)は高齢者に特に顕著である。
事前学習モデルの最近の進歩は、AD検出モデリングを低レベル特徴から高レベル表現にシフトさせる動機付けとなっている。
本稿では,高レベルの音響・言語的特徴から,より優れたAD関連手がかりを抽出する,いくつかの効率的な手法を提案する。
論文 参考訳(メタデータ) (2023-03-14T16:03:28Z) - The role of noise in denoising models for anomaly detection in medical
images [62.0532151156057]
病理脳病変は脳画像に多彩な外観を示す。
正規データのみを用いた教師なし異常検出手法が提案されている。
空間分解能の最適化と雑音の大きさの最適化により,異なるモデル学習体制の性能が向上することを示す。
論文 参考訳(メタデータ) (2023-01-19T21:39:38Z) - Inference and Denoise: Causal Inference-based Neural Speech Enhancement [83.4641575757706]
本研究では、雑音の存在を介入としてモデル化することにより、因果推論パラダイムにおける音声強調(SE)課題に対処する。
提案した因果推論に基づく音声強調(CISE)は,ノイズ検出器を用いて間欠雑音音声中のクリーンフレームとノイズフレームを分離し,両フレームセットを2つのマスクベース拡張モジュール(EM)に割り当て,ノイズ条件SEを実行する。
論文 参考訳(メタデータ) (2022-11-02T15:03:50Z) - Alzheimer's Dementia Recognition Using Acoustic, Lexical, Disfluency and
Speech Pause Features Robust to Noisy Inputs [11.34426502082293]
本稿では, 話者がアルツハイマー病を患っているか否かを分類するために, ASR で書き起こされた音声と音響データを同時に消費する2つの多モード融合型深層学習モデルを提案する。
我々の最良モデルである、単語、単語確率、拡散特性、ポーズ情報、および様々な音響特徴を用いたハイウェイ層付きBiLSTMは、MMSE認知スコアに対して84%の精度とRSME誤差予測を4.26の精度で達成する。
論文 参考訳(メタデータ) (2021-06-29T19:24:29Z) - Improving Medical Image Classification with Label Noise Using
Dual-uncertainty Estimation [72.0276067144762]
医用画像における2種類のラベルノイズについて論じ,定義する。
医用画像分類作業中にこれら2つのラベルノイズを処理する不確実性推定に基づくフレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-28T14:56:45Z) - Adaptive Multi-View ICA: Estimation of noise levels for optimal
inference [65.94843987207445]
Adaptive MultiView ICA (AVICA) はノイズの多いICAモデルであり、各ビューは共有された独立したソースと付加的なノイズの線形混合である。
AVICAは、その明示的なMMSE推定器により、他のICA法よりも優れたソース推定値が得られる。
実脳磁図(MEG)データでは,分解がサンプリングノイズに対する感度が低く,ノイズ分散推定が生物学的に妥当であることを示す。
論文 参考訳(メタデータ) (2021-02-22T13:10:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。