論文の概要: Speech Recognition-based Feature Extraction for Enhanced Automatic Severity Classification in Dysarthric Speech
- arxiv url: http://arxiv.org/abs/2412.03784v1
- Date: Thu, 05 Dec 2024 00:12:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-06 14:39:30.967606
- Title: Speech Recognition-based Feature Extraction for Enhanced Automatic Severity Classification in Dysarthric Speech
- Title(参考訳): 変形性音声における音声認識に基づく特徴抽出による自動重度分類の高速化
- Authors: Yerin Choi, Jeehyun Lee, Myoung-Wan Koo,
- Abstract要約: 本稿では,新しい特徴抽出源としてASR転写を導入する。
変形性音声のASRモデルを微調整し、このモデルを用いて変形性音声を転写し、単語セグメント境界情報を抽出する。
これらの特徴は、83.72%のバランスの取れた精度で、既存の特徴に対する重大さ予測性能を改善した。
- 参考スコア(独自算出の注目度): 2.7309692684728617
- License:
- Abstract: Due to the subjective nature of current clinical evaluation, the need for automatic severity evaluation in dysarthric speech has emerged. DNN models outperform ML models but lack user-friendly explainability. ML models offer explainable results at a feature level, but their performance is comparatively lower. Current ML models extract various features from raw waveforms to predict severity. However, existing methods do not encompass all dysarthric features used in clinical evaluation. To address this gap, we propose a feature extraction method that minimizes information loss. We introduce an ASR transcription as a novel feature extraction source. We finetune the ASR model for dysarthric speech, then use this model to transcribe dysarthric speech and extract word segment boundary information. It enables capturing finer pronunciation and broader prosodic features. These features demonstrated an improved severity prediction performance to existing features: balanced accuracy of 83.72%.
- Abstract(参考訳): 現在の臨床評価の主観的性質から, 変形性関節症における重症度自動評価の必要性が指摘されている。
DNNモデルはMLモデルより優れているが、ユーザフレンドリな説明性が欠けている。
MLモデルは機能レベルで説明可能な結果を提供するが、そのパフォーマンスは比較的低い。
現在のMLモデルは、重大度を予測するために生波形から様々な特徴を抽出する。
しかし, 既往の方法は, 臨床評価に使用されるすべての変形性関節症の特徴を包含するものではない。
このギャップに対処するために,情報損失を最小限に抑える特徴抽出法を提案する。
本稿では,新しい特徴抽出源としてASR転写を導入する。
変形性音声のASRモデルを微調整し、このモデルを用いて変形性音声を転写し、単語セグメント境界情報を抽出する。
より微細な発音とより広い韻律的特徴を捉えることができる。
これらの特徴は、83.72%のバランスの取れた精度で、既存の特徴に対する重大さ予測性能を改善した。
関連論文リスト
- Reproducible Machine Learning-based Voice Pathology Detection: Introducing the Pitch Difference Feature [1.1455937444848385]
本稿では,音声病理診断における現代的実践の徹底的な研究から得られた,ロバストな特徴セットを提案する。
K-Means Synthetic Minority Over-Sampling Technique(K-Means Synthetic Over-Sampling Technique)アルゴリズムを用いて,Sarbr"ucken Voice Database(SVD)のデータを含むこの機能セットを組み合わせる。
提案手法は,音声病理診断における非重み付き平均リコールによって測定された最先端の性能を達成している。
論文 参考訳(メタデータ) (2024-10-14T14:17:52Z) - Language Models and Retrieval Augmented Generation for Automated Structured Data Extraction from Diagnostic Reports [2.932283627137903]
この研究は、2つのデータセットを利用していた:7,294の放射線診断報告は、BT-RADS(Brain tumor Reporting and Data System)スコアに注釈付けされ、2,154の病理診断報告は、isocitrate dehydrogenase(IDH)変異のステータスに注釈付けされた。
論文 参考訳(メタデータ) (2024-09-15T15:21:45Z) - Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。
提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。
医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-03-19T09:28:19Z) - Adaptive Feature Selection for No-Reference Image Quality Assessment by Mitigating Semantic Noise Sensitivity [55.399230250413986]
上流タスクから有害なセマンティックノイズを除去するためのQFM-IQM(Quality-Aware Feature Matching IQA Metric)を提案する。
提案手法は,8つの標準IQAデータセット上での最先端NR-IQA法よりも優れた性能を実現する。
論文 参考訳(メタデータ) (2023-12-11T06:50:27Z) - Deep Prototypical-Parts Ease Morphological Kidney Stone Identification
and are Competitively Robust to Photometric Perturbations [0.9236074230806579]
腎結石サブタイプ当たりのプロトタイプ部分(PP)を学習し,出力分類を生成する。
我々の実装の平均精度は、最先端(SOTA)非解釈可能なDLモデルよりも1.5%低い。
本モデルでは, 対向訓練を伴わずに, 標準偏差の低い摂動画像を2.8%向上させる。
論文 参考訳(メタデータ) (2023-04-08T17:43:31Z) - Semantic Latent Space Regression of Diffusion Autoencoders for Vertebral
Fracture Grading [72.45699658852304]
本稿では,教師なし特徴抽出器として生成拡散オートエンコーダモデルを訓練するための新しい手法を提案する。
フラクチャーグレーディングを連続回帰としてモデル化し, フラクチャーのスムーズな進行を反映した。
重要なことに,本手法の創成特性は,与えられた脊椎の様々な段階を可視化し,自動グルーピングに寄与する特徴を解釈し,洞察することを可能にする。
論文 参考訳(メタデータ) (2023-03-21T17:16:01Z) - cRedAnno+: Annotation Exploitation in Self-Explanatory Lung Nodule
Diagnosis [8.582182186207671]
cRedAnnoは、アノテーションの要求を大幅に減らして、競争性能を達成する。
半教師付き能動学習によるアノテーション活用機構を提案する。
提案手法は10倍のアノテーションで同等あるいはそれ以上高い悪性度予測精度を実現する。
論文 参考訳(メタデータ) (2022-10-28T12:44:31Z) - MACE: An Efficient Model-Agnostic Framework for Counterfactual
Explanation [132.77005365032468]
MACE(Model-Agnostic Counterfactual Explanation)の新たな枠組みを提案する。
MACE法では, 優れた反実例を見つけるための新しいRL法と, 近接性向上のための勾配のない降下法を提案する。
公開データセットの実験は、有効性、空間性、近接性を向上して検証する。
論文 参考訳(メタデータ) (2022-05-31T04:57:06Z) - Identification of Autism spectrum disorder based on a novel feature
selection method and Variational Autoencoder [7.0876609220947655]
安静時機能的磁気共鳴画像(rs-fMRI)のような非侵襲的脳イメージングは、自閉症スペクトラム障害(ASD)の早期診断に有望な解決策である
本稿では rs-fMRI に基づく ASD 診断を支援するための分類フレームワークを提案する。
論文 参考訳(メタデータ) (2022-04-07T08:50:48Z) - Can contrastive learning avoid shortcut solutions? [88.249082564465]
暗黙的特徴修正(IFM)は、より広い種類の予測的特徴を捉えるために、対照的なモデルを導くために、正と負のサンプルを変更する方法である。
IFMは特徴抑制を低減し、その結果、視覚および医用画像タスクのパフォーマンスが向上する。
論文 参考訳(メタデータ) (2021-06-21T16:22:43Z) - Removing Spurious Features can Hurt Accuracy and Affect Groups
Disproportionately [83.68135652247496]
自然な修正は、モデルからスプリアスな特徴を取り除くことである。
誘導バイアスによる突発的特徴の除去は精度を低下させる可能性が示唆された。
また,ロバストな自己学習によって,全体的な正確性に影響を与えずにスプリアスな特徴を除去できることを示した。
論文 参考訳(メタデータ) (2020-12-07T23:08:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。