論文の概要: A Study on the Reliability of Automatic Dysarthric Speech Assessments
- arxiv url: http://arxiv.org/abs/2306.04337v1
- Date: Wed, 7 Jun 2023 11:04:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-08 14:59:17.447344
- Title: A Study on the Reliability of Automatic Dysarthric Speech Assessments
- Title(参考訳): 構音障害自動評価の信頼性に関する検討
- Authors: Xavier F. Cadet, Ranya Aloufi, Sara Ahmadi-Abhari, Hamed Haddadi
- Abstract要約: ジステリアアセスメントは、効果的で低コストなツールを開発する機会を提供する。
現在のアプローチが難聴に関連する音声パターンや外的要因に依存しているかどうかは不明である。
- 参考スコア(独自算出の注目度): 4.377743737361995
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automating dysarthria assessments offers the opportunity to develop
effective, low-cost tools that address the current limitations of manual and
subjective assessments. Nonetheless, it is unclear whether current approaches
rely on dysarthria-related speech patterns or external factors. We aim toward
obtaining a clearer understanding of dysarthria patterns. To this extent, we
study the effects of noise in recordings, both through addition and reduction.
We design and implement a new method for visualizing and comparing feature
extractors and models, at a patient level, in a more interpretable way. We use
the UA-Speech dataset with a speaker-based split of the dataset. Results
reported in the literature appear to have been done irrespective of such split,
leading to models that may be overconfident due to data-leakage. We hope that
these results raise awareness in the research community regarding the
requirements for establishing reliable automatic dysarthria assessment systems.
- Abstract(参考訳): 変形評価の自動化は、手動および主観的評価の現在の限界に対処する効果的な低コストツールを開発する機会を提供する。
それにもかかわらず、現在のアプローチが難聴に関連する音声パターンや外部要因に依存しているかどうかは不明である。
我々は、ジステリアパターンのより明確な理解を得ることを目指している。
本研究では,録音における雑音の影響について,加算と低減の両面から検討する。
我々は,患者レベルで特徴抽出器とモデルをより解釈可能な方法で可視化・比較する新しい手法を設計し,実装する。
UA-Speechデータセットと話者ベースのデータセット分割を用いる。
文献で報告された結果は、そのような分割に拘わらず行われたようで、データ漏洩により過信される可能性があるモデルに繋がる。
我々は,これらの結果が,信頼性の高い自動脱臼評価システム構築の要件に関する研究コミュニティの意識を高めることを願っている。
関連論文リスト
- Speaker-Independent Dysarthria Severity Classification using
Self-Supervised Transformers and Multi-Task Learning [2.7706924578324665]
本研究では, 生音声データから難聴度を自動的に評価するトランスフォーマーに基づく枠組みを提案する。
話者非依存型遅発性重度分類のための多タスク学習目標とコントラスト学習を組み込んだ,話者非依存型遅発性正規化(SALR)と呼ばれるフレームワークを開発した。
我々のモデルは従来の機械学習手法よりも優れた性能を示し、精度は70.48%$、F1スコアは59.23%$である。
論文 参考訳(メタデータ) (2024-02-29T18:30:52Z) - Toward Practical Automatic Speech Recognition and Post-Processing: a
Call for Explainable Error Benchmark Guideline [12.197453599489963]
本稿では,Error Explainable Benchmark (EEB) データセットの開発を提案する。
このデータセットは、音声レベルとテキストレベルの両方を考慮しているが、モデルの欠点を詳細に理解することができる。
我々の提案は、より現実世界中心の評価のための構造化された経路を提供し、ニュアンスドシステムの弱点の検出と修正を可能にします。
論文 参考訳(メタデータ) (2024-01-26T03:42:45Z) - Word-Level ASR Quality Estimation for Efficient Corpus Sampling and
Post-Editing through Analyzing Attentions of a Reference-Free Metric [5.592917884093537]
品質推定(QE)メトリクスのポテンシャルは、ASRシステムにおける説明可能な人工知能(XAI)を強化する新しいツールとして導入され、評価される。
NoRefERメトリックの能力は、単語レベルの誤りを識別し、ASR仮説を補うのに役立つ。
論文 参考訳(メタデータ) (2024-01-20T16:48:55Z) - Classification of Dysarthria based on the Levels of Severity. A
Systematic Review [1.7624130429860712]
本研究は,重症度に基づく変形性関節症分類手法の体系的検討を目的としている。
変形性関節症の重症度自動分類に関する文献を体系的にレビューする。
論文 参考訳(メタデータ) (2023-10-11T07:40:46Z) - Elastic Weight Removal for Faithful and Abstractive Dialogue Generation [61.40951756070646]
対話システムは、関連する文書に含まれる知識に忠実な応答を生成するべきである。
多くのモデルは、それと矛盾したり、検証不可能な情報を含んでいる代わりに幻覚応答を生成する。
本手法は,幻覚と抽出反応を同時に阻止するために拡張できることが示唆された。
論文 参考訳(メタデータ) (2023-03-30T17:40:30Z) - Leveraging Pretrained Representations with Task-related Keywords for
Alzheimer's Disease Detection [69.53626024091076]
アルツハイマー病(AD)は高齢者に特に顕著である。
事前学習モデルの最近の進歩は、AD検出モデリングを低レベル特徴から高レベル表現にシフトさせる動機付けとなっている。
本稿では,高レベルの音響・言語的特徴から,より優れたAD関連手がかりを抽出する,いくつかの効率的な手法を提案する。
論文 参考訳(メタデータ) (2023-03-14T16:03:28Z) - Ontology-aware Learning and Evaluation for Audio Tagging [56.59107110017436]
平均平均精度(mAP)は、異なる種類の音をそれらの関係を考慮せずに独立したクラスとして扱う。
オントロジー認識平均平均精度(OmAP)は、評価中にAudioSetオントロジー情報を利用することで、mAPの弱点に対処する。
我々は人間の評価を行い、OmAPはmAPよりも人間の知覚と一致していることを示した。
論文 参考訳(メタデータ) (2022-11-22T11:35:14Z) - Exploring linguistic feature and model combination for speech
recognition based automatic AD detection [61.91708957996086]
音声ベースの自動ADスクリーニングシステムは、他の臨床スクリーニング技術に代わる非侵襲的でスケーラブルな代替手段を提供する。
専門的なデータの収集は、そのようなシステムを開発する際に、モデル選択と特徴学習の両方に不確実性をもたらす。
本稿では,BERT と Roberta の事前学習したテキストエンコーダのドメイン微調整の堅牢性向上のための特徴とモデルの組み合わせ手法について検討する。
論文 参考訳(メタデータ) (2022-06-28T05:09:01Z) - Benchmarking Heterogeneous Treatment Effect Models through the Lens of
Interpretability [82.29775890542967]
治療のパーソナライズされた効果を見積もるのは複雑だが、普及している問題である。
ヘテロジニアス処理効果推定に関する機械学習文献の最近の進歩は、洗練されたが不透明なツールの多くを生み出した。
我々は、ポストホックな特徴重要度法を用いて、モデルの予測に影響を及ぼす特徴を特定する。
論文 参考訳(メタデータ) (2022-06-16T17:59:05Z) - Entity-Conditioned Question Generation for Robust Attention Distribution
in Neural Information Retrieval [51.53892300802014]
教師付きニューラル情報検索モデルでは,通過トークンよりも疎注意パターンを学習することが困難であることを示す。
目的とする新しい合成データ生成手法を用いて、与えられた通路内の全てのエンティティに対して、より均一で堅牢な参加をニューラルIRに教える。
論文 参考訳(メタデータ) (2022-04-24T22:36:48Z) - End-to-End Speech Recognition and Disfluency Removal [15.910282983166024]
本稿では,エンド・ツー・エンド音声認識とディフルエンシ除去の課題について検討する。
エンド・ツー・エンドのモデルでは、フロート・トランスクリプトを直接生成できることが示されている。
統合型ASRモデルと非フルエンシモデルの評価に使用できる2つの新しい指標を提案する。
論文 参考訳(メタデータ) (2020-09-22T03:11:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。