論文の概要: Evaluation of the syllables pronunciation quality in speech
rehabilitation through the solution of the classification problem
- arxiv url: http://arxiv.org/abs/2301.10585v1
- Date: Wed, 25 Jan 2023 13:43:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-26 15:11:06.652597
- Title: Evaluation of the syllables pronunciation quality in speech
rehabilitation through the solution of the classification problem
- Title(参考訳): 分類問題の解を用いた音声リハビリテーションにおける音節発音品質の評価
- Authors: Evgeny Kostyuchenko
- Abstract要約: この評価は、音節を外科治療前後の2つのクラスに分類する問題を解くことによって行われる。
再生過程における音節の発音の質を評価する尺度は、手術前のクラスに属する尺度である。
既存の音節発音品質評価との比較を行い、その結果の新しい音節品質評価の実践的な適用を推奨する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The solution of the problem of assessing the quality of the pronunciation of
syllables during speech rehabilitation after surgical treatment of oncological
diseases of the organs of the speech-forming tract is considered in the work.
The assessment is carried out by solving the problem of classifying syllables
into two classes: before and immediately after surgical treatment. A classifier
is built on the basis of the LSTM neural network and trained on the records
before the operation and immediately after it, before the start of speech
rehabilitation. The measure of assessing the quality of syllables pronunciation
in the process of rehabilitation is the metric of belonging to the class before
the operation. A study is being made of the influence of taking into account
problematic phonemes, the gender of the patient, his individual characteristics
on the resulting estimates of the quality of pronunciation. A comparison with
existing types of syllable pronunciation quality assessments is carried out,
recommendations are given for the practical application of the resulting new
class of pronunciation quality assessments.
- Abstract(参考訳): 本研究は, 発声器の腫瘍性疾患に対する外科的治療後の音声リハビリテーションにおける音節発音の質評価の問題点について考察した。
この評価は、音節を外科治療前後の2つのクラスに分類する問題を解くことによって行われる。
分類器は、lstmニューラルネットワークに基づいて構築され、音声リハビリの開始前に、手術前およびその直後の記録に基づいて訓練される。
リハビリテーションの過程における音節発音の質を評価する尺度は、手術前のクラスに属する指標である。
ある研究は、問題のある音素、患者の性別、彼の個人的特徴が、結果として生じる発音の質の推定に与える影響を考慮に入れている。
既存の音節発音品質評価との比較を行い、得られた新しい発音品質評価のクラスを実践するために推奨する。
関連論文リスト
- Deep Multimodal Fusion for Surgical Feedback Classification [70.53297887843802]
外科的フィードバックの5カテゴリー分類を臨床的に検証した。
次に,テキスト,音声,ビデオモダリティの入力から,これらの5つのカテゴリの外科的フィードバックを分類するために,多ラベル機械学習モデルを開発した。
我々の研究の最終的な目標は、リアルタイムな文脈的外科的フィードバックのアノテーションを大規模に自動化することである。
論文 参考訳(メタデータ) (2023-12-06T01:59:47Z) - Lightly Weighted Automatic Audio Parameter Extraction for the Quality
Assessment of Consensus Auditory-Perceptual Evaluation of Voice [18.8222742272435]
提案手法は, ジッタ, 絶対ジッタ, シャマー, ハーモニック・ツー・ノイズ比 (HNR) , ゼロクロスという, 年齢, 性別, および5つの音響パラメータを利用する。
その結果,提案手法は最先端技術(SOTA)手法と類似し,一般的な音声事前学習モデルを用いて得られた潜在表現よりも優れることがわかった。
論文 参考訳(メタデータ) (2023-11-27T07:19:22Z) - Continuous Modeling of the Denoising Process for Speech Enhancement
Based on Deep Learning [61.787485727134424]
状態変数をデノナイジングプロセスを示すために使用します。
UNetのようなニューラルネットワークは、連続的復調プロセスからサンプリングされたすべての状態変数を推定することを学ぶ。
実験結果から, クリーンターゲットに少量の雑音を保存することは, 音声強調に有効であることが示唆された。
論文 参考訳(メタデータ) (2023-09-17T13:27:11Z) - Automated Fidelity Assessment for Strategy Training in Inpatient
Rehabilitation using Natural Language Processing [53.096237570992294]
戦略トレーニング (Strategy Training) とは、脳卒中後の認知障害患者に障害を減らすためのスキルを教える、リハビリテーションのアプローチである。
標準化された忠実度評価は治療原則の遵守度を測定するために用いられる。
本研究では,ルールベースNLPアルゴリズム,長短項メモリ(LSTM)モデル,および変換器(BERT)モデルからの双方向エンコーダ表現を開発した。
論文 参考訳(メタデータ) (2022-09-14T15:33:30Z) - Continuous Speech for Improved Learning Pathological Voice Disorders [12.867900671251395]
本研究では,単一母音の代わりに連続マンダリン音声を用いて4つの共通音声障害を分類する手法を提案する。
提案手法では, 音響信号をメル周波数ケプストラム係数に変換し, 双方向長周期メモリネットワーク(BiLSTM)を採用して, 逐次的特徴をモデル化する。
論文 参考訳(メタデータ) (2022-02-22T09:58:31Z) - Self-Normalized Importance Sampling for Neural Language Modeling [97.96857871187052]
本研究では, 自己正規化重要度サンプリングを提案し, これまでの研究と比較すると, 本研究で考慮された基準は自己正規化されており, さらに修正を行う必要はない。
提案する自己正規化重要度サンプリングは,研究指向と生産指向の両方の自動音声認識タスクにおいて競合することを示す。
論文 参考訳(メタデータ) (2021-11-11T16:57:53Z) - An Objective Evaluation Framework for Pathological Speech Synthesis [36.41726606690864]
そこで本研究では,合成病理音声の一貫した評価のための一般的な枠組みを提案する。
この枠組みは音声の質と可聴性を評価する。
本研究では, 異なるレベルの音声の理解度で, 変形性音声を合成できることを示す。
論文 参考訳(メタデータ) (2021-07-01T08:55:57Z) - A Preliminary Study of a Two-Stage Paradigm for Preserving Speaker
Identity in Dysarthric Voice Conversion [50.040466658605524]
変形性音声変換(DVC)における話者同一性維持のための新しいパラダイムを提案する。
変形性音声の質は統計VCによって大幅に改善される。
しかし, 変形性関節症患者の通常の発話は, ほとんど収集できないため, 過去の研究は患者の個性を取り戻すことはできなかった。
論文 参考訳(メタデータ) (2021-06-02T18:41:03Z) - NUVA: A Naming Utterance Verifier for Aphasia Treatment [49.114436579008476]
失語症(PWA)患者の治療介入に対する反応の診断とモニタリングの両立のための画像命名タスクを用いた音声性能評価
本稿では,失語症脳卒中患者の「正しい」と「正しくない」を分類する深層学習要素を組み込んだ発話検証システムであるNUVAについて述べる。
イギリス系英語8ヶ国語でのテストでは、システムの性能精度は83.6%から93.6%の範囲であり、10倍のクロスバリデーション平均は89.5%であった。
論文 参考訳(メタデータ) (2021-02-10T13:00:29Z) - Comparison of Speaker Role Recognition and Speaker Enrollment Protocol
for conversational Clinical Interviews [9.728371067160941]
エンドツーエンドのニューラルネットワークアーキテクチャをトレーニングし、各タスクに適応し、各アプローチを同じメトリクスで評価します。
結果は面接者の人口統計にも依存せず,その臨床的意義を浮き彫りにした。
論文 参考訳(メタデータ) (2020-10-30T09:07:37Z) - Stutter Diagnosis and Therapy System Based on Deep Learning [2.3581263491506097]
スタッタリング(stammering)は、音声の連続性を破るコミュニケーション障害である。
本稿では,MFCC音声特徴に対するGated Recurrent CNNを用いたスタッター診断エージェントの実装と,SVMを用いた治療勧告エージェントの実装に焦点を当てた。
論文 参考訳(メタデータ) (2020-07-13T10:24:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。