論文の概要: Evaluation of the syllables pronunciation quality in speech
rehabilitation through the solution of the classification problem
- arxiv url: http://arxiv.org/abs/2301.10585v1
- Date: Wed, 25 Jan 2023 13:43:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-26 15:11:06.652597
- Title: Evaluation of the syllables pronunciation quality in speech
rehabilitation through the solution of the classification problem
- Title(参考訳): 分類問題の解を用いた音声リハビリテーションにおける音節発音品質の評価
- Authors: Evgeny Kostyuchenko
- Abstract要約: この評価は、音節を外科治療前後の2つのクラスに分類する問題を解くことによって行われる。
再生過程における音節の発音の質を評価する尺度は、手術前のクラスに属する尺度である。
既存の音節発音品質評価との比較を行い、その結果の新しい音節品質評価の実践的な適用を推奨する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The solution of the problem of assessing the quality of the pronunciation of
syllables during speech rehabilitation after surgical treatment of oncological
diseases of the organs of the speech-forming tract is considered in the work.
The assessment is carried out by solving the problem of classifying syllables
into two classes: before and immediately after surgical treatment. A classifier
is built on the basis of the LSTM neural network and trained on the records
before the operation and immediately after it, before the start of speech
rehabilitation. The measure of assessing the quality of syllables pronunciation
in the process of rehabilitation is the metric of belonging to the class before
the operation. A study is being made of the influence of taking into account
problematic phonemes, the gender of the patient, his individual characteristics
on the resulting estimates of the quality of pronunciation. A comparison with
existing types of syllable pronunciation quality assessments is carried out,
recommendations are given for the practical application of the resulting new
class of pronunciation quality assessments.
- Abstract(参考訳): 本研究は, 発声器の腫瘍性疾患に対する外科的治療後の音声リハビリテーションにおける音節発音の質評価の問題点について考察した。
この評価は、音節を外科治療前後の2つのクラスに分類する問題を解くことによって行われる。
分類器は、lstmニューラルネットワークに基づいて構築され、音声リハビリの開始前に、手術前およびその直後の記録に基づいて訓練される。
リハビリテーションの過程における音節発音の質を評価する尺度は、手術前のクラスに属する指標である。
ある研究は、問題のある音素、患者の性別、彼の個人的特徴が、結果として生じる発音の質の推定に与える影響を考慮に入れている。
既存の音節発音品質評価との比較を行い、得られた新しい発音品質評価のクラスを実践するために推奨する。
関連論文リスト
- Self-supervised Speech Models for Word-Level Stuttered Speech Detection [66.46810024006712]
自己教師付き音声モデルを利用した単語レベルの発声音声検出モデルを提案する。
本評価は, 単語レベルの発声検出において, 従来の手法を超越していることを示す。
論文 参考訳(メタデータ) (2024-09-16T20:18:20Z) - Developing vocal system impaired patient-aimed voice quality assessment approach using ASR representation-included multiple features [0.4681310436826459]
本稿では,音声認識と自己教師型学習表現の利用について紹介する。
実験ではPVQDデータセットのチェックを行い、英語における様々な声道系の損傷の原因をカバーし、パーキンソン病の患者に焦点を当てた日本語データセットを作成した。
PVQDの結果, PCCでは0.8, MSEでは0.5と顕著な相関がみられた。
論文 参考訳(メタデータ) (2024-08-22T10:22:53Z) - A Comprehensive Rubric for Annotating Pathological Speech [0.0]
音声学, 流音学, 韻律学など, 音声品質の様々な側面に基づく包括的ルーリックを導入する。
本研究の目的は,ダウン症候群患者の発話中の誤りを識別するための標準化基準を確立することである。
論文 参考訳(メタデータ) (2024-04-29T16:44:27Z) - Deep Multimodal Fusion for Surgical Feedback Classification [70.53297887843802]
外科的フィードバックの5カテゴリー分類を臨床的に検証した。
次に,テキスト,音声,ビデオモダリティの入力から,これらの5つのカテゴリの外科的フィードバックを分類するために,多ラベル機械学習モデルを開発した。
我々の研究の最終的な目標は、リアルタイムな文脈的外科的フィードバックのアノテーションを大規模に自動化することである。
論文 参考訳(メタデータ) (2023-12-06T01:59:47Z) - Lightly Weighted Automatic Audio Parameter Extraction for the Quality
Assessment of Consensus Auditory-Perceptual Evaluation of Voice [18.8222742272435]
提案手法は, ジッタ, 絶対ジッタ, シャマー, ハーモニック・ツー・ノイズ比 (HNR) , ゼロクロスという, 年齢, 性別, および5つの音響パラメータを利用する。
その結果,提案手法は最先端技術(SOTA)手法と類似し,一般的な音声事前学習モデルを用いて得られた潜在表現よりも優れることがわかった。
論文 参考訳(メタデータ) (2023-11-27T07:19:22Z) - Continuous Modeling of the Denoising Process for Speech Enhancement
Based on Deep Learning [61.787485727134424]
状態変数をデノナイジングプロセスを示すために使用します。
UNetのようなニューラルネットワークは、連続的復調プロセスからサンプリングされたすべての状態変数を推定することを学ぶ。
実験結果から, クリーンターゲットに少量の雑音を保存することは, 音声強調に有効であることが示唆された。
論文 参考訳(メタデータ) (2023-09-17T13:27:11Z) - Automated Fidelity Assessment for Strategy Training in Inpatient
Rehabilitation using Natural Language Processing [53.096237570992294]
戦略トレーニング (Strategy Training) とは、脳卒中後の認知障害患者に障害を減らすためのスキルを教える、リハビリテーションのアプローチである。
標準化された忠実度評価は治療原則の遵守度を測定するために用いられる。
本研究では,ルールベースNLPアルゴリズム,長短項メモリ(LSTM)モデル,および変換器(BERT)モデルからの双方向エンコーダ表現を開発した。
論文 参考訳(メタデータ) (2022-09-14T15:33:30Z) - An Objective Evaluation Framework for Pathological Speech Synthesis [36.41726606690864]
そこで本研究では,合成病理音声の一貫した評価のための一般的な枠組みを提案する。
この枠組みは音声の質と可聴性を評価する。
本研究では, 異なるレベルの音声の理解度で, 変形性音声を合成できることを示す。
論文 参考訳(メタデータ) (2021-07-01T08:55:57Z) - A Preliminary Study of a Two-Stage Paradigm for Preserving Speaker
Identity in Dysarthric Voice Conversion [50.040466658605524]
変形性音声変換(DVC)における話者同一性維持のための新しいパラダイムを提案する。
変形性音声の質は統計VCによって大幅に改善される。
しかし, 変形性関節症患者の通常の発話は, ほとんど収集できないため, 過去の研究は患者の個性を取り戻すことはできなかった。
論文 参考訳(メタデータ) (2021-06-02T18:41:03Z) - NUVA: A Naming Utterance Verifier for Aphasia Treatment [49.114436579008476]
失語症(PWA)患者の治療介入に対する反応の診断とモニタリングの両立のための画像命名タスクを用いた音声性能評価
本稿では,失語症脳卒中患者の「正しい」と「正しくない」を分類する深層学習要素を組み込んだ発話検証システムであるNUVAについて述べる。
イギリス系英語8ヶ国語でのテストでは、システムの性能精度は83.6%から93.6%の範囲であり、10倍のクロスバリデーション平均は89.5%であった。
論文 参考訳(メタデータ) (2021-02-10T13:00:29Z) - Comparison of Speaker Role Recognition and Speaker Enrollment Protocol
for conversational Clinical Interviews [9.728371067160941]
エンドツーエンドのニューラルネットワークアーキテクチャをトレーニングし、各タスクに適応し、各アプローチを同じメトリクスで評価します。
結果は面接者の人口統計にも依存せず,その臨床的意義を浮き彫りにした。
論文 参考訳(メタデータ) (2020-10-30T09:07:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。