論文の概要: KSoF: The Kassel State of Fluency Dataset -- A Therapy Centered Dataset
of Stuttering
- arxiv url: http://arxiv.org/abs/2203.05383v1
- Date: Thu, 10 Mar 2022 14:17:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-11 15:44:39.456556
- Title: KSoF: The Kassel State of Fluency Dataset -- A Therapy Centered Dataset
of Stuttering
- Title(参考訳): KSoF: Kassel State of Fluency Dataset -- スタタリングのセラピー中心のデータセット
- Authors: Sebastian P. Bayerl, Alexander Wolff von Gudenberg, Florian H\"onig,
Elmar N\"oth and Korbinian Riedhammer
- Abstract要約: この研究で紹介されるKassel State of Fluency (KSoF)は、治療ベースのデータセットで、5500以上の散在するPWSのクリップを含んでいる。
オーディオは、Institut der Kasseler Stottertherapieのセラピーセッション中に録音された。
- 参考スコア(独自算出の注目度): 58.91587609873915
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Stuttering is a complex speech disorder that negatively affects an
individual's ability to communicate effectively. Persons who stutter (PWS)
often suffer considerably under the condition and seek help through therapy.
Fluency shaping is a therapy approach where PWSs learn to modify their speech
to help them to overcome their stutter. Mastering such speech techniques takes
time and practice, even after therapy. Shortly after therapy, success is
evaluated highly, but relapse rates are high. To be able to monitor speech
behavior over a long time, the ability to detect stuttering events and
modifications in speech could help PWSs and speech pathologists to track the
level of fluency. Monitoring could create the ability to intervene early by
detecting lapses in fluency. To the best of our knowledge, no public dataset is
available that contains speech from people who underwent stuttering therapy
that changed the style of speaking. This work introduces the Kassel State of
Fluency (KSoF), a therapy-based dataset containing over 5500 clips of PWSs. The
clips were labeled with six stuttering-related event types: blocks,
prolongations, sound repetitions, word repetitions, interjections, and -
specific to therapy - speech modifications. The audio was recorded during
therapy sessions at the Institut der Kasseler Stottertherapie. The data will be
made available for research purposes upon request.
- Abstract(参考訳): 発声は、個人の効果的なコミュニケーション能力に悪影響を及ぼす複雑な音声障害である。
スタッター(PWS)の患者は、しばしばその状態下でかなり苦しめられ、治療を通じて助けを求める。
フルエンシシェーピング(fluency shaping)は、pwsが発話の修正を学んで、混乱を克服するのに役立つセラピーアプローチである。
このような音声技法を習得するには、治療後にも時間と練習が必要である。
治療後すぐに、成功は高く評価されるが、再発率は高い。
長期間にわたって音声の振る舞いをモニタリングするためには、発話中の乱れや変化を検出する能力は、PWSや言語病理学者が流感のレベルを追跡するのに役立つ。
モニタリングは、流し込みの経過を検出することによって、早期に介入する能力を生み出す可能性がある。
われわれの知る限りでは、話し方を変えた散発的な治療を受けた人々のスピーチを含む公開データセットは提供されていない。
5500以上のpwsクリップを含むセラピーベースのデータセットであるkassel state of fluency(ksof)を紹介する。
ビデオクリップには、ブロック、延長、音の繰り返し、単語の繰り返し、インタージェクション、言語修正の6種類の散らばったイベントタイプがラベル付けされた。
オーディオは、Institut der Kasseler Stottertherapieのセラピーセッション中に録音された。
データは、要求に応じて研究目的に提供される。
関連論文リスト
- Self-supervised Speech Models for Word-Level Stuttered Speech Detection [66.46810024006712]
自己教師付き音声モデルを利用した単語レベルの発声音声検出モデルを提案する。
本評価は, 単語レベルの発声検出において, 従来の手法を超越していることを示す。
論文 参考訳(メタデータ) (2024-09-16T20:18:20Z) - DisfluencyFixer: A tool to enhance Language Learning through Speech To
Speech Disfluency Correction [50.51901599433536]
DisfluencyFixerは、英語とヒンディー語で音声から音声への拡散補正を行うツールである。
提案システムでは,入力音声からの拡散を除去し,出力として流速音声を返却する。
論文 参考訳(メタデータ) (2023-05-26T14:13:38Z) - Detecting Dysfluencies in Stuttering Therapy Using wav2vec 2.0 [0.22940141855172028]
英語コーパスのスタブリング分類のための微調整wav2vec 2.0は、汎用的特徴の有効性を高める。
本稿では、Fluencybankとドイツのセラピー中心のKassel State of Fluencyデータセットについて評価する。
論文 参考訳(メタデータ) (2022-04-07T13:02:12Z) - Investigation of Data Augmentation Techniques for Disordered Speech
Recognition [69.50670302435174]
本稿では,不規則音声認識のための一連のデータ拡張手法について検討する。
正常な音声と無秩序な音声の両方が増強過程に利用された。
UASpeechコーパスを用いた最終話者適応システムと、最大2.92%の絶対単語誤り率(WER)の速度摂動に基づく最良の拡張アプローチ
論文 参考訳(メタデータ) (2022-01-14T17:09:22Z) - STAN: A stuttering therapy analysis helper [59.37911277681339]
発声は、繰り返し、音、音節または単語の延長、発話中のブロックによって識別される複雑な音声障害である。
本稿では, 言語療法士を支援するシステムSTANについて紹介する。
論文 参考訳(メタデータ) (2021-06-15T13:48:12Z) - Stuttering Speech Disfluency Prediction using Explainable Attribution
Vectors of Facial Muscle Movements [2.6540572249827514]
発声などの発声障害は、不随意反復、延長、音節や音節のブロックによって、通常の発声を阻害する。
近年,音声発声時の呼吸速度,音声等からAIアルゴリズムを用いて発声を自動的に検出する手法が研究されている。
非侵襲的にキャプチャ可能な、AWSの音声前の顔活動には、今後の発声を流音または発声のいずれかとして正確に分類するための十分な情報が含まれている、という仮説を立てています。
論文 参考訳(メタデータ) (2020-10-02T23:45:41Z) - Silent Speech Interfaces for Speech Restoration: A Review [59.68902463890532]
サイレント音声インタフェース (SSI) の研究は、重度音声障害の患者に対して、代替的で拡張的なコミュニケーション方法を提供することを目的としている。
SSIは、コミュニケーションを可能にするために、音声生成中に人体によって生成される非音響バイオシグナーに依存している。
現在、ほとんどのSSIは、健康なユーザーのために実験室でのみ検証されている。
論文 参考訳(メタデータ) (2020-09-04T11:05:50Z) - Stutter Diagnosis and Therapy System Based on Deep Learning [2.3581263491506097]
スタッタリング(stammering)は、音声の連続性を破るコミュニケーション障害である。
本稿では,MFCC音声特徴に対するGated Recurrent CNNを用いたスタッター診断エージェントの実装と,SVMを用いた治療勧告エージェントの実装に焦点を当てた。
論文 参考訳(メタデータ) (2020-07-13T10:24:02Z) - Towards Automated Assessment of Stuttering and Stuttering Therapy [0.22940141855172028]
発声は複雑な発声障害であり、繰り返し、音、音節または単語の延長、発話中のブロックによって識別できる。
発声重大度評価の一般的な方法は、発声中の3つの最長発声症状の平均である発声音節(%SS)、最近導入された発声効率スコア(SES)などがある。
本稿では,スタブリングの重症度を評価する新しい手法である音声制御指標(SCI)を提案する。
論文 参考訳(メタデータ) (2020-06-16T14:50:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。