論文の概要: Aligning Stuttered-Speech Research with End-User Needs: Scoping Review, Survey, and Guidelines
- arxiv url: http://arxiv.org/abs/2604.20535v1
- Date: Wed, 22 Apr 2026 13:16:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-23 15:36:11.137522
- Title: Aligning Stuttered-Speech Research with End-User Needs: Scoping Review, Survey, and Guidelines
- Title(参考訳): エンドユーザーニーズによる音声研究の調整:スコーピングレビュー,サーベイ,ガイドライン
- Authors: Hawau Olamide Toyin, Mutiah Apampa, Toluwani Aremu, Humaid Alblooshi, Ana Rita Valente, Gonçalo Leal, Zhengjun Yue, Zeerak Talat, Hanan Aldarmaki,
- Abstract要約: 筆者らは,現在研究の方向性が利害関係者の要求とどのように異なるかを特定するため,散発音声研究の分類法を提案する。
具体的なガイドラインと方向性を概説して, 混乱するコミュニティの本当のニーズに対処する。
- 参考スコア(独自算出の注目度): 13.074096268605262
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Atypical speech is receiving greater attention in speech technology research, but much of this work unfolds with limited interdisciplinary dialogue. For stuttered speech in particular, it is widely recognised that current speech recognition systems fall short in practice, and current evaluation methods and research priorities are not systematically grounded in end-user experiences and needs. In this work, we analyse these gaps through 1) a scoping review of papers that deal with stuttered speech and 2) a survey of 70 stakeholders, including adults who stutter and speech-language pathologists. By analysing these two perspectives, we propose a taxonomy of stuttered-speech research, identify where current research directions diverge from the needs articulated by stakeholders, and conclude by outlining concrete guidelines and directions towards addressing the real needs of the stuttering community.
- Abstract(参考訳): 非定型音声は音声技術研究において注目されているが、この研究の多くは学際的対話に限られている。
特に散らばった音声の場合、現在の音声認識システムは実際は不足しており、現在の評価方法や研究の優先順位はエンドユーザー体験やニーズに体系的に基礎を置いていないことが広く認識されている。
この研究では、これらのギャップを分析します。
1)散発的な言論に対処する論文のスコーピングレビュー
2) 言語病理学者や言語病理学者を含む70人の利害関係者を対象とした調査。
これら2つの視点を分析した結果,現在研究の方向性が利害関係者の指示するニーズとどのように異なるのかを識別し,具体的なガイドラインと課題を整理し,コミュニティの真のニーズに対応するための方向性を概説する。
関連論文リスト
- WavChat: A Survey of Spoken Dialogue Models [66.82775211793547]
GPT-4oのようなシステムで実証された音声対話モデルの最近の進歩は、音声領域において大きな注目を集めている。
これらの高度な音声対話モデルは、音声、音楽、その他の音声関連の特徴を理解するだけでなく、音声のスタイリスティックな特徴や音節的な特徴も捉える。
音声対話システムの進歩にもかかわらず、これらのシステムを体系的に組織化し分析する包括的調査が欠如している。
論文 参考訳(メタデータ) (2024-11-15T04:16:45Z) - Self-supervised Speech Models for Word-Level Stuttered Speech Detection [66.46810024006712]
自己教師付き音声モデルを利用した単語レベルの発声音声検出モデルを提案する。
本評価は, 単語レベルの発声検出において, 従来の手法を超越していることを示す。
論文 参考訳(メタデータ) (2024-09-16T20:18:20Z) - Question-Interlocutor Scope Realized Graph Modeling over Key Utterances
for Dialogue Reading Comprehension [61.55950233402972]
本稿では,対話読解のためのキーワード抽出手法を提案する。
複数の連続した発話によって形成された単位に対して予測を行い、より多くの回答を含む発話を実現する。
発話のテキスト上に構築されたグラフとして,質問-対話者スコープ実現グラフ(QuISG)モデルを提案する。
論文 参考訳(メタデータ) (2022-10-26T04:00:42Z) - Machine Learning for Stuttering Identification: Review, Challenges &
Future Directions [9.726119468893721]
発声は、不随意の停止と音の繰り返しによって発声の流れが中断される発声障害である。
機械学習とディープラーニングの最近の進歩は、音声領域を劇的に革新させた。
この研究は、学際的な分野から研究者を集めようとすることでギャップを埋める。
論文 参考訳(メタデータ) (2021-07-08T18:15:20Z) - Streaming Multi-talker Speech Recognition with Joint Speaker
Identification [77.46617674133556]
SURITは、音声認識と話者識別の両方のバックボーンとして、リカレントニューラルネットワークトランスデューサ(RNN-T)を採用しています。
Librispeechから派生したマルチストーカーデータセットであるLibrispeechデータセットに関するアイデアを検証し、奨励的な結果を提示した。
論文 参考訳(メタデータ) (2021-04-05T18:37:33Z) - Speaker-Utterance Dual Attention for Speaker and Utterance Verification [77.2346078109261]
我々は,統合ニューラルネットワークにおける話者発話二重注意(SUDA)の考え方を実装した。
提案するSUDAは,話者と発話情報ストリーム間のインタラクションを学習するためのアテンションマスク機構を備えている。
論文 参考訳(メタデータ) (2020-08-20T11:37:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。