論文の概要: The Interspeech 2025 Speech Accessibility Project Challenge
- arxiv url: http://arxiv.org/abs/2507.22047v1
- Date: Tue, 29 Jul 2025 17:50:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-30 17:08:56.781167
- Title: The Interspeech 2025 Speech Accessibility Project Challenge
- Title(参考訳): 2025年音声アクセシビリティプロジェクトチャレンジ
- Authors: Xiuwen Zheng, Bornali Phukon, Jonghwan Na, Ed Cutrell, Kyu Han, Mark Hasegawa-Johnson, Pan-Pan Jiang, Aadhrik Kuila, Colin Lea, Bob MacDonald, Gautam Mantena, Venkatesh Ravichandran, Leda Sari, Katrin Tomanek, Chang D. Yoo, Chris Zwilling,
- Abstract要約: 2025 音声アクセシビリティプロジェクト(Interspeech Speech Accessibility Project)が開始され、400時間以上のSAPデータが収集され、500人以上の音声障害者から書き起こされた。
22チーム中12チームがワードエラー率とセマンティックスコアでwhisper-large-v2ベースラインを上回った。
トップチームは8.11%のWERと88.44%のSemScoreを同時に達成した。
- 参考スコア(独自算出の注目度): 35.902086799949345
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While the last decade has witnessed significant advancements in Automatic Speech Recognition (ASR) systems, performance of these systems for individuals with speech disabilities remains inadequate, partly due to limited public training data. To bridge this gap, the 2025 Interspeech Speech Accessibility Project (SAP) Challenge was launched, utilizing over 400 hours of SAP data collected and transcribed from more than 500 individuals with diverse speech disabilities. Hosted on EvalAI and leveraging the remote evaluation pipeline, the SAP Challenge evaluates submissions based on Word Error Rate and Semantic Score. Consequently, 12 out of 22 valid teams outperformed the whisper-large-v2 baseline in terms of WER, while 17 teams surpassed the baseline on SemScore. Notably, the top team achieved the lowest WER of 8.11\%, and the highest SemScore of 88.44\% at the same time, setting new benchmarks for future ASR systems in recognizing impaired speech.
- Abstract(参考訳): 過去10年間、自動音声認識(ASR)システムの大幅な進歩が見られたが、これらの障害を持つ個人に対するシステムの性能は、部分的には公開トレーニングデータに制限があるため、依然として不十分である。
このギャップを埋めるため、SAP(Interspeech Speech Accessibility Project)チャレンジが2025年に開始され、多様な音声障害を持つ500人以上の個人から収集・転写された400時間以上のSAPデータを活用した。
EvalAI上にホストされ、リモート評価パイプラインを活用するSAP Challengeでは、Word Error RateとSemantic Scoreに基づいて、提案を評価している。
その結果、22チーム中12チームがWERでwhisper-large-v2ベースラインを上回っ、17チームがSemScoreベースラインを上回った。
特に、トップチームは8.11\%のWERと88.44\%のSemScoreを同時に達成し、障害のある音声を認識するための将来のASRシステムのための新しいベンチマークを設定した。
関連論文リスト
- Recent Trends in Distant Conversational Speech Recognition: A Review of CHiME-7 and 8 DASR Challenges [58.80034860169605]
CHiME-7と8つの遠隔音声認識(DASR)の課題は、多チャンネル、一般化可能、共同自動音声認識(ASR)、対話音声のダイアリゼーションである。
本稿では,参加者からの重要傾向を分析しつつ,課題の設計,評価指標,データセット,ベースラインシステムについて概説する。
論文 参考訳(メタデータ) (2025-07-24T07:56:24Z) - The Multimodal Information Based Speech Processing (MISP) 2025 Challenge: Audio-Visual Diarization and Recognition [95.95622220065884]
MISP 2025 Challengeは、ビデオモダリティをオーディオと組み合わせることで、マルチモーダル、マルチデバイスミーティングの書き起こしに焦点を当てている。
最高の性能のシステムはベースラインよりも大幅に改善された。
論文 参考訳(メタデータ) (2025-05-20T06:11:51Z) - ICMC-ASR: The ICASSP 2024 In-Car Multi-Channel Automatic Speech
Recognition Challenge [94.13624830833314]
この課題は、新しいエネルギー車両内で記録された100時間以上のマルチチャネル音声データを収集する。
1位チームのUSTCiflytekはASRトラックで13.16%のCER、ASDRトラックで21.48%のcpCERを達成した。
論文 参考訳(メタデータ) (2024-01-07T12:51:42Z) - Summary on the ISCSLP 2022 Chinese-English Code-Switching ASR Challenge [25.69349931845173]
ISCSLP 2022 CSASRチャレンジでは、TAL_CSASRコーパスとMagicData-RAMCコーパス、参加者向けの開発とテストセットの2つのトレーニングセットが提供された。
40以上のチームがこの挑戦に参加し、勝者チームは16.70%の混合誤差率(MER)をテストセットで達成した。
本稿では、データセット、関連するベースラインシステム、および要件を説明し、CSASRチャレンジ結果と提案システムで使用される主要なテクニックとトリックを要約する。
論文 参考訳(メタデータ) (2022-10-12T11:05:13Z) - Recent Progress in the CUHK Dysarthric Speech Recognition System [66.69024814159447]
障害音声は、現在のデータ集約型ディープニューラルネットワーク(DNN)に基づく自動音声認識技術に対して、幅広い課題を提示している。
本稿では,香港の中国大学における音声認識システムの性能向上に向けた最近の研究成果について述べる。
論文 参考訳(メタデータ) (2022-01-15T13:02:40Z) - The NTNU System at the Interspeech 2020 Non-Native Children's Speech ASR
Challenge [13.232899176888575]
本稿では,ISCAのSIG-ChiLDグループによって支援された,2020年の非Native Children's Speech ASR Challengeについて述べる。
すべての参加者は、主催者が提供した音声とテキストのコーパスに基づいてシステムを開発することを制限された。
そこで我々は,CNN-TDNNFをベースとした音響モデル上にASRシステムを構築した。
論文 参考訳(メタデータ) (2020-05-18T02:51:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。