論文の概要: TLT-school: a Corpus of Non Native Children Speech
- arxiv url: http://arxiv.org/abs/2001.08051v1
- Date: Wed, 22 Jan 2020 15:14:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-07 18:30:11.622663
- Title: TLT-school: a Corpus of Non Native Children Speech
- Title(参考訳): TLTスクール:非ネイティブな子供たちのスピーチコーパス
- Authors: Roberto Gretter, Marco Matassoni, Stefano Bann\`o, Daniele Falavigna
- Abstract要約: 本稿では,イタリア北部の学校において,英語とドイツ語の両方を学ぶ学生のパフォーマンスを評価するために収集された発話コーパス「TLTスクール」について述べる。
コーパスは、2017年から2018年にかけて、小学校、中学校、高校に通いながら、9歳から16歳の学生から記録された。
すべての発話は、事前に定義された熟練度指標の観点から、人間の専門家によって評価されている。
- 参考スコア(独自算出の注目度): 7.417312533172291
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper describes "TLT-school" a corpus of speech utterances collected in
schools of northern Italy for assessing the performance of students learning
both English and German. The corpus was recorded in the years 2017 and 2018
from students aged between nine and sixteen years, attending primary, middle
and high school. All utterances have been scored, in terms of some predefined
proficiency indicators, by human experts. In addition, most of utterances
recorded in 2017 have been manually transcribed carefully. Guidelines and
procedures used for manual transcriptions of utterances will be described in
detail, as well as results achieved by means of an automatic speech recognition
system developed by us. Part of the corpus is going to be freely distributed to
scientific community particularly interested both in non-native speech
recognition and automatic assessment of second language proficiency.
- Abstract(参考訳): 本稿では,イタリア北部の学校において,英語とドイツ語の両方を学ぶ学生のパフォーマンスを評価するために収集された発話コーパス「TLTスクール」について述べる。
コーパスは、2017年から2018年にかけて、小学校、中学校、高校に通いながら、9歳から16歳の学生から記録された。
すべての発話は、人間の専門家によって事前に定義された熟練度指標によって評価されている。
さらに、2017年に録音されたほとんどの発話は手動で注意深く書き起こされている。
音声のマニュアルの書き起こしに使用するガイドラインと手順を詳述するとともに,私たちが開発した自動音声認識システムを用いて得られた結果について述べる。
コーパスの一部は、非ネイティブ音声認識と第二言語習熟度の自動評価の両方に関心を持つ科学コミュニティに自由に配布される。
関連論文リスト
- FLEURS-R: A Restored Multilingual Speech Corpus for Generation Tasks [27.894172151026044]
FLEURS-Rは、音声コーパスの普遍表現に関するFew-shot Learning Evaluationの音声復元応用版である。
FLEURS-Rの目的は、より多くの言語で音声技術を進歩させ、テキスト音声を含む研究を触媒することである。
論文 参考訳(メタデータ) (2024-08-12T15:28:51Z) - Speech Corpus for Korean Children with Autism Spectrum Disorder: Towards
Automatic Assessment Systems [7.153773998764661]
本稿では,韓国の子どもを対象とした音声コーパスについて紹介する。
音声・言語病理学者3人は,3点類似尺度を用いて,社会コミュニケーション重症度 (SCS) と発音能力 (PP) の評価を行った。
また,73児と9人のTD児を対象に,音声データから抽出した音響的特徴と言語学的特徴を分析した。
論文 参考訳(メタデータ) (2024-02-23T07:32:54Z) - Who Said What? An Automated Approach to Analyzing Speech in Preschool Classrooms [0.4207829324073153]
本稿では,ソフトウェアを用いて話者を分類し,発話の書き起こしを行う自動フレームワークを提案する。
筆者らは,110分間の授業記録において,本フレームワークと人間専門家の結果を比較した。
その結果, 子どもの言語発達を支援する授業音声の分析において, かなり進歩したことが示唆された。
論文 参考訳(メタデータ) (2024-01-14T18:27:37Z) - SD-HuBERT: Sentence-Level Self-Distillation Induces Syllabic
Organization in HuBERT [49.06057768982775]
音声の文レベル表現の学習において,音節的組織が出現することを示す。
本稿では,音声の文レベル表現を評価するための新しいベンチマークタスクであるSpken Speech ABXを提案する。
論文 参考訳(メタデータ) (2023-10-16T20:05:36Z) - BabySLM: language-acquisition-friendly benchmark of self-supervised
spoken language models [56.93604813379634]
音声表現を学習するための自己指導技術は、人間のラベルを必要とせずに、音声への露出から言語能力を高めることが示されている。
語彙および構文レベルで音声言語モデルを探索するために,言語習得に親しみやすいベンチマークを提案する。
テキストと音声のギャップを埋めることと、クリーンな音声とその内話のギャップを埋めることである。
論文 参考訳(メタデータ) (2023-06-02T12:54:38Z) - DisfluencyFixer: A tool to enhance Language Learning through Speech To
Speech Disfluency Correction [50.51901599433536]
DisfluencyFixerは、英語とヒンディー語で音声から音声への拡散補正を行うツールである。
提案システムでは,入力音声からの拡散を除去し,出力として流速音声を返却する。
論文 参考訳(メタデータ) (2023-05-26T14:13:38Z) - Building a Non-native Speech Corpus Featuring Chinese-English Bilingual
Children: Compilation and Rationale [3.924235219960689]
本稿では,5歳から6歳までの中英語児童の物語から成る非母語音声コーパスについて紹介する。
英語(L2)で物語理解テストを受ける子どもの合計6.5時間について,人格スコアや文法的・発音的誤りの注釈とともに紹介する。
子どもたちは中国語(L1)での並行MAIN試験も参照目的に完了した。
論文 参考訳(メタデータ) (2023-04-30T10:41:43Z) - BLASER: A Text-Free Speech-to-Speech Translation Evaluation Metric [66.73705349465207]
エンドツーエンドの音声音声翻訳(S2ST)は、一般的にテキストベースのメトリクスで評価される。
本稿では,ASRシステムへの依存を回避するために,BLASERと呼ばれるエンドツーエンドS2STのテキストフリー評価指標を提案する。
論文 参考訳(メタデータ) (2022-12-16T14:00:26Z) - Limited Data Emotional Voice Conversion Leveraging Text-to-Speech:
Two-stage Sequence-to-Sequence Training [91.95855310211176]
感情的音声変換は、言語内容と話者のアイデンティティを保ちながら、発話の感情状態を変えることを目的としている。
本研究では,感情音声データ量の少ない連続音声変換のための新しい2段階学習戦略を提案する。
提案フレームワークはスペクトル変換と韻律変換の両方が可能であり、客観的評価と主観評価の両方において最先端のベースラインを大幅に改善する。
論文 参考訳(メタデータ) (2021-03-31T04:56:14Z) - UniSpeech: Unified Speech Representation Learning with Labeled and
Unlabeled Data [54.733889961024445]
ラベル付きデータとラベル付きデータの両方を用いて音声表現を学習するためのUniSpeechという統合事前学習手法を提案する。
公立CommonVoiceコーパス上での言語間表現学習におけるUniSpeechの有効性を評価する。
論文 参考訳(メタデータ) (2021-01-19T12:53:43Z) - FT Speech: Danish Parliament Speech Corpus [21.190182627955817]
本稿では,デンマーク議会の会議記録から作成した音声コーパスであるFT Speechを紹介する。
コーパスには、合計434人の話者による1,800時間以上の音声の書き起こしが含まれている。
これは、デンマークの既存の公用語コーパスよりも、持続時間、語彙、自然発話の量において著しく大きい。
論文 参考訳(メタデータ) (2020-05-25T19:51:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。