論文の概要: Proficiency assessment of L2 spoken English using wav2vec 2.0
- arxiv url: http://arxiv.org/abs/2210.13168v1
- Date: Mon, 24 Oct 2022 12:36:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-25 18:48:27.188315
- Title: Proficiency assessment of L2 spoken English using wav2vec 2.0
- Title(参考訳): wav2vec 2.0を用いたl2話者英語の習熟度評価
- Authors: Stefano Bann\`o and Marco Matassoni
- Abstract要約: wav2vec 2.0 を用いて、2つの小さなデータセットの総合的および個別的な習熟度を評価する。
その結果,本手法は,ASRと手書きによる手書き文字起こしを訓練したBERTベースのベースラインシステムよりも有意に優れていることがわかった。
- 参考スコア(独自算出の注目度): 3.4012007729454816
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The increasing demand for learning English as a second language has led to a
growing interest in methods for automatically assessing spoken language
proficiency. Most approaches use hand-crafted features, but their efficacy
relies on their particular underlying assumptions and they risk discarding
potentially salient information about proficiency. Other approaches rely on
transcriptions produced by ASR systems which may not provide a faithful
rendition of a learner's utterance in specific scenarios (e.g., non-native
children's spontaneous speech). Furthermore, transcriptions do not yield any
information about relevant aspects such as intonation, rhythm or prosody. In
this paper, we investigate the use of wav2vec 2.0 for assessing overall and
individual aspects of proficiency on two small datasets, one of which is
publicly available. We find that this approach significantly outperforms the
BERT-based baseline system trained on ASR and manual transcriptions used for
comparison.
- Abstract(参考訳): 第二言語としての英語学習の需要が高まり、言語習熟度を自動的に評価する方法への関心が高まっている。
ほとんどのアプローチでは手作りの特徴を用いるが、その効力は特定の前提に依存しており、熟練度に関する潜在的に有能な情報を捨てるリスクがある。
他のアプローチは、特定のシナリオ(例えば、非ネイティブな子供の自発的な発話)で学習者の発話を忠実に再現しないASRシステムによって生成される転写に依存している。
さらに、転写はイントネーション、リズム、韻律といった関連する側面に関する情報を与えない。
本稿では,2つの小データセットの総合的および個別的な習熟度評価にwav2vec 2.0を用いることを検討した。
その結果,本手法は,ASRと手書きによる手書き文字起こしを訓練したBERTベースのベースラインシステムよりも優れていることがわかった。
関連論文リスト
- Prosody in Cascade and Direct Speech-to-Text Translation: a case study
on Korean Wh-Phrases [79.07111754406841]
本研究は,韻律が重要な役割を果たす発話を明瞭にするための直接S2TTシステムの能力を評価するために,コントラスト評価を用いることを提案する。
本結果は,カスケード翻訳モデルよりも直接翻訳システムの価値を明確に示すものである。
論文 参考訳(メタデータ) (2024-02-01T14:46:35Z) - Leveraging Cross-Lingual Transfer Learning in Spoken Named Entity Recognition Systems [1.2494184403263342]
パイプラインとエンド・ツー・エンドの両方のアプローチを用いて,オランダ語,英語,ドイツ語間の移動学習手法を適用した。
我々は、カスタム擬似アノテーション付きデータセットにWav2Vec2 XLS-Rモデルを用いて、言語間システムの適応性を評価する。
論文 参考訳(メタデータ) (2023-07-03T19:30:24Z) - Automatic Speech Recognition of Non-Native Child Speech for Language
Learning Applications [18.849741353784328]
我々は、最先端のASRシステムであるWav2Vec2.0とWhisper AIの性能を評価する。
オランダ語母語,非母語母語母語,非母語母語母語,母語母語母語母語母語,母語母語母語母語母語,母語母語母語母語母語母語母語母語,母語母語母語母語母語母語母語母語,母語母語母語母語母語母語
論文 参考訳(メタデータ) (2023-06-29T06:14:26Z) - Hindi as a Second Language: Improving Visually Grounded Speech with
Semantically Similar Samples [89.16814518860357]
本研究の目的は,多言語の観点からの視覚的基盤音声モデル(VGS)の学習を検討することである。
この研究における重要な貢献は、低リソース言語の性能を向上させるために、バイリンガルな視覚的基盤を持つ音声モデルにおける高リソース言語のパワーを活用することである。
論文 参考訳(メタデータ) (2023-03-30T16:34:10Z) - L2 proficiency assessment using self-supervised speech representations [35.70742768910494]
本研究は,音声認識を必要とせず,自己教師型音声表現に基づく初期分析を大規模習熟度試験に拡張する。
自己教師型wav2vec 2.0システムの性能は、高性能の手作り評価システムとBERTベースのテキストシステムと比較される。
wav2vec 2.0ベースのシステムは応答の性質に敏感であることがわかったが、音声の書き起こしを必要とするシステムと同等の性能を持つように構成することができる。
論文 参考訳(メタデータ) (2022-11-16T11:47:20Z) - Knowledge-Rich BERT Embeddings for Readability Assessment [0.0]
本稿では,BERTモデルの情報豊富な埋め込みを共同学習手法により活用する方法を提案する。
提案手法は,英語とフィリピン語のデータセットを用いた可読性評価において,従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2021-06-15T07:37:48Z) - Leveraging Pre-trained Language Model for Speech Sentiment Analysis [58.78839114092951]
本研究では、事前学習された言語モデルを用いて、文章の感情情報を学習し、音声の感情分析を行う。
本稿では,言語モデルを用いた擬似ラベルに基づく半教師付き訓練戦略を提案する。
論文 参考訳(メタデータ) (2021-06-11T20:15:21Z) - Improving Cross-Lingual Reading Comprehension with Self-Training [62.73937175625953]
現在の最新モデルは、いくつかのベンチマークで人間のパフォーマンスを上回っています。
前作では、ゼロショットのクロスリンガル読解のための事前訓練された多言語モデルの能力を明らかにしている。
本稿では,ラベルのないデータを利用して性能を向上する。
論文 参考訳(メタデータ) (2021-05-08T08:04:30Z) - Building Low-Resource NER Models Using Non-Speaker Annotation [58.78968578460793]
言語横断的な手法はこれらの懸念に対処する上で顕著な成功を収めた。
本稿では,Non-Speaker''(NS)アノテーションを用いた低リソース名前付きエンティティ認識(NER)モデル構築のための補完的アプローチを提案する。
NSアノテータの使用は、現代の文脈表現上に構築された言語間メソッドよりも、一貫した結果が得られることを示す。
論文 参考訳(メタデータ) (2020-06-17T03:24:38Z) - Syntactic Structure Distillation Pretraining For Bidirectional Encoders [49.483357228441434]
本稿では,BERTプレトレーニングに構文バイアスを注入するための知識蒸留手法を提案する。
我々は,構文的 LM から単語の周辺分布を抽出する。
本研究は,大量のデータを利用する表現学習者においても,構文バイアスの利点を示すものである。
論文 参考訳(メタデータ) (2020-05-27T16:44:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。