論文の概要: Automatic Pronunciation Assessment -- A Review
- arxiv url: http://arxiv.org/abs/2310.13974v1
- Date: Sat, 21 Oct 2023 11:26:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-25 04:20:03.770546
- Title: Automatic Pronunciation Assessment -- A Review
- Title(参考訳): 発音自動評価 -一考察-
- Authors: Yassine El Kheir, Ahmed Ali, and Shammur Absar Chowdhury
- Abstract要約: 音韻・韻律の発音評価における手法について検討する。
我々は、顕著な研究トレンドで観察される主な課題を分類し、既存の制限と利用可能なリソースを強調します。
- 参考スコア(独自算出の注目度): 9.03199811315687
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Pronunciation assessment and its application in computer-aided pronunciation
training (CAPT) have seen impressive progress in recent years. With the rapid
growth in language processing and deep learning over the past few years, there
is a need for an updated review. In this paper, we review methods employed in
pronunciation assessment for both phonemic and prosodic. We categorize the main
challenges observed in prominent research trends, and highlight existing
limitations, and available resources. This is followed by a discussion of the
remaining challenges and possible directions for future work.
- Abstract(参考訳): 近年,コンピュータ支援発音訓練(CAPT)における発音評価とその応用は著しく進歩している。
過去数年間の言語処理とディープラーニングの急速な増加に伴い、改訂されたレビューが必要である。
本稿では,音韻と韻律の両方で発音評価を行う手法について検討する。
我々は、顕著な研究トレンドで見られる主な課題を分類し、既存の制限と利用可能なリソースを強調します。
続いて、残る課題と今後の作業の可能な方向性について議論する。
関連論文リスト
- The VoxCeleb Speaker Recognition Challenge: A Retrospective [75.40776645175585]
VoxCeleb Speaker Recognition Challenges (VoxSRC)は、2019年から2023年にかけて毎年開催される一連の課題とワークショップである。
課題は主に、様々な環境下で話者認識とダイアリゼーションのタスクを評価した。
私たちは、これらの課題について、彼らが何を探求したのか、課題参加者によって開発された方法、そしてそれらがどのように進化したのかをレビューします。
論文 参考訳(メタデータ) (2024-08-27T08:57:31Z) - A Comprehensive Survey of Sentence Representations: From the BERT Epoch
to the ChatGPT Era and Beyond [45.455178613559006]
文表現は、検索、質問応答、テキスト分類などのNLPアプリケーションにおいて重要な要素である。
彼らは文章の意味を捉え、機械が人間の言語について理解し、推論することを可能にする。
文表現に関する文献のレビューは今のところない。
論文 参考訳(メタデータ) (2023-05-22T02:31:15Z) - Deep Learning for Visual Speech Analysis: A Survey [54.53032361204449]
本稿では,視覚音声分析におけるディープラーニング手法の最近の進歩を概観する。
私たちは、基本的な問題、課題、ベンチマークデータセット、既存のメソッドの分類、最先端のパフォーマンスなど、視覚音声のさまざまな側面をカバーしています。
論文 参考訳(メタデータ) (2022-05-22T14:44:53Z) - Self-Supervised Speech Representation Learning: A Review [105.1545308184483]
自己教師付き表現学習法は、幅広いタスクやドメインに利益をもたらす単一の普遍的モデルを約束する。
音声表現学習は、生成的、コントラスト的、予測的という3つの主要なカテゴリで同様の進歩を経験している。
本稿では,自己指導型音声表現学習のアプローチと,他の研究領域との関係について述べる。
論文 参考訳(メタデータ) (2022-05-21T16:52:57Z) - Automated Audio Captioning: an Overview of Recent Progress and New
Challenges [56.98522404673527]
自動音声キャプションは、与えられた音声クリップの自然言語記述を生成することを目的とした、モーダル横断翻訳タスクである。
本稿では、既存の様々なアプローチから評価指標やデータセットまで、自動音声キャプションにおけるコントリビューションの総合的なレビューを行う。
論文 参考訳(メタデータ) (2022-05-12T08:36:35Z) - Automated scholarly paper review: Concepts, technologies, and challenges [5.431798850623952]
近年、ピアレビュープロセスを支援するために人工知能(AI)が応用されている。
人間の関与により、このような制限は避けられないままである。
論文 参考訳(メタデータ) (2021-11-15T04:44:57Z) - The Potential of Machine Learning and NLP for Handling Students'
Feedback (A Short Survey) [0.0]
本稿では,近年,データマイニング技術を用いた学生のフィードバック論文の文献を概説する。
特に注目すべきは、機械学習アプローチとディープラーニングアプローチの両方を使用している論文に焦点を当てることだ。
論文 参考訳(メタデータ) (2020-11-07T17:28:40Z) - Low-resource Languages: A Review of Past Work and Future Challenges [68.8204255655161]
NLPの現在の問題は、教師付きデータやネイティブスピーカーの数、専門家数といった、有用なトレーニング属性が欠けている低リソース言語のマッサージと処理である。
本稿は、この問題の解決に向けたこれまでの画期的な成果を簡潔に要約し、今後の研究の方向性の文脈における潜在的な改善について分析する。
論文 参考訳(メタデータ) (2020-06-12T15:21:57Z) - What comprises a good talking-head video generation?: A Survey and
Benchmark [40.26689818789428]
本稿では,標準化されたデータセット前処理戦略を用いた対話型ビデオ生成の評価ベンチマークを提案する。
提案手法は,対話型ビデオに望ましい特性とみなす結果を評価するために,新しい指標を提案するか,最も適した指標を選択する。
論文 参考訳(メタデータ) (2020-05-07T01:58:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。