論文の概要: Code-Switching in End-to-End Automatic Speech Recognition: A Systematic Literature Review
- arxiv url: http://arxiv.org/abs/2507.07741v1
- Date: Thu, 10 Jul 2025 13:21:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-11 16:40:15.412824
- Title: Code-Switching in End-to-End Automatic Speech Recognition: A Systematic Literature Review
- Title(参考訳): エンドツーエンド音声認識におけるコードスイッチング:体系的文献レビュー
- Authors: Maha Tufail Agro, Atharva Kulkarni, Karima Kadaoui, Zeerak Talat, Hanan Aldarmaki,
- Abstract要約: 我々は、ピアレビューされた会場で発行された論文を手動で収集し、注釈付けする。
検討された言語、データセット、メトリクス、モデル選択、パフォーマンスを文書化しています。
コードスイッチングにおけるエンドツーエンドASRの課題について論じる。
- 参考スコア(独自算出の注目度): 7.354683587671182
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Motivated by a growing research interest into automatic speech recognition (ASR), and the growing body of work for languages in which code-switching (CS) often occurs, we present a systematic literature review of code-switching in end-to-end ASR models. We collect and manually annotate papers published in peer reviewed venues. We document the languages considered, datasets, metrics, model choices, and performance, and present a discussion of challenges in end-to-end ASR for code-switching. Our analysis thus provides insights on current research efforts and available resources as well as opportunities and gaps to guide future research.
- Abstract(参考訳): 自動音声認識(ASR)研究への関心が高まり、また、コードスイッチング(CS)が頻繁に発生する言語に対する作業の体系化に伴い、エンドツーエンドのASRモデルにおけるコードスイッチングに関する体系的な文献レビューを行う。
我々は、ピアレビューされた会場で発行された論文を手動で収集し、注釈付けする。
検討された言語、データセット、メトリクス、モデル選択、パフォーマンスを文書化し、コードスイッチングにおけるエンドツーエンドASRの課題について論じる。
この分析は、現在の研究活動と利用可能な資源、そして将来の研究を導くための機会とギャップについての洞察を提供する。
関連論文リスト
- Automating Code Review: A Systematic Literature Review [15.416725497289697]
コードレビューは、コード品質の向上を目標として、チームメイトによって書かれたコードを評価することで構成される。
実証的な研究は、そのようなプラクティスによってもたらされた利益を文書化しており、開発者の時間という面ではコストがかかる。
コードレビュータスクを自動化する技術とツールが提案されている。
論文 参考訳(メタデータ) (2025-03-12T16:19:10Z) - Large Language Model Based Generative Error Correction: A Challenge and Baselines for Speech Recognition, Speaker Tagging, and Emotion Recognition [110.8431434620642]
生成音声の書き起こし誤り訂正(GenSEC)の課題について紹介する。
この課題は、(i)ASR後の転写補正、(ii)話者タグ付け、(iii)感情認識という、3つのASR後の言語モデリングタスクを含む。
本稿では,ベースライン評価から得られた知見と,今後の評価設計における教訓について論じる。
論文 参考訳(メタデータ) (2024-09-15T16:32:49Z) - Retrieval-Enhanced Machine Learning: Synthesis and Opportunities [60.34182805429511]
検索エンハンスメントは機械学習(ML)の幅広い範囲に拡張できる
この研究は、MLの様々な領域の文献を、現在の文献から欠落している一貫した表記で合成することで、このパラダイムの正式なフレームワークであるRetrieval-Enhanced Machine Learning (REML)を導入する。
本研究の目的は、様々な分野の研究者に対して、検索強化モデルの包括的、正式に構造化された枠組みを付与し、学際的な将来の研究を促進することである。
論文 参考訳(メタデータ) (2024-07-17T20:01:21Z) - System for systematic literature review using multiple AI agents:
Concept and an empirical evaluation [5.194208843843004]
本稿では,システム文献レビューの実施プロセスの完全自動化を目的とした,新しいマルチAIエージェントモデルを提案する。
このモデルは、研究者がトピックを入力するユーザフレンドリーなインターフェースを介して動作する。
関連する学術論文を検索するために使用される検索文字列を生成する。
モデルはこれらの論文の要約を自律的に要約する。
論文 参考訳(メタデータ) (2024-03-13T10:27:52Z) - Improved Contextual Recognition In Automatic Speech Recognition Systems
By Semantic Lattice Rescoring [4.819085609772069]
本稿では,意味的格子処理によるASRシステム内における文脈認識の高度化のための新しい手法を提案する。
提案手法は,隠れマルコフモデルとガウス混合モデル(HMM-GMM)とディープニューラルネットワーク(DNN)モデルを用いて,精度を向上する。
本稿では,実験分析によるLibriSpeechデータセット上でのフレームワークの有効性を示す。
論文 参考訳(メタデータ) (2023-10-14T23:16:05Z) - Investigating Fairness Disparities in Peer Review: A Language Model
Enhanced Approach [77.61131357420201]
我々は、大規模言語モデル(LM)の助けを借りて、ピアレビューにおける公平性格差の徹底した厳密な研究を行う。
我々は、2017年から現在までのICLR(International Conference on Learning Representations)カンファレンスで、包括的なリレーショナルデータベースを収集、組み立て、維持しています。
我々は、著作者性別、地理、著作者、機関的名声など、興味のある複数の保護属性に対する公平性の違いを仮定し、研究する。
論文 参考訳(メタデータ) (2022-11-07T16:19:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。