論文の概要: A Comprehensive Study of the Current State-of-the-Art in Nepali
Automatic Speech Recognition Systems
- arxiv url: http://arxiv.org/abs/2402.03050v1
- Date: Mon, 5 Feb 2024 14:34:14 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-06 15:45:41.622955
- Title: A Comprehensive Study of the Current State-of-the-Art in Nepali
Automatic Speech Recognition Systems
- Title(参考訳): ネパール語自動音声認識システムにおける現状に関する総合的研究
- Authors: Rupak Raj Ghimire and Bal Krishna Bal and Prakash Poudyal
- Abstract要約: 本稿ではネパール語自動音声認識(ASR)の分野で行われている研究について検討する。
音声認識に基づく研究のグローバルな増加傾向と相まって、ネパールのASR関連プロジェクトも増えている。
ネパール語の言語モデルと音響モデルの研究は、豊富な資源を持つ言語に比べ、十分な注意を払っていない。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we examine the research conducted in the field of Nepali
Automatic Speech Recognition (ASR). The primary objective of this survey is to
conduct a comprehensive review of the works on Nepali Automatic Speech
Recognition Systems completed to date, explore the different datasets used,
examine the technology utilized, and take account of the obstacles encountered
in implementing the Nepali ASR system. In tandem with the global trends of
ever-increasing research on speech recognition based research, the number of
Nepalese ASR-related projects are also growing. Nevertheless, the investigation
of language and acoustic models of the Nepali language has not received
adequate attention compared to languages that possess ample resources. In this
context, we provide a framework as well as directions for future
investigations.
- Abstract(参考訳): 本稿では,ネパール語自動音声認識(ASR)の分野で行われている研究について検討する。
本研究の目的は,現在までに完成しているネパール語自動音声認識システムの研究を包括的に検討し,使用済みの異なるデータセットを探索し,使用する技術を調べ,ネパール語asrシステムの実装に遭遇する障害について考察することである。
音声認識に基づく研究の継続的な研究の世界的なトレンドと相まって、ネパールのasr関連プロジェクトも増えている。
それにもかかわらず、ネパール語の言語と音響モデルの調査は、豊富な資源を持つ言語と比較して十分な注目を集めていない。
この文脈では、今後の調査のための枠組みと方向性を提供する。
関連論文リスト
- From Statistical Methods to Pre-Trained Models; A Survey on Automatic Speech Recognition for Resource Scarce Urdu Language [41.272055304311905]
本稿では,東南アジア諸国で広く話されている資源制約のあるウルドゥー語について述べる。
ウルドゥーASRにおける将来の研究の現在の研究動向、技術進歩、および潜在的方向性について概説する。
論文 参考訳(メタデータ) (2024-11-20T17:39:56Z) - Natural Language Processing for Dialects of a Language: A Survey [56.93337350526933]
最先端自然言語処理(NLP)モデルは、大規模なトレーニングコーパスでトレーニングされ、評価データセットで最上位のパフォーマンスを報告します。
この調査は、これらのデータセットの重要な属性である言語の方言を掘り下げる。
方言データセットに対するNLPモデルの性能劣化と言語技術のエクイティへのその影響を動機として,我々はデータセットやアプローチの観点から,方言に対するNLPの過去の研究を調査した。
論文 参考訳(メタデータ) (2024-01-11T03:04:38Z) - Label Aware Speech Representation Learning For Language Identification [49.197215416945596]
本稿では,自己指導型表現学習と事前学習タスクのための言語ラベル情報を組み合わせた新しいフレームワークを提案する。
このフレームワークは、ラベル認識音声表現(LASR)学習と呼ばれ、三重項に基づく目的関数を使用して、言語ラベルと自己教師付き損失関数を組み込む。
論文 参考訳(メタデータ) (2023-06-07T12:14:16Z) - Towards Data-and Knowledge-Driven Artificial Intelligence: A Survey on Neuro-Symbolic Computing [73.0977635031713]
ニューラルシンボリック・コンピューティング(NeSy)は、人工知能(AI)の活発な研究領域である。
NeSyは、ニューラルネットワークにおける記号表現の推論と解釈可能性の利点と堅牢な学習の整合性を示す。
論文 参考訳(メタデータ) (2022-10-28T04:38:10Z) - Innovations in Neural Data-to-text Generation: A Survey [10.225452376884233]
このサーベイは、アプローチ、ベンチマークデータセット、評価プロトコルの構造化された検証によって、ニューラルDTGパラダイムの総合的なビューを提供する。
我々は,言語的に有能なシステムの設計だけでなく,公平性と説明責任を示すシステムにも焦点をあてる,DTG研究の有望な道のりを強調した。
論文 参考訳(メタデータ) (2022-07-25T23:21:48Z) - Automated Audio Captioning: an Overview of Recent Progress and New
Challenges [56.98522404673527]
自動音声キャプションは、与えられた音声クリップの自然言語記述を生成することを目的とした、モーダル横断翻訳タスクである。
本稿では、既存の様々なアプローチから評価指標やデータセットまで、自動音声キャプションにおけるコントリビューションの総合的なレビューを行う。
論文 参考訳(メタデータ) (2022-05-12T08:36:35Z) - Natural Language Inference with Self-Attention for Veracity Assessment
of Pandemic Claims [54.93898455714295]
まず、COVID-19に関する異質なクレームからなる新しいPANACEAデータセットの構築について述べる。
そこで我々は,自然言語推論に基づく自動妥当性評価のための新しい手法を提案する。
論文 参考訳(メタデータ) (2022-05-05T12:11:31Z) - Systematic Inequalities in Language Technology Performance across the
World's Languages [94.65681336393425]
本稿では,言語技術のグローバルな有用性を評価するためのフレームワークを紹介する。
本分析では, ユーザ対応技術と言語的NLPタスクの両面において, より深く研究されている。
論文 参考訳(メタデータ) (2021-10-13T14:03:07Z) - Software-Based Dialogue Systems: Survey, Taxonomy and Challenges [4.2763155274587366]
本稿では,2次研究の体系的な文献レビューを通じて,会話エージェントの研究の現状について調査する。
そこで本研究では,対話エージェントの分野における異なる次元の包括的分類法を提案する。
論文 参考訳(メタデータ) (2021-06-21T07:41:44Z) - Deep Gait Recognition: A Survey [15.47582611826366]
歩行認識は、歩き方に基づいて個人を識別することを目的とした魅力的な生体測定モダリティです。
ディープラーニングは、差別的な表現を自動的に学習する能力によって、2015年からこの分野の研究環境を再構築した。
深層学習による歩行認識のブレークスルーと最近の展開を総合的に紹介します。
論文 参考訳(メタデータ) (2021-02-18T18:49:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。