論文の概要: Mispronunciation Detection of Basic Quranic Recitation Rules using Deep
Learning
- arxiv url: http://arxiv.org/abs/2305.06429v1
- Date: Wed, 10 May 2023 19:31:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-12 16:44:58.740559
- Title: Mispronunciation Detection of Basic Quranic Recitation Rules using Deep
Learning
- Title(参考訳): 深層学習による基本キュラニック暗唱規則の誤読検出
- Authors: Ahmad Al Harere , Khloud Al Jallad
- Abstract要約: イスラム教では、読み手はタイウェド規則と呼ばれる一連の発音規則を適用して、クルランを引用しなければならない。
タジュウェドの教師の数は、現在、すべてのムスリムにとって毎日のリサイクリングの練習には不十分である。
本稿では,Mel-Frequency Cepstral Coefficient (MFCC) とLong Short-Term Memory (LSTM) ニューラルネットワークを組み合わせた時系列モデルを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In Islam, readers must apply a set of pronunciation rules called Tajweed
rules to recite the Quran in the same way that the angel Jibrael taught the
Prophet, Muhammad. The traditional process of learning the correct application
of these rules requires a human who must have a license and great experience to
detect mispronunciation. Due to the increasing number of Muslims around the
world, the number of Tajweed teachers is not enough nowadays for daily
recitation practice for every Muslim. Therefore, lots of work has been done for
automatic Tajweed rules' mispronunciation detection to help readers recite
Quran correctly in an easier way and shorter time than traditional learning
ways. All previous works have three common problems. First, most of them
focused on machine learning algorithms only. Second, they used private datasets
with no benchmark to compare with. Third, they did not take into consideration
the sequence of input data optimally, although the speech signal is time
series. To overcome these problems, we proposed a solution that consists of
Mel-Frequency Cepstral Coefficient (MFCC) features with Long Short-Term Memory
(LSTM) neural networks which use the time series, to detect mispronunciation in
Tajweed rules. In addition, our experiments were performed on a public dataset,
the QDAT dataset, which contains more than 1500 voices of the correct and
incorrect recitation of three Tajweed rules (Separate stretching , Tight Noon ,
and Hide ). To the best of our knowledge, the QDAT dataset has not been used by
any research paper yet. We compared the performance of the proposed LSTM model
with traditional machine learning algorithms used in SoTA. The LSTM model with
time series showed clear superiority over traditional machine learning. The
accuracy achieved by LSTM on the QDAT dataset was 96%, 95%, and 96% for the
three rules (Separate stretching, Tight Noon, and Hide), respectively.
- Abstract(参考訳): イスラム教では、天使ジブラエルが預言者ムハンマド(Muhammad)に教えたのと同じように、読み手はタジュウェド(Tajweed)と呼ばれる一連の発音規則を適用する必要がある。
これらの規則の正しい適用を学ぶ伝統的なプロセスは、誤用を検出するためにライセンスと優れた経験を必要とする人間を必要とする。
世界中のムスリムが増えているため、タジュウェドの教師の数は、現在、すべてのムスリムにとって毎日のリサイクリングの練習には不十分である。
そのため、読者が従来の学習方法よりも簡単で短い時間でQuranを正しく引用するのを助けるために、自動的なTajweedルールの誤発音検出のために多くの作業がなされている。
以前の作品には3つの共通点がある。
まず、そのほとんどが機械学習アルゴリズムのみに焦点を当てた。
次に、ベンチマークなしでプライベートデータセットを使用した。
第3に、音声信号は時系列であるが、入力データのシーケンスを最適に考慮しなかった。
これらの問題を克服するため,我々は,Mel-Frequency Cepstral Coefficient (MFCC) と,時系列を用いたLong Short-Term Memory (LSTM) ニューラルネットワークを組み合わせた解を提案し,Tajweedルールの誤発音を検出する。
さらに,公開データセットであるQDATデータセットを用いて,3つのTajweed規則(分離ストレッチ,タイト・ヌーン,ディープ)の正しい,不正確なリサイクリングの1500以上の音声を含む実験を行った。
我々の知る限りでは、QDATデータセットは研究論文ではまだ使われていない。
提案するLSTMモデルの性能を,SoTAで使用される従来の機械学習アルゴリズムと比較した。
時系列を用いたLSTMモデルは、従来の機械学習よりも明らかな優位性を示した。
qdatデータセット上でlstmによって達成された精度は、それぞれ96%、95%、96%であった(分離されたストレッチング、タイトな正午、隠れ)。
関連論文リスト
- One Language, Many Gaps: Evaluating Dialect Fairness and Robustness of Large Language Models in Reasoning Tasks [55.35278531907263]
本稿では,大言語モデルの公平性と頑健性に関する最初の研究を標準的推論タスクにおける方言に提示する。
我々は、HumanEvalやGSM8Kといった7つの人気のあるベンチマークを書き換えるために、AAVEスピーカーを採用。
標準英語と比較して、これらの広く使われているモデルのほとんどは、AAVEのクエリに対して重大な脆さと不公平さを示している。
論文 参考訳(メタデータ) (2024-10-14T18:44:23Z) - Learning Rules from KGs Guided by Language Models [48.858741745144044]
ルール学習手法は、潜在的に欠落する事実を予測するために適用することができる。
規則のランク付けは、高度に不完全あるいは偏りのあるKGよりも特に難しい。
近年のLanguage Models (LM) の台頭により、いくつかの研究が、LMがKG補完の代替手段として利用できると主張している。
論文 参考訳(メタデータ) (2024-09-12T09:27:36Z) - MUSE: Machine Unlearning Six-Way Evaluation for Language Models [109.76505405962783]
言語モデル(LM)は、プライベートおよび著作権のあるコンテンツを含む大量のテキストデータに基づいて訓練される。
総合的な機械学習評価ベンチマークであるMUSEを提案する。
人気のある8つのアンラーニングアルゴリズムがハリー・ポッターの本やニュース記事をいかに効果的に解き放つかをベンチマークする。
論文 参考訳(メタデータ) (2024-07-08T23:47:29Z) - Quranic Conversations: Developing a Semantic Search tool for the Quran
using Arabic NLP Techniques [0.7673339435080445]
クラーンの聖典は、約23年間にわたって預言者ムハンマド(英語版)(PBUH)に明かされたように、神(アッラー)の文字通りの言葉であると考えられている。
ムスリムにとって、問題や関心の探求に関連するすべてのアヤ(詩)を入手することは困難である。
ユーザの質問やプロンプトに関連する句を検索するQuranセマンティック検索ツールを開発した。
論文 参考訳(メタデータ) (2023-11-09T03:14:54Z) - Quran Recitation Recognition using End-to-End Deep Learning [0.0]
クルランはイスラム教の聖典であり、その引用は宗教の重要な側面である。
聖クラーンの朗読が自動的に認められることは、その独特の規則のために難しい課題である。
本稿では,神聖クラーンの朗読を認識するための新しいエンド・ツー・エンド深層学習モデルを提案する。
論文 参考訳(メタデータ) (2023-05-10T18:40:01Z) - An ensemble-based framework for mispronunciation detection of Arabic
phonemes [0.0]
この研究は、アラビア語の音素の誤発音を定義するアンサンブルモデルを導入している。
実験結果から,メル分光法の特徴抽出手法を用いたアンサンブルアルゴリズムによる投票は,95.9%の精度で顕著な分類結果を示した。
論文 参考訳(メタデータ) (2023-01-03T22:17:08Z) - DTW at Qur'an QA 2022: Utilising Transfer Learning with Transformers for
Question Answering in a Low-resource Domain [10.172732008860539]
機械読解に関する研究は、宗教文書を含むいくつかの領域で研究されている。
QA 2022の共通課題の目標は、このギャップを埋めることである。
論文 参考訳(メタデータ) (2022-05-12T11:17:23Z) - Sequence-level self-learning with multiple hypotheses [53.04725240411895]
我々は、自動音声認識(ASR)のためのアテンションベースシーケンス・ツー・シーケンス(seq2seq)モデルを用いた新しい自己学習手法を開発した。
従来の教師なし学習手法とは対照的に,我々はEmphmulti-task Learning(MTL)フレームワークを採用する。
実験の結果,本手法は,英語データのみを用いてトレーニングしたベースラインモデルと比較して,英文音声データのWERを14.55%から10.36%に削減できることがわかった。
論文 参考訳(メタデータ) (2021-12-10T20:47:58Z) - Efficient First-Order Contextual Bandits: Prediction, Allocation, and
Triangular Discrimination [82.52105963476703]
統計的学習、オンライン学習、その他における繰り返しのテーマは、低騒音の問題に対してより速い収束率が可能であることである。
1次保証は統計的およびオンライン学習において比較的よく理解されている。
三角識別と呼ばれる対数損失と情報理論量が一階保証を得る上で基本的な役割を担っていることを示す。
論文 参考訳(メタデータ) (2021-07-05T19:20:34Z) - Mosques Smart Domes System using Machine Learning Algorithms [0.0]
本稿では,天気や外気温を利用したスマートモスクドームのモデルを構築することで,問題を解決することを目的とする。
この実験はサウジアラビアの預言者モスクで行われ、基本的には手動で動く20のドームを含む。
論文 参考訳(メタデータ) (2020-08-30T19:51:30Z) - Wake Word Detection with Alignment-Free Lattice-Free MMI [66.12175350462263]
音声言語インタフェース、例えばパーソナルデジタルアシスタントは、音声入力の処理を開始するためにウェイクワードに依存している。
本稿では,部分的にラベル付けされたトレーニングデータから,ハイブリッドDNN/HMM覚醒単語検出システムの学習方法を提案する。
提案手法を2つの実データ集合上で評価し, 前報よりも50%~90%の誤報率の減少率を示した。
論文 参考訳(メタデータ) (2020-05-17T19:22:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。