論文の概要: Tadabur: A Large-Scale Quran Audio Dataset
- arxiv url: http://arxiv.org/abs/2604.18932v1
- Date: Tue, 21 Apr 2026 00:13:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.546505
- Title: Tadabur: A Large-Scale Quran Audio Dataset
- Title(参考訳): Tadabur: 大規模なQuranオーディオデータセット
- Authors: Faisal Alherran,
- Abstract要約: Tadaburは大規模なQuranオーディオデータセットである。
600以上の異なるリサイターから1400時間以上のオーディオを再生する。
この多様性により、忠バーはクラニック音声の研究と分析のための包括的で代表的な資源となっている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Despite growing interest in Quranic data research, existing Quran datasets remain limited in both scale and diversity. To address this gap, we present Tadabur, a large-scale Quran audio dataset. Tadabur comprises more than 1400+ hours of recitation audio from over 600 distinct reciters, providing substantial variation in recitation styles, vocal characteristics, and recording conditions. This diversity makes Tadabur a comprehensive and representative resource for Quranic speech research and analysis. By significantly expanding both the total duration and variability of available Quran data, Tadabur aims to support future research and facilitate the development of standardized Quranic speech benchmarks.
- Abstract(参考訳): Quranicデータ研究への関心が高まりつつあるにもかかわらず、既存のQuranデータセットはスケールと多様性の両方で制限されている。
このギャップに対処するため、大規模なQuranオーディオデータセットであるTadaburを提示する。
忠バーは600以上の異なるリサイタルからの1400時間以上のリサイクリング音声で構成されており、リサイクリングスタイル、発声特性、録音条件にかなりの変化をもたらす。
この多様性により、忠バーはクラニック音声の研究と分析のための包括的で代表的な資源となっている。
利用可能なQuranデータの総持続時間と変動性を大きく拡張することで、Tadaburは将来の研究を支援し、標準化されたQuranic音声ベンチマークの開発を促進することを目指している。
関連論文リスト
- Quran-MD: A Fine-Grained Multilingual Multimodal Dataset of the Quran [1.3481884955361023]
Quran MDはQuranの包括的なデータセットであり、詩や単語レベルでテキスト、言語、音声の次元を統合する。
このデータセットは自然言語処理、音声認識、音声合成、言語分析、デジタルイスラム研究など様々な応用をサポートしている。
論文 参考訳(メタデータ) (2026-01-25T15:23:37Z) - A Cocktail-Party Benchmark: Multi-Modal dataset and Comparative Evaluation Results [62.01871490859886]
第9回CHiMEチャレンジにおいて,マルチモーダルコンテキスト認識(MCoRec)の課題を紹介した。
MCoRecは、録音が説明のない、カジュアルなグループチャットに集中する、自然なマルチパーティの会話をキャプチャする。
このタスクでは、各話者のスピーチを共同で翻訳し、音声・視覚録音から各話者の会話にまとめることにより、「誰がいつ、何、誰と話をするのか?」という質問に答えるシステムが必要である。
論文 参考訳(メタデータ) (2025-10-27T12:36:43Z) - Automatic Pronunciation Error Detection and Correction of the Holy Quran's Learners Using Deep Learning [0.0]
高品質なQuranicデータセットを生成するために、98%の自動パイプラインを構築しています。
私たちはカスタムのQuran Phonetic Scriptを使ってTajweedルールをエンコードしています。
すべてのコード、データ、モデルをオープンソースとしてリリースしています。
論文 参考訳(メタデータ) (2025-08-27T15:28:46Z) - Summarizing Speech: A Comprehensive Survey [89.69929708257744]
音声の要約は、音声・音声コンテンツの増加量を効率的に管理し、アクセスするために欠かせないツールとなっている。
本調査では,要約手法の質を評価する上で重要な,既存のデータセットと評価プロトコルについて検討する。
論文 参考訳(メタデータ) (2025-04-10T17:50:53Z) - A Benchmark Dataset with Larger Context for Non-Factoid Question Answering over Islamic Text [0.16385815610837165]
本稿では,Quranic Tafsir と Ahadith の領域内で質問応答を目的とした包括的データセットについて紹介する。
このデータセットは、73,000以上の質問応答ペアからなる堅牢なコレクションで構成されており、この特殊なドメインで報告されている最大のデータセットである。
本稿では,データセットのコントリビューションを強調しながら,その後の人的評価から,既存の自動評価手法の限界に関する批判的な洞察が得られた。
論文 参考訳(メタデータ) (2024-09-15T19:50:00Z) - Quranic Audio Dataset: Crowdsourced and Labeled Recitation from Non-Arabic Speakers [1.2124551005857038]
本稿では、アラビア語以外の話者に対して、クアン語を引用する学習の課題について論じる。
我々はボランティアベースのクラウドソーシングのジャンルを用いて、オーディオ資産を集めるためにクラウドソーシングAPIを実装している。
我々は、11カ国以上にわたる1287人の参加者のプールから、約7000人のクラーニックのリサイクリングを収集しました。
論文 参考訳(メタデータ) (2024-05-04T14:29:05Z) - Quran Recitation Recognition using End-to-End Deep Learning [0.0]
クルランはイスラム教の聖典であり、その引用は宗教の重要な側面である。
聖クラーンの朗読が自動的に認められることは、その独特の規則のために難しい課題である。
本稿では,神聖クラーンの朗読を認識するための新しいエンド・ツー・エンド深層学習モデルを提案する。
論文 参考訳(メタデータ) (2023-05-10T18:40:01Z) - WavCaps: A ChatGPT-Assisted Weakly-Labelled Audio Captioning Dataset for Audio-Language Multimodal Research [82.42802570171096]
約400kの音声クリップとペアキャプションを組み合わせた,大規模な音声キャプションデータセットであるWavCapsを紹介した。
オンラインハーベストな生の記述は非常にうるさいし、自動音声キャプションなどのタスクで直接使うには適さない。
本稿では,大規模な言語モデルであるChatGPTを用いて,ノイズの多いデータをフィルタリングし,高品質なキャプションを生成するための3段階処理パイプラインを提案する。
論文 参考訳(メタデータ) (2023-03-30T14:07:47Z) - A Corpus for Large-Scale Phonetic Typology [112.19288631037055]
本稿では,VoxClamantis v1.0について紹介する。
635言語にまたがる690の音素レベルラベルと690の音素レベルラベルと母音とシビラントの音響・音韻測定を行った。
論文 参考訳(メタデータ) (2020-05-28T13:03:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。