論文の概要: RegSpeech12: A Regional Corpus of Bengali Spontaneous Speech Across Dialects
- arxiv url: http://arxiv.org/abs/2510.24096v1
- Date: Tue, 28 Oct 2025 06:08:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-29 15:35:36.804699
- Title: RegSpeech12: A Regional Corpus of Bengali Spontaneous Speech Across Dialects
- Title(参考訳): RegSpeech12: ベンガル語自発音声の方言横断コーパス
- Authors: Md. Rezuwan Hassan, Azmol Hossain, Kanij Fatema, Rubayet Sabbir Faruque, Tanmoy Shome, Ruwad Naswan, Trina Chakraborty, Md. Foriduzzaman Zihad, Tawsif Tashwar Dipto, Nazia Tasnim, Nazmuddoha Ansary, Md. Mehedi Hasan Shawon, Ahmed Imtiaz Humayun, Md. Golam Rabiul Alam, Farig Sadeque, Asif Sushmit,
- Abstract要約: ベンガル語は、南アジアやディアスポラスのコミュニティで広く話されている。
東ベンガル語、マンブミ語、ランプリ語、ヴァレンドリ語、ラーリ語の5つの主要な方言群が特定されている。
ベンガル方言の計算処理に関する研究は依然として限られている。
- 参考スコア(独自算出の注目度): 5.805745873296805
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Bengali language, spoken extensively across South Asia and among diasporic communities, exhibits considerable dialectal diversity shaped by geography, culture, and history. Phonological and pronunciation-based classifications broadly identify five principal dialect groups: Eastern Bengali, Manbhumi, Rangpuri, Varendri, and Rarhi. Within Bangladesh, further distinctions emerge through variation in vocabulary, syntax, and morphology, as observed in regions such as Chittagong, Sylhet, Rangpur, Rajshahi, Noakhali, and Barishal. Despite this linguistic richness, systematic research on the computational processing of Bengali dialects remains limited. This study seeks to document and analyze the phonetic and morphological properties of these dialects while exploring the feasibility of building computational models particularly Automatic Speech Recognition (ASR) systems tailored to regional varieties. Such efforts hold potential for applications in virtual assistants and broader language technologies, contributing to both the preservation of dialectal diversity and the advancement of inclusive digital tools for Bengali-speaking communities. The dataset created for this study is released for public use.
- Abstract(参考訳): ベンガル語は、南アジアやディアスポラスのコミュニティで広く話され、地理、文化、歴史によって形作られたかなりの方言の多様性を示している。
音韻学的および発音に基づく分類では、東ベンガル語、マンブミ語、ランプリ語、ヴァレンドリ語、ラーリ語の5つの主要な方言群を広く識別している。
バングラデシュでは、チッタゴン(Chittagong)、シルヘット(Sylhet)、ラングル(Rangpur)、ラージシャヒ(Rajshahi)、ノアハリ(Noakhali)、バリシャル(Barishal)などの地域で見られるように、語彙、構文、形態の変動によってさらに区別が生じる。
この言語豊かさにもかかわらず、ベンガル方言の計算処理に関する体系的研究は依然として限られている。
本研究では,これらの方言の音韻的・形態学的特性の文書化と解析を行い,特にASR(Automatic Speech Recognition)システムの実現可能性を探究する。
このような取り組みは、弁証の多様性の保存とベンガル語コミュニティの包括的デジタルツールの進歩に寄与する仮想アシスタントや、より広範な言語技術への応用の可能性を秘めている。
この研究のために作成されたデータセットは一般公開されている。
関連論文リスト
- Bridging Dialects: Translating Standard Bangla to Regional Variants Using Neural Models [1.472830326343432]
この研究は、言語多様性を保ち、方言話者間のコミュニケーションを改善する必要性によって動機付けられている。
モデルは"Vashantor"データセットを使用して微調整され、様々な方言で32,500の文が含まれている。
BanglaT5はCERが12.3%、WERが15.7%で優れた性能を示し、方言のニュアンスを捉える効果を強調した。
論文 参考訳(メタデータ) (2025-01-10T06:50:51Z) - Unification of Balti and trans-border sister dialects in the essence of LLMs and AI Technology [19.282867207168565]
バルティ語はシナ・チベット語、特にチベット・ビルマン語族に属する。
インド、中国、パキスタン、ネパール、チベット、ビルマ、ブータンの人口は様々である。
文化・社会・政治・宗教・地理的影響の多様さを考えると、方言の統一を前進させることが重要である。
論文 参考訳(メタデータ) (2024-11-20T15:48:21Z) - BanglaDialecto: An End-to-End AI-Powered Regional Speech Standardization [7.059964549363294]
本研究は、方言のNoakhali音声を標準のBangla音声に変換するためのエンドツーエンドパイプラインを提案する。
約55の異なる方言が1億6000万人が話しており、バングラ方言に対処することは包括的コミュニケーションツールの開発に不可欠である。
実験の結果,Whisper ASRモデルが0.8%,WERが1.5%,BanglaT5モデルが41.6%,BLEUが41.6%であった。
論文 参考訳(メタデータ) (2024-11-16T20:20:15Z) - Voices Unheard: NLP Resources and Models for Yorùbá Regional Dialects [72.18753241750964]
Yorub'aは、約4700万人の話者を持つアフリカの言語である。
アフリカ語のためのNLP技術開発への最近の取り組みは、彼らの標準方言に焦点を当てている。
我々は、このギャップを埋めるために、新しい高品質のパラレルテキストと音声コーパスを導入する。
論文 参考訳(メタデータ) (2024-06-27T22:38:04Z) - What Do Dialect Speakers Want? A Survey of Attitudes Towards Language Technology for German Dialects [60.8361859783634]
我々はドイツ語に関連する方言と地域言語に関する話者を調査した。
回答者は特に、方言入力で動作する潜在的なNLPツールを好んでいる。
論文 参考訳(メタデータ) (2024-02-19T09:15:28Z) - Quantifying the Dialect Gap and its Correlates Across Languages [69.18461982439031]
この研究は、明らかな相違を明らかにし、マインドフルなデータ収集を通じてそれらに対処する可能性のある経路を特定することによって、方言NLPの分野を強化する基盤となる。
論文 参考訳(メタデータ) (2023-10-23T17:42:01Z) - Multi-lingual and Multi-cultural Figurative Language Understanding [69.47641938200817]
図形言語は人間のコミュニケーションに浸透するが、NLPでは比較的過小評価されている。
Hindi, Indonesian, Javanese, Kannada, Sundanese, Swahili, Yorubaの7つの多様な言語に関するデータセットを作成しました。
我々のデータセットから,各言語は,同じ領域から派生した言語間で最も高い重なり合いを持つ,図形表現の文化的・地域的概念に依存していることが明らかとなった。
全ての言語は、事前学習データと微調整データの可用性を反映した性能の変化により、英語と比較して大きな欠陥がある。
論文 参考訳(メタデータ) (2023-05-25T15:30:31Z) - Comparing Spoken Languages using Paninian System of Sounds and Finite State Machines [0.0]
我々はサンスクリットを中心とする言語開発のための生態系モデルを提案する。
言語間の単語を音声マップ上の状態遷移として表現し,それに対応する形態的有限オートマタを構築する。
論文 参考訳(メタデータ) (2023-01-29T15:22:10Z) - Discovering Representation Sprachbund For Multilingual Pre-Training [139.05668687865688]
多言語事前学習モデルから言語表現を生成し、言語分析を行う。
すべての対象言語を複数のグループにクラスタリングし、表現のスプラックバンドとして各グループに名前を付ける。
言語間ベンチマークで実験を行い、強いベースラインと比較して大幅な改善が達成された。
論文 参考訳(メタデータ) (2021-09-01T09:32:06Z) - Phoneme Recognition through Fine Tuning of Phonetic Representations: a
Case Study on Luhya Language Varieties [77.2347265289855]
音韻アノテーションに基づく多言語認識手法であるAllosaurus を用いた音素認識に焦点を当てた。
挑戦的な実世界シナリオで評価するために,我々は,ケニア西部とウガンダ東部のluhya言語クラスタの2つの種類であるbukusuとsaamiaの音声認識データセットをキュレートした。
私たちは、アロサウルスの微調整がわずか100発話であっても、電話のエラー率を大幅に改善することが分かりました。
論文 参考訳(メタデータ) (2021-04-04T15:07:55Z) - Speaker Recognition in Bengali Language from Nonlinear Features [0.0]
ベンガル語音声認識と話者識別の研究は文献にはほとんどない。
本研究では,非線形多フラクタル解析を用いて音声の音響特性を抽出した。
Multifractal Detrended Fluctuation Analysisでは、音声信号の複雑さが明らかにされている。
論文 参考訳(メタデータ) (2020-04-15T22:38:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。