論文の概要: BanglaIPA: Towards Robust Text-to-IPA Transcription with Contextual Rewriting in Bengali
- arxiv url: http://arxiv.org/abs/2601.01778v1
- Date: Mon, 05 Jan 2026 04:17:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-06 16:25:22.760101
- Title: BanglaIPA: Towards Robust Text-to-IPA Transcription with Contextual Rewriting in Bengali
- Title(参考訳): BanglaIPA:ベンガル語における文脈書き換えによるロバストテキストからIPAへの転写
- Authors: Jakir Hasan, Shrestha Datta, Md Saiful Islam, Shubhashis Roy Dipta, Ameya Debnath,
- Abstract要約: 文字ベースの語彙と単語レベルのアライメントを統合した新しいIPA生成システムであるBanglaIPAを提案する。
提案システムはベンガル数字を正確に処理し,地域方言間で強い性能を示す。
- 参考スコア(独自算出の注目度): 1.1347335625859423
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Despite its widespread use, Bengali lacks a robust automated International Phonetic Alphabet (IPA) transcription system that effectively supports both standard language and regional dialectal texts. Existing approaches struggle to handle regional variations, numerical expressions, and generalize poorly to previously unseen words. To address these limitations, we propose BanglaIPA, a novel IPA generation system that integrates a character-based vocabulary with word-level alignment. The proposed system accurately handles Bengali numerals and demonstrates strong performance across regional dialects. BanglaIPA improves inference efficiency by leveraging a precomputed word-to-IPA mapping dictionary for previously observed words. The system is evaluated on the standard Bengali and six regional variations of the DUAL-IPA dataset. Experimental results show that BanglaIPA outperforms baseline IPA transcription models by 58.4-78.7% and achieves an overall mean word error rate of 11.4%, highlighting its robustness in phonetic transcription generation for the Bengali language.
- Abstract(参考訳): 広く使われているにもかかわらず、ベンガル語は、標準言語と地域方言のテキストの両方を効果的にサポートする、堅牢な国際音声アルファベット(IPA)転写システムがない。
既存のアプローチでは、地域的変化や数値表現の扱いに苦慮し、以前は目に見えなかった言葉を一般化する。
このような制約に対処するために,文字ベースの語彙と単語レベルのアライメントを統合した新しいIPA生成システムであるBanglaIPAを提案する。
提案システムはベンガル数字を正確に処理し,地域方言間で強い性能を示す。
BanglaIPAは、事前に計算された単語からIPAへのマッピング辞書を活用することにより、推論効率を向上させる。
このシステムは、標準ベンガルと、DUAL-IPAデータセットの6つの地域差に基づいて評価される。
実験の結果、BanglaIPAはベースラインIPA転写モデルを58.4-78.7%上回り、全体的な平均単語誤り率11.4%を達成し、ベンガル語における音素転写生成の堅牢性を強調した。
関連論文リスト
- Bilingual Word Level Language Identification for Omotic Languages [44.04646981451376]
本稿では,エチオピア南部,すなわちWolaitaとGofaで話されている言語に対するバイリンガル言語識別(BLID)について述べる。
この課題を克服するために、様々なアプローチで様々な実験を行った。
BERTベースの事前訓練言語モデルとLSTMアプローチの組み合わせは、テストセットのF1スコアが0.72であった。
論文 参考訳(メタデータ) (2025-09-05T23:36:26Z) - Improving Informally Romanized Language Identification [42.001850291770445]
ローマ化は、通常、異なるスクリプトで書かれたため、容易に区別される言語を描画する。
我々は、トレーニングセットを合成する手法を改善することにより、ロマライズされたテキストの言語識別(LID)精度を向上させる。
本研究では,Bhasha-Abhijnaanam 評価セットにおける20のIndic言語からのロマン化テキストに対して,最先端の LID 性能を示す。
論文 参考訳(メタデータ) (2025-04-30T11:36:28Z) - CoSTA: Code-Switched Speech Translation using Aligned Speech-Text Interleaving [61.73180469072787]
インド語から英語のテキストへのコード変更音声の音声翻訳(ST)の問題に焦点をあてる。
本稿では、事前訓練された自動音声認識(ASR)と機械翻訳(MT)モジュールを足場として、新しいエンドツーエンドモデルアーキテクチャCOSTAを提案する。
COSTAは、多くの競合するカスケードおよびエンドツーエンドのマルチモーダルベースラインを3.5BLEUポイントまで上回っている。
論文 参考訳(メタデータ) (2024-06-16T16:10:51Z) - IPA Transcription of Bengali Texts [0.2113150621171959]
国際音声アルファベット(IPA)は、言語で音素を体系化する。
ベンガル音韻学と音声学では、IPA標準とベンガル中核音素に関する学術的な議論が続いている。
この研究は、先行研究を検証し、現在および潜在的な問題を特定し、ベンガルのIPA標準の枠組みを提案する。
論文 参考訳(メタデータ) (2024-03-29T09:33:34Z) - Transcribing Bengali Text with Regional Dialects to IPA using District Guided Tokens [0.0]
本稿では,バングラデシュの6つの地区にまたがる新しいデータセットについて,DGT(District Guided Tokens)技術を紹介する。
DGTテクニックは、この新しいデータセットに基づいて、いくつかのトランスフォーマーベースのモデルを微調整する。
ByT5モデルを用いたDGTの有効性を示す実験結果が得られた。
論文 参考訳(メタデータ) (2024-03-26T05:55:21Z) - MaiBaam: A Multi-Dialectal Bavarian Universal Dependency Treebank [56.810282574817414]
We present the first multi-dialect Bavarian treebank (MaiBaam) based with part-of-speech and syntactic dependency information in Universal Dependencies (UD)。
我々は、近縁なバイエルン語とドイツ語のモルフォシンタクティックな相違を強調し、話者の正書法の豊富な多様性を示す。
私たちのコーパスには15kのトークンが含まれており、3つの国にまたがるバイエルン語を話すすべての地域の方言をカバーしています。
論文 参考訳(メタデータ) (2024-03-15T13:33:10Z) - Character-Level Bangla Text-to-IPA Transcription Using Transformer
Architecture with Sequence Alignment [0.0]
International Phonetic Alphabet (IPA) は、言語学習と理解において不可欠である。
ブータンは広く使われている言語の一つとして7番目であり、その領域でIPAを必要としている。
本研究では,文字レベルと記号レベルの変換器に基づくシーケンス・ツー・シーケンス・モデルを用いて,各バングラ語のIPAを取得する。
論文 参考訳(メタデータ) (2023-11-07T08:20:06Z) - Phoneme Recognition through Fine Tuning of Phonetic Representations: a
Case Study on Luhya Language Varieties [77.2347265289855]
音韻アノテーションに基づく多言語認識手法であるAllosaurus を用いた音素認識に焦点を当てた。
挑戦的な実世界シナリオで評価するために,我々は,ケニア西部とウガンダ東部のluhya言語クラスタの2つの種類であるbukusuとsaamiaの音声認識データセットをキュレートした。
私たちは、アロサウルスの微調整がわずか100発話であっても、電話のエラー率を大幅に改善することが分かりました。
論文 参考訳(メタデータ) (2021-04-04T15:07:55Z) - AlloVera: A Multilingual Allophone Database [137.3686036294502]
AlloVeraは、218のアロフォンから14言語のための音素へのマッピングを提供する。
我々は、AlloVeraで構築された「ユニバーサル」アロフォンモデルであるAllosaurusが、音声書き起こしタスクにおいて「ユニバーサル」音声モデルと言語特化モデルより優れていることを示す。
論文 参考訳(メタデータ) (2020-04-17T02:02:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。