Fugu-MT 論文翻訳(概要): IPA Transcription of Bengali Texts

論文の概要: IPA Transcription of Bengali Texts

arxiv url: http://arxiv.org/abs/2403.20084v1
Date: Fri, 29 Mar 2024 09:33:34 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-01 16:04:00.962516
Title: IPA Transcription of Bengali Texts
Title（参考訳）: ベンガル文字のIPA転写
Authors: Kanij Fatema, Fazle Dawood Haider, Nirzona Ferdousi Turpa, Tanveer Azmal, Sourav Ahmed, Navid Hasan, Mohammad Akhlaqur Rahman, Biplab Kumar Sarkar, Afrar Jahin, Md. Rezuwan Hassan, Md Foriduzzaman Zihad, Rubayet Sabbir Faruque, Asif Sushmit, Mashrur Imtiaz, Farig Sadeque, Syed Shahrier Rahman,
Abstract要約: 国際音声アルファベット(IPA)は、言語で音素を体系化する。ベンガル音韻学と音声学では、IPA標準とベンガル中核音素に関する学術的な議論が続いている。この研究は、先行研究を検証し、現在および潜在的な問題を特定し、ベンガルのIPA標準の枠組みを提案する。
参考スコア（独自算出の注目度）: 0.2113150621171959
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The International Phonetic Alphabet (IPA) serves to systematize phonemes in language, enabling precise textual representation of pronunciation. In Bengali phonology and phonetics, ongoing scholarly deliberations persist concerning the IPA standard and core Bengali phonemes. This work examines prior research, identifies current and potential issues, and suggests a framework for a Bengali IPA standard, facilitating linguistic analysis and NLP resource creation and downstream technology development. In this work, we present a comprehensive study of Bengali IPA transcription and introduce a novel IPA transcription framework incorporating a novel dataset with DL-based benchmarks.
Abstract（参考訳）: 国際音声アルファベット(IPA)は、音素を言語で体系化し、発音の正確なテキスト表現を可能にする。ベンガル音韻学と音声学では、IPA標準とベンガル中核音素に関する学術的な議論が続いている。本研究は、先行研究を検証し、現在および潜在的な問題を特定し、言語分析とNLP資源創出と下流技術開発を促進するベンガルIPA標準の枠組みを提案する。本稿では,Bengali IPA転写の包括的研究を行い,DLベースのベンチマークを用いた新しいデータセットを組み込んだ新しいIPA転写フレームワークを提案する。

関連論文リスト

BanglaIPA: Towards Robust Text-to-IPA Transcription with Contextual Rewriting in Bengali [1.1347335625859423]
文字ベースの語彙と単語レベルのアライメントを統合した新しいIPA生成システムであるBanglaIPAを提案する。提案システムはベンガル数字を正確に処理し,地域方言間で強い性能を示す。
論文参考訳（メタデータ） (2026-01-05T04:17:31Z)
PhoniTale: Phonologically Grounded Mnemonic Generation for Typologically Distant Language Pairs [51.745816131869674]
大規模言語モデル (LLM) は、学習者の第一言語 (L1) から類似したキーワードを活用して、L2語彙の獲得を支援することで、キーワード・メニーモニックを生成するために使われている。本稿では,IPAに基づく音韻的適応と音節認識アライメントを実行し,L1キーワードシーケンスを検索する新しい言語間メタモニック生成システムであるPhoniTaleを提案する。以上の結果から,PhoniTaleは従来の自動手法を一貫して上回り,人手によるメニーモニックに匹敵する品質を実現していることがわかった。
論文参考訳（メタデータ） (2025-07-07T19:50:12Z)
Languages in Multilingual Speech Foundation Models Align Both Phonetically and Semantically [58.019484208091534]
事前訓練された言語モデル(LM)における言語間アライメントは、テキストベースのLMの効率的な転送を可能にしている。テキストに基づく言語間アライメントの発見と手法が音声に適用されるかどうかについては、未解決のままである。
論文参考訳（メタデータ） (2025-05-26T07:21:20Z)
Cross-Lingual IPA Contrastive Learning for Zero-Shot NER [7.788300011344196]
IPA文字起こしにおける音素表現のギャップを減らすことで、高ソース言語で訓練されたモデルが低リソース言語で効果的に実行できるかを検討する。提案手法は,最高性能のベースラインと比較して,実質的な平均ゲインを示す。
論文参考訳（メタデータ） (2025-03-10T11:52:33Z)
CoSTA: Code-Switched Speech Translation using Aligned Speech-Text Interleaving [61.73180469072787]
インド語から英語のテキストへのコード変更音声の音声翻訳(ST)の問題に焦点をあてる。本稿では、事前訓練された自動音声認識(ASR)と機械翻訳(MT)モジュールを足場として、新しいエンドツーエンドモデルアーキテクチャCOSTAを提案する。 COSTAは、多くの競合するカスケードおよびエンドツーエンドのマルチモーダルベースラインを3.5BLEUポイントまで上回っている。
論文参考訳（メタデータ） (2024-06-16T16:10:51Z)
A Novel Cartography-Based Curriculum Learning Method Applied on RoNLI: The First Romanian Natural Language Inference Corpus [71.77214818319054]
自然言語推論は自然言語理解のプロキシである。ルーマニア語のNLIコーパスは公開されていない。 58Kの訓練文対からなるルーマニア初のNLIコーパス(RoNLI)を紹介する。
論文参考訳（メタデータ） (2024-05-20T08:41:15Z)
Transcribing Bengali Text with Regional Dialects to IPA using District Guided Tokens [0.0]
本稿では,バングラデシュの6つの地区にまたがる新しいデータセットについて,DGT(District Guided Tokens)技術を紹介する。 DGTテクニックは、この新しいデータセットに基づいて、いくつかのトランスフォーマーベースのモデルを微調整する。 ByT5モデルを用いたDGTの有効性を示す実験結果が得られた。
論文参考訳（メタデータ） (2024-03-26T05:55:21Z)
Wav2Gloss: Generating Interlinear Glossed Text from Speech [78.64412090339044]
音声から4つの言語アノテーションを自動抽出するタスクであるWav2Glossを提案する。音声からのインターリニア・グロッシド・テキスト・ジェネレーションの今後の研究の基盤となる基盤となるものについて述べる。
論文参考訳（メタデータ） (2024-03-19T21:45:29Z)
The taste of IPA: Towards open-vocabulary keyword spotting and forced alignment in any language [7.0944623704102625]
音声処理のための音素モデルにより、未知の言語に対して強い言語横断的一般化が達成できることを示す。任意の音声信号と音素シーケンスの開語彙マッチングが可能な多言語音声合成コントラスト埋め込みモデルであるCLAP-IPAを提案する。
論文参考訳（メタデータ） (2023-11-14T17:09:07Z)
Character-Level Bangla Text-to-IPA Transcription Using Transformer Architecture with Sequence Alignment [0.0]
International Phonetic Alphabet (IPA) は、言語学習と理解において不可欠である。ブータンは広く使われている言語の一つとして7番目であり、その領域でIPAを必要としている。本研究では,文字レベルと記号レベルの変換器に基づくシーケンス・ツー・シーケンス・モデルを用いて,各バングラ語のIPAを取得する。
論文参考訳（メタデータ） (2023-11-07T08:20:06Z)
Revisiting IPA-based Cross-lingual Text-to-speech [11.010299086810994]
International Phonetic Alphabet (IPA) は、言語間音声のクローニング(CL VC)を実現するために、TTS (cross-lingual text-to-speech) で広く使われている。本稿では,IPAを入力として用いた言語間TSモデルの構築に関する実証的な知見を報告する。実験により、IPAおよび上行シーケンスの処理方法がCLVCのパフォーマンスに無視できる影響があることが示されている。
論文参考訳（メタデータ） (2021-10-14T07:22:23Z)
Continual Mixed-Language Pre-Training for Extremely Low-Resource Neural Machine Translation [53.22775597051498]
我々は,mbart を未熟な言語に効果的に適用するための,継続的な事前学習フレームワークを提案する。その結果,mBARTベースラインの微調整性能を一貫して改善できることが示された。私たちのアプローチは、両方の言語が元のmBARTの事前トレーニングで見られる翻訳ペアのパフォーマンスを高めます。
論文参考訳（メタデータ） (2021-05-09T14:49:07Z)
Phonological Features for 0-shot Multilingual Speech Synthesis [50.591267188664666]
単言語モデルにおいても,トレーニング中に見つからない言語に対して,コードスイッチングが可能であることを示す。テスト時には、訓練で見たことのない音の近似を含む、新しい言語で、理解不能で、コードスイッチトされた音声を生成する。
論文参考訳（メタデータ） (2020-08-06T18:25:18Z)
GIPFA: Generating IPA Pronunciation from Audio [0.0]
本研究では,単語のIPA発音を自動的に抽出するニューラルネットワーク(ANN)モデルについて検討する。フランスのウィキメディア辞書に基づいて、我々のモデルを訓練し、テストされたIPA発音の75%を正しく予測した。
論文参考訳（メタデータ） (2020-06-13T06:14:11Z)
AlloVera: A Multilingual Allophone Database [137.3686036294502]
AlloVeraは、218のアロフォンから14言語のための音素へのマッピングを提供する。我々は、AlloVeraで構築された「ユニバーサル」アロフォンモデルであるAllosaurusが、音声書き起こしタスクにおいて「ユニバーサル」音声モデルと言語特化モデルより優れていることを示す。
論文参考訳（メタデータ） (2020-04-17T02:02:18Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。