論文の概要: An Investigation of Indian Native Language Phonemic Influences on L2
English Pronunciations
- arxiv url: http://arxiv.org/abs/2212.09284v1
- Date: Mon, 19 Dec 2022 07:41:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-20 16:39:21.385307
- Title: An Investigation of Indian Native Language Phonemic Influences on L2
English Pronunciations
- Title(参考訳): インドの母語音韻がl2英語発音に与える影響の検討
- Authors: Shelly Jain, Priyanshi Pal, Anil Vuppala, Prasanta Ghosh, Chiranjeevi
Yarra
- Abstract要約: インドのL2英語話者の増加は、アクセントとL1-L2相互作用を研究する必要がある。
インド英語話者(IE)のアクセントを調査し、我々の観察を詳細に報告する。
既存の文献研究と80人の話者の音声で注釈付けされた発話から得られたIE発音とネイティブ言語の発音を比較して,インド語18言語がIEに与える影響を実証した。
- 参考スコア(独自算出の注目度): 5.3956335232250385
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Speech systems are sensitive to accent variations. This is especially
challenging in the Indian context, with an abundance of languages but a dearth
of linguistic studies characterising pronunciation variations. The growing
number of L2 English speakers in India reinforces the need to study accents and
L1-L2 interactions. We investigate the accents of Indian English (IE) speakers
and report in detail our observations, both specific and common to all regions.
In particular, we observe the phonemic variations and phonotactics occurring in
the speakers' native languages and apply this to their English pronunciations.
We demonstrate the influence of 18 Indian languages on IE by comparing the
native language pronunciations with IE pronunciations obtained jointly from
existing literature studies and phonetically annotated speech of 80 speakers.
Consequently, we are able to validate the intuitions of Indian language
influences on IE pronunciations by justifying pronunciation rules from the
perspective of Indian language phonology. We obtain a comprehensive description
in terms of universal and region-specific characteristics of IE, which
facilitates accent conversion and adaptation of existing ASR and TTS systems to
different Indian accents.
- Abstract(参考訳): 音声システムはアクセントの変化に敏感である。
これはインドの文脈では特に困難であり、言語は豊富であるが、発音のバリエーションを特徴付ける言語研究が盛んである。
インドにおけるL2英語話者の増加は、アクセントとL1-L2相互作用を研究する必要性を強化している。
インド英語話者(ie)のアクセントを調査し、我々の観察を詳細に報告した。
特に、話者の母国語で発生する音韻変化と音韻学的特徴を観察し、これを英語の発音に適用する。
既存の文献から得られた発音と,80名の話者による音韻アノテート音声との比較により,18ヶ国語がieに与える影響を実証した。
その結果、インド語音韻学の観点から発音規則を正当化することにより、インド語がie発音に与える影響の直観を検証できる。
インドのアクセントに対して既存のASRおよびTSシステムのアクセント変換と適応を容易にするIEの普遍的特徴と地域特化特性を総合的に記述する。
関連論文リスト
- Improving Pronunciation and Accent Conversion through Knowledge Distillation And Synthetic Ground-Truth from Native TTS [52.89324095217975]
アクセント変換に対する従来のアプローチは主に非ネイティブ音声をよりネイティブにすることを目的としていた。
我々は、アクセント変換だけでなく、非ネイティブアクセント話者の発音を改善する新しいACアプローチを開発した。
論文 参考訳(メタデータ) (2024-10-19T06:12:31Z) - What Do Dialect Speakers Want? A Survey of Attitudes Towards Language Technology for German Dialects [60.8361859783634]
我々はドイツ語に関連する方言と地域言語に関する話者を調査した。
回答者は特に、方言入力で動作する潜在的なNLPツールを好んでいる。
論文 参考訳(メタデータ) (2024-02-19T09:15:28Z) - Multi-lingual and Multi-cultural Figurative Language Understanding [69.47641938200817]
図形言語は人間のコミュニケーションに浸透するが、NLPでは比較的過小評価されている。
Hindi, Indonesian, Javanese, Kannada, Sundanese, Swahili, Yorubaの7つの多様な言語に関するデータセットを作成しました。
我々のデータセットから,各言語は,同じ領域から派生した言語間で最も高い重なり合いを持つ,図形表現の文化的・地域的概念に依存していることが明らかとなった。
全ての言語は、事前学習データと微調整データの可用性を反映した性能の変化により、英語と比較して大きな欠陥がある。
論文 参考訳(メタデータ) (2023-05-25T15:30:31Z) - Svarah: Evaluating English ASR Systems on Indian Accents [12.197514367387692]
Svarahは、インド全65カ所の117人の話者から9.6時間の英語音声が書き起こされたベンチマークです。
スバラ語は、読み上げ音声と自発的会話データの両方を含み、歴史、文化、観光など様々な領域をカバーし、多様な語彙を保証する。
我々は,Svarah上での6つのオープンソースASRモデルと2つの商用ASRシステムを評価し,インドアクセントを改善するための明確な範囲があることを示した。
論文 参考訳(メタデータ) (2023-05-25T06:20:29Z) - Improve Bilingual TTS Using Dynamic Language and Phonology Embedding [10.244215079409797]
本稿では,中国語の単言語話者からより標準の英語音声を取得するために,マンダリン・イングリッシュ・TSシステムを構築した。
言語と音韻の動的強度を捉えるための埋め込み強度変調器を特別に設計する。
論文 参考訳(メタデータ) (2022-12-07T03:46:18Z) - Study of Indian English Pronunciation Variabilities relative to Received
Pronunciation [5.3956335232250385]
IndicTIMITはIE品種の多様性に富み、栄養バランスの取れた方法で培養されている。
本稿では,データ駆動方式による未探索規則の報告とともに,IEの音声規則を検証する手法を提案する。
論文 参考訳(メタデータ) (2022-04-13T16:35:52Z) - A study on native American English speech recognition by Indian
listeners with varying word familiarity level [62.14295630922855]
発声を認識している間、各聴取者から3種類の応答が得られます。
これらの転写から単語誤り率(WER)を算出し、認識された文と原文との類似性を評価する指標として用いる。
話者のナティビティの賢明な分析は、一部のナティビティの話者からの発声が、他のいくつかのナティビティに比べてインド人のリスナーによって認識されるのが困難であることを示している。
論文 参考訳(メタデータ) (2021-12-08T07:43:38Z) - Non-native English lexicon creation for bilingual speech synthesis [9.533867546985887]
バイリンガル・テキスト・音声システムの知性は、非ネイティブ話者が使用する音素配列をキャプチャする語彙に依存する。
非ネイティブな英語辞書がないため、既存のバイリンガルTSシステムは、広く利用可能な英語辞書を使用している。
本稿では,母国英語の語彙を非母国語バージョンにマッピングするために,文字と音素のアライメントに基づく規則を得るための汎用的アプローチを提案する。
論文 参考訳(メタデータ) (2021-06-21T06:07:14Z) - Automatic Speech Recognition in Sanskrit: A New Speech Corpus and
Modelling Insights [25.666767669695044]
サンスクリット語で表現される言語的特徴を忠実に捉えた78時間のASRデータセットをリリースする。
単語中の1つの母音から次の母音への文字列をキャプチャする,音節レベルの単位選択にインスパイアされた新しいモデリング単位を提案する。
我々はこれらの知見をサンスクリットASRから拡張し、他の2つのIndic言語であるGujaratiとTeluguでASRシステムを構築する。
論文 参考訳(メタデータ) (2021-06-02T18:06:32Z) - Phoneme Recognition through Fine Tuning of Phonetic Representations: a
Case Study on Luhya Language Varieties [77.2347265289855]
音韻アノテーションに基づく多言語認識手法であるAllosaurus を用いた音素認識に焦点を当てた。
挑戦的な実世界シナリオで評価するために,我々は,ケニア西部とウガンダ東部のluhya言語クラスタの2つの種類であるbukusuとsaamiaの音声認識データセットをキュレートした。
私たちは、アロサウルスの微調整がわずか100発話であっても、電話のエラー率を大幅に改善することが分かりました。
論文 参考訳(メタデータ) (2021-04-04T15:07:55Z) - AlloVera: A Multilingual Allophone Database [137.3686036294502]
AlloVeraは、218のアロフォンから14言語のための音素へのマッピングを提供する。
我々は、AlloVeraで構築された「ユニバーサル」アロフォンモデルであるAllosaurusが、音声書き起こしタスクにおいて「ユニバーサル」音声モデルと言語特化モデルより優れていることを示す。
論文 参考訳(メタデータ) (2020-04-17T02:02:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。