論文の概要: North S\'{a}mi Dialect Identification with Self-supervised Speech Models
- arxiv url: http://arxiv.org/abs/2305.11864v1
- Date: Fri, 19 May 2023 17:53:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-22 13:02:27.188447
- Title: North S\'{a}mi Dialect Identification with Self-supervised Speech Models
- Title(参考訳): 自己教師付き音声モデルを用いた北s\'{a}mi方言識別
- Authors: Sofoklis Kakouros and Katri Hiovain-Asikainen
- Abstract要約: 北サミ語(NS)は4つの主要な方言の変種を包含しているが、その音韻論、形態学、語彙に違いがある。
MFCCや韻律的特徴を含む広範囲な音響的特徴を, 4種類のNS変種の自動検出のために検討した。
その結果, NS方言は状態言語の影響を受け, 4方言は分離可能であり, 高い分類精度が得られた。
- 参考スコア(独自算出の注目度): 1.1548853370822343
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The North S\'{a}mi (NS) language encapsulates four primary dialectal variants
that are related but that also have differences in their phonology, morphology,
and vocabulary. The unique geopolitical location of NS speakers means that in
many cases they are bilingual in S\'{a}mi as well as in the dominant state
language: Norwegian, Swedish, or Finnish. This enables us to study the NS
variants both with respect to the spoken state language and their acoustic
characteristics. In this paper, we investigate an extensive set of acoustic
features, including MFCCs and prosodic features, as well as state-of-the-art
self-supervised representations, namely, XLS-R, WavLM, and HuBERT, for the
automatic detection of the four NS variants. In addition, we examine how the
majority state language is reflected in the dialects. Our results show that NS
dialects are influenced by the state language and that the four dialects are
separable, reaching high classification accuracy, especially with the XLS-R
model.
- Abstract(参考訳): 北S'{a}mi(NS)言語は、関連するが音韻学、形態学、語彙にも違いがある4つの主要な方言の変種をカプセル化している。
NS話者の独特な地政学的位置は、多くの場合、ノルウェー語、スウェーデン語、フィンランド語といった支配的な国家言語と同様に、S\'{a}miでもバイリンガルであることを意味する。
これにより、音声状態言語とその音響特性の両方について、nsの変種を研究できる。
本稿では,MFCC や韻律的特徴,最先端の自己教師型表現,すなわち XLS-R, WavLM, HuBERT などの音響的特徴を用いて,4種類のNS 変種の自動検出を行う。
さらに,主要な国語が方言にどのように反映されているかを検討する。
その結果、NS方言は状態言語の影響を受けており、4方言は分離可能であり、特にXLS-Rモデルでは高い分類精度が得られた。
関連論文リスト
- Literary and Colloquial Dialect Identification for Tamil using Acoustic Features [0.0]
音声技術は、言語の様々な方言が絶滅しないようにする役割を担っている。
現在の研究は、人気のある2つのタミル方言と広く分類されたタミル方言を識別する方法を提案する。
論文 参考訳(メタデータ) (2024-08-27T09:00:27Z) - Voices Unheard: NLP Resources and Models for Yorùbá Regional Dialects [72.18753241750964]
Yorub'aは、約4700万人の話者を持つアフリカの言語である。
アフリカ語のためのNLP技術開発への最近の取り組みは、彼らの標準方言に焦点を当てている。
我々は、このギャップを埋めるために、新しい高品質のパラレルテキストと音声コーパスを導入する。
論文 参考訳(メタデータ) (2024-06-27T22:38:04Z) - An Initial Investigation of Language Adaptation for TTS Systems under Low-resource Scenarios [76.11409260727459]
本稿では,最近のSSLベースの多言語TSシステムであるZMM-TTSの言語適応性について検討する。
本研究では,事前学習言語と対象言語との音声学的な類似性が,対象言語の適応性能に影響を及ぼすことを示す。
論文 参考訳(メタデータ) (2024-06-13T08:16:52Z) - What Do Dialect Speakers Want? A Survey of Attitudes Towards Language Technology for German Dialects [60.8361859783634]
我々はドイツ語に関連する方言と地域言語に関する話者を調査した。
回答者は特に、方言入力で動作する潜在的なNLPツールを好んでいる。
論文 参考訳(メタデータ) (2024-02-19T09:15:28Z) - Multi-VALUE: A Framework for Cross-Dialectal English NLP [49.55176102659081]
マルチディレクト (Multi-Dilect) は、50の英語方言にまたがる制御可能なルールベースの翻訳システムである。
ストレステストは、非標準方言の先行モデルに対する顕著な性能格差を示す。
私たちはチカノやインド英語のネイティブスピーカーと提携して、人気のあるCoQAタスクの新しいゴールドスタンダード版をリリースしています。
論文 参考訳(メタデータ) (2022-12-15T18:17:01Z) - A Highly Adaptive Acoustic Model for Accurate Multi-Dialect Speech
Recognition [80.87085897419982]
単一AMを用いた高精度多言語音声認識のための新しい音響モデリング手法を提案する。
提案するAMは、方言情報とその内部表現に基づいて動的に適応し、複数の方言を同時に扱うための高度適応型AMとなる。
大規模音声データセットにおける実験結果から,提案したAMは,方言固有のAMと比較して,単語誤り率(WER)が8.11%,方言固有のAMに比べて7.31%向上していることがわかった。
論文 参考訳(メタデータ) (2022-05-06T06:07:09Z) - Quantifying Language Variation Acoustically with Few Resources [4.162663632560141]
ディープ・アコースティック・モデルは低リソース言語に転送する言語情報を学んだかもしれない。
4つの言語(地域)から100以上の方言に対して平均10語以上の発音差を計算する。
その結果,音響モデルは音素の書き起こしを必要とせずに(従来の)書き起こし方式よりも優れていることがわかった。
論文 参考訳(メタデータ) (2022-05-05T15:00:56Z) - Automatic Dialect Density Estimation for African American English [74.44807604000967]
アフリカ・アメリカン・イングリッシュ(AAE)方言の方言密度の自動予測について検討する。
方言密度は、非標準方言の特徴を含む発話における単語の割合として定義される。
このデータベースでは,AAE音声に対する予測された真理弁証密度と地上の真理弁証密度との間に有意な相関関係を示す。
論文 参考訳(メタデータ) (2022-04-03T01:34:48Z) - Cross-lingual Low Resource Speaker Adaptation Using Phonological
Features [2.8080708404213373]
我々は、異なる言語に共通する音韻的特徴のセットに基づいて、言語に依存しないマルチスピーカモデルを訓練する。
対象話者データの32と8の発声で、対応する文献に匹敵する高い話者類似度スコアと自然性を得る。
論文 参考訳(メタデータ) (2021-11-17T12:33:42Z) - Learning to Recognize Dialect Features [21.277962038423123]
本稿では,方言の特徴検出の課題を紹介するとともに,2つのマルチタスク学習手法を提案する。
言語学者は通常、方言の特徴をどのように定義するかに基づいて、モデルを少数の最小のペアでトレーニングします。
論文 参考訳(メタデータ) (2020-10-23T23:25:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。