論文の概要: Vowel-based Meeteilon dialect identification using a Random Forest
classifier
- arxiv url: http://arxiv.org/abs/2107.13419v1
- Date: Mon, 26 Jul 2021 04:09:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-30 02:41:37.531845
- Title: Vowel-based Meeteilon dialect identification using a Random Forest
classifier
- Title(参考訳): ランダムフォレスト分類器を用いた母音ベースMeeteilon方言識別
- Authors: Thangjam Clarinda Devi and Kabita Thaoroijam
- Abstract要約: 母音データセットは、Linguistic Data Consortium for Indian Languages (LDC-IL)で利用可能なMeeteilon Speech Corporaを用いて作成される
単声母音音からフォルマント周波数(F1,F1,F3)やピッチ(F0)、エネルギー、強度、セグメント長値などの韻律特徴を抽出する。
決定木に基づくアンサンブルアルゴリズムであるランダム・フォレスト (Random forest) は、メテヨンの3つの主要方言、即ちImphal、Kakching、Sekmaiの分類に用いられている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a vowel-based dialect identification system for
Meeteilon. For this work, a vowel dataset is created by using Meeteilon Speech
Corpora available at Linguistic Data Consortium for Indian Languages (LDC-IL).
Spectral features such as formant frequencies (F1, F1 and F3) and prosodic
features such as pitch (F0), energy, intensity and segment duration values are
extracted from monophthong vowel sounds. Random forest classifier, a decision
tree-based ensemble algorithm is used for classification of three major
dialects of Meeteilon namely, Imphal, Kakching and Sekmai. Model has shown an
average dialect identification performance in terms of accuracy of around
61.57%. The role of spectral and prosodic features are found to be significant
in Meeteilon dialect classification.
- Abstract(参考訳): 本稿では,母音を用いたメセイロン方言識別システムを提案する。
本研究では,インド語用言語データコンソーシアム (ldc-il) で使用可能な meeteilon speech corpora を用いて母音データセットを作成する。
単声母音音からフォルマント周波数(F1,F1,F3)やピッチ(F0)、エネルギー、強度、セグメント長値などの韻律特徴を抽出する。
ランダムフォレスト分類器(random forest classifier)は、決定木に基づくアンサンブルアルゴリズムで、メセイロンの3つの主要な方言、すなわちインパール、カッチング、セクマイの分類に用いられる。
モデルは61.57%の精度で平均的な方言識別性能を示した。
スペクトルおよび韻律的特徴の役割は、メセイロン方言の分類において重要である。
関連論文リスト
- Literary and Colloquial Dialect Identification for Tamil using Acoustic Features [0.0]
音声技術は、言語の様々な方言が絶滅しないようにする役割を担っている。
現在の研究は、人気のある2つのタミル方言と広く分類されたタミル方言を識別する方法を提案する。
論文 参考訳(メタデータ) (2024-08-27T09:00:27Z) - Explaining Spectrograms in Machine Learning: A Study on Neural Networks for Speech Classification [2.4472308031704073]
本研究では,ニューラルネットワークで学習した音声の正確な分類のための識別パターンについて検討する。
母音分類のためのニューラルネットワークのアクティベーションと特徴を調べることで、スペクトログラムでネットワークが何を見るかについての洞察を得る。
論文 参考訳(メタデータ) (2024-07-10T07:37:18Z) - Natural Language Processing for Dialects of a Language: A Survey [56.93337350526933]
最先端自然言語処理(NLP)モデルは、大規模なトレーニングコーパスでトレーニングされ、評価データセットで最上位のパフォーマンスを報告します。
この調査は、これらのデータセットの重要な属性である言語の方言を掘り下げる。
方言データセットに対するNLPモデルの性能劣化と言語技術のエクイティへのその影響を動機として,我々はデータセットやアプローチの観点から,方言に対するNLPの過去の研究を調査した。
論文 参考訳(メタデータ) (2024-01-11T03:04:38Z) - DADA: Dialect Adaptation via Dynamic Aggregation of Linguistic Rules [64.93179829965072]
DADAは、多言語対応のSAE訓練モデルに対するモジュラーアプローチである。
DADAは単一タスクと命令言語モデルの両方に有効であることを示す。
論文 参考訳(メタデータ) (2023-05-22T18:43:31Z) - Stability of Syntactic Dialect Classification Over Space and Time [0.0]
本稿では,12の方言を対象に,月々の間隔で3年間にまたがる英語の12の方言を対象に,1120都市にまたがる空間分布を定式化するテストセットを構築した。
各方言の分類性能の劣化率は時間とともに減少し,統語的変化を受ける地域を特定することができる。
また、方言領域における分類精度の分布により、方言の文法が内部的に不均一である程度を特定できる。
論文 参考訳(メタデータ) (2022-09-11T23:14:59Z) - Exploiting Cross-domain And Cross-Lingual Ultrasound Tongue Imaging
Features For Elderly And Dysarthric Speech Recognition [55.25565305101314]
調音機能は音響信号歪みに不変であり、音声認識システムにうまく組み込まれている。
本稿では,A2Aモデルにおける24時間TaLコーパスの並列音声・超音波舌画像(UTI)データを利用したクロスドメインおよびクロスランガルA2Aインバージョン手法を提案する。
生成した調音機能を組み込んだ3つのタスクの実験は、ベースラインのTDNNとコンフォーマーASRシステムより一貫して優れていた。
論文 参考訳(メタデータ) (2022-06-15T07:20:28Z) - Frequency-centroid features for word recognition of non-native English
speakers [1.9249287163937974]
本研究の目的は,Mel周波数ケプストラム係数(MFCC)の相補的特徴について検討することである。
FCは音声スペクトルの異なる帯域のスペクトル中心をカプセル化し、Melフィルタバンクによって定義されている。
2段階の畳み込みニューラルネットワーク(CNN)は、アラビア語、フランス語、スペイン語のアクセントで発する英語の単語の特徴をモデル化するために用いられる。
論文 参考訳(メタデータ) (2022-06-14T21:19:49Z) - A Highly Adaptive Acoustic Model for Accurate Multi-Dialect Speech
Recognition [80.87085897419982]
単一AMを用いた高精度多言語音声認識のための新しい音響モデリング手法を提案する。
提案するAMは、方言情報とその内部表現に基づいて動的に適応し、複数の方言を同時に扱うための高度適応型AMとなる。
大規模音声データセットにおける実験結果から,提案したAMは,方言固有のAMと比較して,単語誤り率(WER)が8.11%,方言固有のAMに比べて7.31%向上していることがわかった。
論文 参考訳(メタデータ) (2022-05-06T06:07:09Z) - Automatic Dialect Density Estimation for African American English [74.44807604000967]
アフリカ・アメリカン・イングリッシュ(AAE)方言の方言密度の自動予測について検討する。
方言密度は、非標準方言の特徴を含む発話における単語の割合として定義される。
このデータベースでは,AAE音声に対する予測された真理弁証密度と地上の真理弁証密度との間に有意な相関関係を示す。
論文 参考訳(メタデータ) (2022-04-03T01:34:48Z) - Discrete representations in neural models of spoken language [56.29049879393466]
音声言語の弱教師付きモデルの文脈における4つの一般的なメトリクスの利点を比較した。
異なる評価指標が矛盾する結果をもたらすことが分かりました。
論文 参考訳(メタデータ) (2021-05-12T11:02:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。