論文の概要: Prosody Labelled Dataset for Hindi using Semi-Automated Approach
- arxiv url: http://arxiv.org/abs/2112.05973v1
- Date: Sat, 11 Dec 2021 13:11:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-14 16:23:47.260473
- Title: Prosody Labelled Dataset for Hindi using Semi-Automated Approach
- Title(参考訳): 半自動アプローチによるヒンディー語韻律ラベリングデータセット
- Authors: Esha Banerjee, Atul Kr. Ojha, Girish Nath Jha
- Abstract要約: 本研究は,ヒンディー語のための半自動ラベル付き韻律データベースの開発を目的とする。
ヒンディー語では韻律ラベリングの標準は存在しない。
ピッチアクセント、中間句境界、アクセント句境界の訓練されたモデルの精度は、それぞれ73.40%、93.20%、および43%である。
- 参考スコア(独自算出の注目度): 0.19733467999508417
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This study aims to develop a semi-automatically labelled prosody database for
Hindi, for enhancing the intonation component in ASR and TTS systems, which is
also helpful for building Speech to Speech Machine Translation systems.
Although no single standard for prosody labelling exists in Hindi, researchers
in the past have employed perceptual and statistical methods in literature to
draw inferences about the behaviour of prosody patterns in Hindi. Based on such
existing research and largely agreed upon theories of intonation in Hindi, this
study attempts to first develop a manually annotated prosodic corpus of Hindi
speech data, which is then used for training prediction models for generating
automatic prosodic labels. A total of 5,000 sentences (23,500 words) for
declarative and interrogative types have been labelled. The accuracy of the
trained models for pitch accent, intermediate phrase boundaries and accentual
phrase boundaries is 73.40%, 93.20%, and 43% respectively.
- Abstract(参考訳): 本研究では,音声から音声への翻訳システムを構築する上でも有用であるASRおよびTSシステムにおけるイントネーションの強化を目的とした,Hindiのための半自動ラベル付き韻律データベースの開発を目的とする。
ヒンディー語には韻律ラベリングの標準は存在しないが、過去の研究者は、ヒンディー語における韻律パターンの振る舞いに関する推論を、知覚的および統計的手法を用いて文学に採用してきた。
このような既存の研究に基づいて、ヒンズー語におけるイントネーション理論にほぼ同意したこの研究は、まずヒンズー語音声データの手作業による韻律コーパスを開発し、その後、自動韻律ラベルを生成するための予測モデルのトレーニングに使用される。
宣言型と尋問型の合計5000文(23,500語)がラベル付けされている。
ピッチアクセント、中間句境界、アクセント句境界の訓練されたモデルの精度は、それぞれ73.40%、93.20%、および43%である。
関連論文リスト
- Navigating Text-to-Image Generative Bias across Indic Languages [53.92640848303192]
本研究ではインドで広く話されているIndic言語に対するテキスト・ツー・イメージ(TTI)モデルのバイアスについて検討する。
これらの言語における主要なTTIモデルの生成的パフォーマンスと文化的関連性を評価し,比較する。
論文 参考訳(メタデータ) (2024-08-01T04:56:13Z) - Speech-to-Speech Translation For A Real-world Unwritten Language [62.414304258701804]
本研究では、ある言語から別の言語に音声を翻訳する音声音声翻訳(S2ST)について研究する。
我々は、トレーニングデータ収集、モデル選択、ベンチマークデータセットのリリースからエンドツーエンドのソリューションを提示します。
論文 参考訳(メタデータ) (2022-11-11T20:21:38Z) - Aggression in Hindi and English Speech: Acoustic Correlates and
Automatic Identification [0.802904964931021]
この研究は、わずか10時間以上の政治談話のコーパスに基づいている。
我々は、英語とヒンディー語における攻撃を識別する2つの自動分類システムを開発した。
論文 参考訳(メタデータ) (2022-04-06T13:29:25Z) - Automatic Dialect Density Estimation for African American English [74.44807604000967]
アフリカ・アメリカン・イングリッシュ(AAE)方言の方言密度の自動予測について検討する。
方言密度は、非標準方言の特徴を含む発話における単語の割合として定義される。
このデータベースでは,AAE音声に対する予測された真理弁証密度と地上の真理弁証密度との間に有意な相関関係を示す。
論文 参考訳(メタデータ) (2022-04-03T01:34:48Z) - Towards automatic identification of linguistic politeness in Hindi texts [1.2691047660244332]
25,000以上のブログコメントを手作業でアノテートしたコーパスを使ってSVMをトレーニングしました。
トレーニングされたシステムは、人間の精度の2%以内である77%以上の精度を著しく向上させる。
論文 参考訳(メタデータ) (2021-11-30T10:32:17Z) - Leveraging Pre-trained Language Model for Speech Sentiment Analysis [58.78839114092951]
本研究では、事前学習された言語モデルを用いて、文章の感情情報を学習し、音声の感情分析を行う。
本稿では,言語モデルを用いた擬似ラベルに基づく半教師付き訓練戦略を提案する。
論文 参考訳(メタデータ) (2021-06-11T20:15:21Z) - Coarse and Fine-Grained Hostility Detection in Hindi Posts using Fine
Tuned Multilingual Embeddings [4.3012765978447565]
敵意検出タスクは、英語のようなリソースに富む言語でよく研究されているが、Hindidueのようなリソースに制約のある言語では探索されていない。
ヒンディー語投稿における敵意検出に有効なニューラルネットワークに基づく手法を提案する。
論文 参考訳(メタデータ) (2021-01-13T11:00:31Z) - Infusing Finetuning with Semantic Dependencies [62.37697048781823]
シンタックスとは異なり、セマンティクスは今日の事前訓練モデルによって表面化されないことを示す。
次に、畳み込みグラフエンコーダを使用して、タスク固有の微調整にセマンティック解析を明示的に組み込む。
論文 参考訳(メタデータ) (2020-12-10T01:27:24Z) - A Survey on Text Classification: From Shallow to Deep Learning [83.47804123133719]
過去10年は、ディープラーニングが前例のない成功を収めたために、この分野の研究が急増している。
本稿では,1961年から2021年までの最先端のアプローチを見直し,そのギャップを埋める。
特徴抽出と分類に使用されるテキストとモデルに基づいて,テキスト分類のための分類を作成する。
論文 参考訳(メタデータ) (2020-08-02T00:09:03Z) - Validation and Normalization of DCS corpus using Sanskrit Heritage tools
to build a tagged Gold Corpus [0.0]
デジタル・コーパス・オブ・サンスクリット(Digital Corpus of Sanskrit)は、その形態的および語彙的タグ付けとともに約65万の文を記録している。
サンスクリット・ヘリテージ・エンジン(英語版)の読者は、形態学的および語彙的分析を伴うあらゆる可能な区分を生産している。
論文 参考訳(メタデータ) (2020-05-13T19:23:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。