論文の概要: Accent Estimation of Japanese Words from Their Surfaces and
Romanizations for Building Large Vocabulary Accent Dictionaries
- arxiv url: http://arxiv.org/abs/2009.09679v1
- Date: Mon, 21 Sep 2020 08:38:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-16 05:26:43.689132
- Title: Accent Estimation of Japanese Words from Their Surfaces and
Romanizations for Building Large Vocabulary Accent Dictionaries
- Title(参考訳): 単語の表面からのアクセント推定と大語彙アクセント辞書構築のためのロマン化
- Authors: Hideyuki Tachibana, Yotaro Katayama
- Abstract要約: 著者らは限られた情報から単語のアクセントを予測するアクセント推定手法を開発した。
実験により, アクセントを高い精度で推定できることが確認された。
著者らは、既存の大語彙辞書NEologdにこの技法を適用し、大語彙日本語アクセント辞書を得た。
- 参考スコア(独自算出の注目度): 11.77729222870674
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In Japanese text-to-speech (TTS), it is necessary to add accent information
to the input sentence. However, there are a limited number of publicly
available accent dictionaries, and those dictionaries e.g. UniDic, do not
contain many compound words, proper nouns, etc., which are required in a
practical TTS system. In order to build a large scale accent dictionary that
contains those words, the authors developed an accent estimation technique that
predicts the accent of a word from its limited information, namely the surface
(e.g. kanji) and the yomi (simplified phonetic information). It is
experimentally shown that the technique can estimate accents with high
accuracies, especially for some categories of words. The authors applied this
technique to an existing large vocabulary Japanese dictionary NEologd, and
obtained a large vocabulary Japanese accent dictionary. Many cases have been
observed in which the use of this dictionary yields more appropriate phonetic
information than UniDic.
- Abstract(参考訳): 日本語テキスト音声(TTS)では,アクセント情報を入力文に追加する必要がある。
しかし、公開されているアクセント辞書は限られており、例えばUniDicのような辞書には、実用的なTSシステムで必要とされる複合語や固有名詞などが多く含まれていない。
これらの単語を含む大規模なアクセント辞書を構築するため、著者らは限られた情報(漢字など)から単語のアクセントを予測するアクセント推定手法を開発した。
この手法はアクセントを高い確率で推定できることを実験的に示している。
著者らは、既存の大語彙辞書NEologdにこの技法を適用し、大語彙日本語アクセント辞書を得た。
この辞書を用いることで、UniDicよりも適切な音声情報が得られるケースが数多く見受けられる。
関連論文リスト
- The Development of a Comprehensive Spanish Dictionary for Phonetic and Lexical Tagging in Socio-phonetic Research (ESPADA) [0.0]
スペイン語の方言の変種の大部分で使用可能な、スペイン語の包括的な発音辞書(ESPADA)の作成について紹介する。
ESPADAは16か国の単語を表わす628,000以上のエントリを持つ最も完全な辞書である。
これは、スペイン語の社会音声学の枠組みにおける方言研究を強化する完全なオープンソースツールを社会音声学研究者に提供することを目的としている。
論文 参考訳(メタデータ) (2024-07-22T04:51:33Z) - Quantifying the redundancy between prosody and text [67.07817268372743]
我々は大きな言語モデルを用いて、韻律と単語自体の間にどれだけの情報が冗長であるかを推定する。
単語が持つ情報と韻律情報の間には,複数の韻律的特徴にまたがる高い冗長性が存在する。
それでも、韻律的特徴はテキストから完全には予測できないことが観察され、韻律は単語の上下に情報を運ぶことが示唆された。
論文 参考訳(メタデータ) (2023-11-28T21:15:24Z) - Improving Large-scale Deep Biasing with Phoneme Features and Text-only
Data in Streaming Transducer [23.70253642540094]
Transducerの深いバイアスは、稀な単語やコンテキストエンティティの認識性能を向上させることができる。
本稿では,トランスデューサにおけるレアワードの音素情報とテキスト情報を組み合わせて,類似した発音や綴りで単語を区別する。
LibriSpeech corpus の実験により,提案手法は,異なるスケールとバイアスリストのレベルに対して,稀な単語誤り率に対する最先端性能を実現することを示した。
論文 参考訳(メタデータ) (2023-11-15T13:53:28Z) - Controllable Emphasis with zero data for text-to-speech [57.12383531339368]
強調音声を簡易かつ効果的に処理する方法は、強調単語の予測持続時間を増加させることである。
これは自然度を7.3%向上させるスペクトログラム修正手法よりもはるかに優れていることを示し、基準女性のen-US音声に対して、文章中の強調された単語の正しさを40%精度で識別する。
論文 参考訳(メタデータ) (2023-07-13T21:06:23Z) - DICTDIS: Dictionary Constrained Disambiguation for Improved NMT [50.888881348723295]
我々は辞書から派生した複数の候補翻訳の曖昧さを解消する語彙制約付きNMTシステムであるDictDisを提案する。
我々は、規制、金融、工学を含む様々な分野において、英語・ヒンディー語・英語・ドイツ語文に関する広範な実験を通じて、DictDisの有用性を実証する。
論文 参考訳(メタデータ) (2022-10-13T13:04:16Z) - Revisiting Syllables in Language Modelling and their Application on
Low-Resource Machine Translation [1.2617078020344619]
シラブルは文字よりも短いシーケンスを提供し、モルヒムよりも特定の抽出規則を必要とせず、そのセグメンテーションはコーパスサイズの影響を受けない。
まず,21言語におけるオープン語彙言語モデリングにおける音節の可能性について検討する。
我々は6つの言語に対して規則に基づくシラビフィケーション手法を使用し、残りはシラビフィケーションプロキシとして機能するハイフン化で対処する。
論文 参考訳(メタデータ) (2022-10-05T18:55:52Z) - Dict-TTS: Learning to Pronounce with Prior Dictionary Knowledge for
Text-to-Speech [88.22544315633687]
ポリホンの曖昧さは, 音声合成システムにおいて, 自然なテキストシーケンスから正確な発音知識を抽出することを目的としている。
オンラインウェブサイト辞書を用いた意味認識型テキスト音声合成モデルであるDict-TTSを提案する。
3つの言語による実験結果から,我々のモデルは発音精度においていくつかの強いベースラインモデルより優れていることが示された。
論文 参考訳(メタデータ) (2022-06-05T10:50:34Z) - Automatic Dialect Density Estimation for African American English [74.44807604000967]
アフリカ・アメリカン・イングリッシュ(AAE)方言の方言密度の自動予測について検討する。
方言密度は、非標準方言の特徴を含む発話における単語の割合として定義される。
このデータベースでは,AAE音声に対する予測された真理弁証密度と地上の真理弁証密度との間に有意な相関関係を示す。
論文 参考訳(メタデータ) (2022-04-03T01:34:48Z) - English Accent Accuracy Analysis in a State-of-the-Art Automatic Speech
Recognition System [3.4888132404740797]
様々なラベル付き英語アクセントを持つコーパスからの未認識データを用いて,最先端の自動音声認識モデルを評価する。
本研究は,アクセントの多様性に関して,訓練コーパスで最も普及しているアクセントに有利な正確性バイアスが存在することを示す。
論文 参考訳(メタデータ) (2021-05-09T08:24:33Z) - A Corpus for Large-Scale Phonetic Typology [112.19288631037055]
本稿では,VoxClamantis v1.0について紹介する。
635言語にまたがる690の音素レベルラベルと690の音素レベルラベルと母音とシビラントの音響・音韻測定を行った。
論文 参考訳(メタデータ) (2020-05-28T13:03:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。