論文の概要: A Character-level Span-based Model for Mandarin Prosodic Structure
Prediction
- arxiv url: http://arxiv.org/abs/2203.16922v1
- Date: Thu, 31 Mar 2022 09:47:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-01 16:16:10.811120
- Title: A Character-level Span-based Model for Mandarin Prosodic Structure
Prediction
- Title(参考訳): マンダリン韻律構造予測のための文字レベルスパンモデル
- Authors: Xueyuan Chen, Changhe Song, Yixuan Zhou, Zhiyong Wu, Changbin Chen,
Zhongqin Wu, Helen Meng
- Abstract要約: 最適な韻律構造木を得るために,スパンに基づくマンダリン韻律構造予測モデルを提案する。
リッチ言語的特徴は漢字レベルのBERTによって提供され、自己注意型アーキテクチャでエンコーダに送信される。
提案手法は,異なるレベルの韻律ラベルを同時に予測し,その処理を漢字から直接行うことができる。
- 参考スコア(独自算出の注目度): 36.90699361223442
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The accuracy of prosodic structure prediction is crucial to the naturalness
of synthesized speech in Mandarin text-to-speech system, but now is limited by
widely-used sequence-to-sequence framework and error accumulation from previous
word segmentation results. In this paper, we propose a span-based Mandarin
prosodic structure prediction model to obtain an optimal prosodic structure
tree, which can be converted to corresponding prosodic label sequence. Instead
of the prerequisite for word segmentation, rich linguistic features are
provided by Chinese character-level BERT and sent to encoder with
self-attention architecture. On top of this, span representation and label
scoring are used to describe all possible prosodic structure trees, of which
each tree has its corresponding score. To find the optimal tree with the
highest score for a given sentence, a bottom-up CKY-style algorithm is further
used. The proposed method can predict prosodic labels of different levels at
the same time and accomplish the process directly from Chinese characters in an
end-to-end manner. Experiment results on two real-world datasets demonstrate
the excellent performance of our span-based method over all
sequence-to-sequence baseline approaches.
- Abstract(参考訳): 韻律構造予測の精度は, マンダリン音声合成システムにおいて, 合成音声の自然性に欠かせないものであるが, 現在では, 広く用いられているシーケンス・ツー・シーケンスフレームワークや, 先行単語分割結果からの誤り蓄積によって制限されている。
本稿では,スパンに基づくマンダリン韻律構造予測モデルを提案し,対応する韻律ラベル列に変換可能な最適な韻律構造木を求める。
単語セグメンテーションの前提条件に代えて、中国語の文字レベルBERTによってリッチな言語的特徴が提供され、自己注意型アーキテクチャでエンコーダに送られる。
これに加えて、スパン表現とラベルスコアリングは、各木が対応するスコアを持つすべての可能な韻律構造木を記述するために使用される。
与えられた文に対して最もスコアの高い最適木を見つけるために、ボトムアップcky型アルゴリズムも用いられる。
提案手法では、異なるレベルの韻律ラベルを同時に予測し、エンドツーエンドで漢字から直接処理を行うことができる。
2つの実世界のデータセットにおける実験結果は、すべてのシーケンスからシーケンスまでのベースラインアプローチに対して、スパンベース手法の優れた性能を示す。
関連論文リスト
- Character-Level Chinese Dependency Parsing via Modeling Latent Intra-Word Structure [11.184330703168893]
本稿では,中国語における単語の内部構造をモデル化する。
制約付きアイズナーアルゴリズムは、文字レベルの木の互換性を確保するために実装されている。
詳細な分析により、粗大なパース戦略により、より言語学的に妥当な単語内構造を予測することができることが明らかになった。
論文 参考訳(メタデータ) (2024-06-06T06:23:02Z) - Explicit Syntactic Guidance for Neural Text Generation [45.60838824233036]
生成文法は、人間が言語文法を学習することで自然言語のテキストを生成することを示唆している。
本稿では,トップダウン方向の選挙区解析木に案内されたシーケンスを生成する構文誘導型生成スキーマを提案する。
パラフレーズ生成と機械翻訳の実験により,提案手法が自己回帰ベースラインより優れていることが示された。
論文 参考訳(メタデータ) (2023-06-20T12:16:31Z) - Joint Chinese Word Segmentation and Span-based Constituency Parsing [11.080040070201608]
本研究は,中国語の単語セグメント化とSpanに基づくコンストラクタシーパーシングを共同で行う手法を提案する。
実験により,提案アルゴリズムは, CTB 5.1上での関節分割と補間のための最近のモデルよりも優れていた。
論文 参考訳(メタデータ) (2022-11-03T08:19:00Z) - Incorporating Constituent Syntax for Coreference Resolution [50.71868417008133]
本稿では,構成構文構造をグラフベースで組み込む手法を提案する。
また、高次近傍情報を利用して構成木に富んだ構造をエンコードすることも検討する。
on the English and Chinese parts of OntoNotes 5.0 benchmark shows that our proposed model beats a strong baseline or a new-of-the-art performance。
論文 参考訳(メタデータ) (2022-02-22T07:40:42Z) - Discontinuous Grammar as a Foreign Language [0.7412445894287709]
構成解析のためのシーケンス・ツー・シーケンス・モデルの枠組みを拡張した。
我々は不連続性を完全に生成できるいくつかの新規化を設計する。
提案手法はまず,主要な不連続なベンチマーク上でシーケンス・ツー・シーケンス・モデルをテストする。
論文 参考訳(メタデータ) (2021-10-20T08:58:02Z) - Syntactic representation learning for neural network based TTS with
syntactic parse tree traversal [49.05471750563229]
本稿では,構文解析木に基づく構文表現学習手法を提案し,構文構造情報を自動的に活用する。
実験の結果,提案手法の有効性が示された。
複数の構文解析木を持つ文では、合成音声から韻律的差異が明確に認識される。
論文 参考訳(メタデータ) (2020-12-13T05:52:07Z) - Compositional Generalization via Semantic Tagging [81.24269148865555]
本稿では,シーケンス・ツー・シーケンスモデルの表現性と一般性を保存するための新しいデコードフレームワークを提案する。
提案手法は, モデルアーキテクチャ, ドメイン, セマンティックフォーマリズム間の構成一般化を一貫して改善することを示す。
論文 参考訳(メタデータ) (2020-10-22T15:55:15Z) - Span-based Semantic Parsing for Compositional Generalization [53.24255235340056]
SpanBasedSPは入力発話上のスパンツリーを予測し、部分的なプログラムが入力内のスパンをどのように構成するかを明示的に符号化する。
GeoQuery、SCAN、CLOSUREでは、SpanBasedSPはランダムスプリットの強いseq2seqベースラインと似ているが、構成一般化を必要とするスプリットのベースラインに比べて劇的に性能が向上する。
論文 参考訳(メタデータ) (2020-09-13T16:42:18Z) - Tree-structured Attention with Hierarchical Accumulation [103.47584968330325]
階層的累積」は解析木構造を一定時間複雑度で自己注意に符号化する。
提案手法は,4つの IWSLT 翻訳タスクと WMT'14 翻訳タスクにおいて,SOTA 法より優れている。
論文 参考訳(メタデータ) (2020-02-19T08:17:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。