論文の概要: Automating Sound Change Prediction for Phylogenetic Inference: A
Tukanoan Case Study
- arxiv url: http://arxiv.org/abs/2402.01582v1
- Date: Fri, 2 Feb 2024 17:20:16 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-05 14:01:28.778068
- Title: Automating Sound Change Prediction for Phylogenetic Inference: A
Tukanoan Case Study
- Title(参考訳): 系統推定のための音響変化予測の自動化:ツカノアの事例
- Authors: Kalvin Chang, Nathaniel R. Robinson, Anna Cai, Ting Chen, Annie Zhang,
David R. Mortensen
- Abstract要約: ニューラルネットワークを音響変化データに基づいてトレーニングし、歴史的プロトフォームとその現代的子孫間の中間的な音変化ステップを予測する。
ツカノ語の言語に関する最良の実験では、専門家アノテーションを使用した木から一般四重項距離0.12の木を生成する。
- 参考スコア(独自算出の注目度): 12.78027959820939
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We describe a set of new methods to partially automate linguistic
phylogenetic inference given (1) cognate sets with their respective protoforms
and sound laws, (2) a mapping from phones to their articulatory features and
(3) a typological database of sound changes. We train a neural network on these
sound change data to weight articulatory distances between phones and predict
intermediate sound change steps between historical protoforms and their modern
descendants, replacing a linguistic expert in part of a parsimony-based
phylogenetic inference algorithm. In our best experiments on Tukanoan
languages, this method produces trees with a Generalized Quartet Distance of
0.12 from a tree that used expert annotations, a significant improvement over
other semi-automated baselines. We discuss potential benefits and drawbacks to
our neural approach and parsimony-based tree prediction. We also experiment
with a minimal generalization learner for automatic sound law induction,
finding it comparably effective to sound laws from expert annotation. Our code
is publicly available at https://github.com/cmu-llab/aiscp.
- Abstract(参考訳): 本稿では,(1)コーグネート集合とそれぞれの原形と音律,(2)電話から調音特徴へのマッピング,(3)音変化の類型的データベースを与えられた,言語系統推定を部分的に自動化する一連の新しい手法について述べる。
これらの音変化データのニューラルネットワークを、電話間の重み付け距離に訓練し、歴史的原型とその現代子孫間の中間音変化ステップを予測し、パシモニーベースの系統推論アルゴリズムの一部として言語の専門家を置き換える。
ツカノ語の言語に関する最良の実験では、専門家アノテーションを用いた木から一般四重項距離0.12の木を生産し、他の半自動ベースラインよりも大幅に改善した。
ニューラルアプローチとパーシモニーに基づく木予測に対する潜在的な利点と欠点について論じる。
また,自動法則誘導のための最小限の一般化学習器を試作し,専門家の注釈から音声法則を比較検討した。
私たちのコードはhttps://github.com/cmu-llab/aiscpで公開されています。
関連論文リスト
- We Augmented Whisper With kNN and You Won't Believe What Came Next [10.174848090916669]
変換器のエンドツーエンド音声モデルであるWhisperが$k$NNの恩恵を受けていることを示す。
話者適応の意義について議論し、性別、アクセント、年齢による改善を分析した。
論文 参考訳(メタデータ) (2024-10-24T15:32:52Z) - Human-like Linguistic Biases in Neural Speech Models: Phonetic Categorization and Phonotactic Constraints in Wav2Vec2.0 [0.11510009152620666]
We study how how Wav2Vec2solvs phonotactic constraints。
我々は/l/と/r/の音響連続体に音を合成し、制御された文脈に埋め込む。
人間と同様に、Wav2Vec2モデルは、このようなあいまいな音を処理する際に、音素的に許容できるカテゴリーに対してバイアスを示す。
論文 参考訳(メタデータ) (2024-07-03T11:04:31Z) - Co-training for Low Resource Scientific Natural Language Inference [65.37685198688538]
遠隔教師付きラベルに分類器のトレーニング力学に基づいて重みを割り当てる新しいコトレーニング手法を提案する。
予測された信頼度に対する任意のしきい値に基づいてサンプルをフィルタリングするのではなく、重要重みを割り当てることにより、自動ラベル付きデータの使用を最大化する。
提案手法は、遠隔監視ベースラインに対するマクロF1の1.5%の改善と、他の強力なSSLベースラインよりも大幅に改善されている。
論文 参考訳(メタデータ) (2024-06-20T18:35:47Z) - A unified one-shot prosody and speaker conversion system with
self-supervised discrete speech units [94.64927912924087]
既存のシステムは韻律と言語内容の相関を無視し、変換された音声の自然度を低下させる。
自己教師付き離散音声単位を言語表現として活用するカスケードモジュラーシステムを提案する。
実験により,本システムは,自然性,知性,話者伝達性,韻律伝達性において,従来の手法よりも優れていたことがわかった。
論文 参考訳(メタデータ) (2022-11-12T00:54:09Z) - Learning Phone Recognition from Unpaired Audio and Phone Sequences Based
on Generative Adversarial Network [58.82343017711883]
そこで本研究では,不適切な音声系列や発話から直接学習する方法について検討する。
GAN訓練を第1段階に導入し,無声音声と音声シーケンスのマッピング関係を求める。
第2段階では、発電機の出力からトレーニングするために別のHMMモデルが導入され、性能が向上する。
論文 参考訳(メタデータ) (2022-07-29T09:29:28Z) - Wav2Seq: Pre-training Speech-to-Text Encoder-Decoder Models Using Pseudo
Languages [58.43299730989809]
本稿では,音声データに対するエンコーダ・デコーダモデルの両部分を事前学習するための,最初の自己教師型アプローチであるWav2Seqを紹介する。
我々は、コンパクトな離散表現として擬似言語を誘導し、自己教師付き擬似音声認識タスクを定式化する。
このプロセスは独自のものであり、低コストの第2段階のトレーニングとして適用することができる。
論文 参考訳(メタデータ) (2022-05-02T17:59:02Z) - Ctrl-P: Temporal Control of Prosodic Variation for Speech Synthesis [68.76620947298595]
テキストは音声形式を完全には規定しないので、テキストから音声へのモデルは、対応するテキストで説明されない方法で異なる音声データから学習できなければならない。
韻律の3つの一次音響相関に明示的に条件付けされた音声を生成するモデルを提案する。
論文 参考訳(メタデータ) (2021-06-15T18:03:48Z) - Deep Sound Change: Deep and Iterative Learning, Convolutional Neural
Networks, and Language Change [0.0]
本稿では,深層学習と反復学習を組み合わせた音響変化をモデル化するための枠組みを提案する。
音響変化のいくつかの性質は、提案されたアーキテクチャから生じると論じている。
論文 参考訳(メタデータ) (2020-11-10T23:49:09Z) - Syllabification of the Divine Comedy [0.0]
本稿では,確率的および制約的プログラミングの手法を用いて,Divine Comedyのシラビフィケーションアルゴリズムを提案する。
我々は特に、隣接した単語でシナリーフに参加する単語の「正当性」の観点から、シナリーフに焦点を合わせている。
我々は,各単語について,その音節の音節化,音節アクセントの位置,上述の相補性といった情報を含むオンライン語彙を共同で提供する。
論文 参考訳(メタデータ) (2020-10-26T12:14:14Z) - One Model, Many Languages: Meta-learning for Multilingual Text-to-Speech [3.42658286826597]
本稿では,文脈パラメータ生成のメタラーニング概念を用いた多言語音声合成手法を提案する。
本モデルでは,言語間で効率的に情報を共有できることが示され,主観的評価テストにより,ベースラインよりも自然な,正確なコードスイッチング音声を生成する。
論文 参考訳(メタデータ) (2020-08-03T10:43:30Z) - Mechanisms for Handling Nested Dependencies in Neural-Network Language
Models and Humans [75.15855405318855]
我々は,「深層学習」手法で訓練された現代人工ニューラルネットワークが,人間の文処理の中心的な側面を模倣するかどうかを検討した。
ネットワークは、大きなコーパスで次の単語を予測するためにのみ訓練されたが、分析の結果、局所的および長距離の構文合意をうまく処理する特別なユニットが出現した。
我々は,複数の名詞の単数/複数状態における体系的な変化を伴う文中の数一致の違反を人間が検出する行動実験において,モデルの予測を検証した。
論文 参考訳(メタデータ) (2020-06-19T12:00:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。