Fugu-MT 論文翻訳(概要): Markov Chain Monte-Carlo Phylogenetic Inference Construction in Computational Historical Linguistics

論文の概要: Markov Chain Monte-Carlo Phylogenetic Inference Construction in Computational Historical Linguistics

arxiv url: http://arxiv.org/abs/2002.09637v2
Date: Sat, 14 Mar 2020 02:03:54 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-29 19:29:14.275548
Title: Markov Chain Monte-Carlo Phylogenetic Inference Construction in Computational Historical Linguistics
Title（参考訳）: 算術史言語学におけるマルコフ連鎖モンテカルロ系統推論の構成
Authors: Tianyi Ni
Abstract要約: 現代では、歴史言語学研究の伝統的な方法がいくつかの課題に直面しているため、世界中でますます多くの言語が研究されている。本稿では,計算手法を用いて言語をクラスタリングし,マルコフ・チェイン・モンテカルロ(MCMC)法を用いて言語型関係木を構築する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: More and more languages in the world are under study nowadays, as a result, the traditional way of historical linguistics study is facing some challenges. For example, the linguistic comparative research among languages needs manual annotation, which becomes more and more impossible with the increasing amount of language data coming out all around the world. Although it could hardly replace linguists work, the automatic computational methods have been taken into consideration and it can help people reduce their workload. One of the most important work in historical linguistics is word comparison from different languages and find the cognate words for them, which means people try to figure out if the two languages are related to each other or not. In this paper, I am going to use computational method to cluster the languages and use Markov Chain Monte Carlo (MCMC) method to build the language typology relationship tree based on the clusters.
Abstract（参考訳）: 現在、世界の多くの言語が研究されており、その結果、歴史的言語学研究の伝統的な方法がいくつかの課題に直面している。例えば、言語間の言語比較研究は手動のアノテーションを必要としており、世界中の言語データが増加するにつれて、ますます不可能になる。言語学者の仕事を置き換えることはほとんどできなかったが、自動計算手法が考慮され、作業負荷を減らすのに役立つ。歴史的言語学における最も重要な研究の1つは、異なる言語から単語の比較を行い、それらに相同な単語を見つけることである。本稿では,計算手法を用いて言語をクラスタ化し,markov chain monte carlo (mcmc) 法を用いて,クラスタに基づく言語タイポロジー関係木を構築する。

関連論文リスト

From Isolates to Families: Using Neural Networks for Automated Language Affiliation [9.182884165239996]
歴史的言語学では、言語を共通の言語族に関連付けることは、伝統的に複雑なワークフローを用いて行われる。多言語ワードリストと文法言語構造の大規模に標準化されたコレクションは、これを改善し、自動言語アフィリエイトを開発するための新たな道を開くのに役立つだろう。本研究では,1000言語以上の言語から得られた語彙データと文法データを用いて,個々の言語を家族に分類するニューラルネットワークモデルを提案する。
論文参考訳（メタデータ） (2025-02-17T11:25:32Z)
Training Neural Networks as Recognizers of Formal Languages [87.06906286950438]
形式言語理論は、特に認識者に関するものである。代わりに、非公式な意味でのみ類似したプロキシタスクを使用するのが一般的である。ニューラルネットワークを文字列のバイナリ分類器として直接訓練し評価することで、このミスマッチを補正する。
論文参考訳（メタデータ） (2024-11-11T16:33:25Z)
The Role of Language Imbalance in Cross-lingual Generalisation: Insights from Cloned Language Experiments [57.273662221547056]
本研究では,言語間一般化の非直感的な新規ドライバである言語不均衡について検討する。学習中に支配的な言語が存在することが、あまり頻度の低い言語の性能を高めることを観察する。分析を実言語に拡張するにつれ、頻繁な言語は依然として恩恵を受けていますが、言語不均衡が言語間の一般化を引き起こすかどうかは決定的ではありません。
論文参考訳（メタデータ） (2024-04-11T17:58:05Z)
Weakly-supervised Deep Cognate Detection Framework for Low-Resourced Languages Using Morphological Knowledge of Closely-Related Languages [1.7622337807395716]
アンダーリソース言語でのトランスファーラーニングのためのコニャートを爆発させることは、言語理解タスクのエキサイティングな機会である。従来のアプローチは主に、正書法、音声学、あるいは最先端の文脈言語モデルに基づくコグネート検出タスクの監督に重点を置いていた。本稿では、アンダーリソース言語に対する言語に依存しない弱教師付き深層コグネート検出フレームワークを提案する。
論文参考訳（メタデータ） (2023-11-09T05:46:41Z)
Learning to pronounce as measuring cross lingual joint orthography-phonology complexity [0.0]
本稿では,グラファイム対音素(g2p)の音素翻訳のタスクをモデル化することにより,言語が「発音しにくい」理由について検討する。発音の学習に関して、より簡単で難しい言語を区別する特定の特徴が浮かび上がっていることを示す。
論文参考訳（メタデータ） (2022-01-29T14:44:39Z)
Discovering Representation Sprachbund For Multilingual Pre-Training [139.05668687865688]
多言語事前学習モデルから言語表現を生成し、言語分析を行う。すべての対象言語を複数のグループにクラスタリングし、表現のスプラックバンドとして各グループに名前を付ける。言語間ベンチマークで実験を行い、強いベースラインと比較して大幅な改善が達成された。
論文参考訳（メタデータ） (2021-09-01T09:32:06Z)
Linguistic Classification using Instance-Based Learning [0.0]
コントラリア的アプローチを採用し、かなり制約のあるツリーベースモデルに疑問を呈する。例えば、サンスクリットがインド・ヨーロッパ語にまたがる言語と独立して親和性は、ネットワークモデルを用いてよりよく説明できる。インドにおける言語間の相互関係についても同じことが言えます。
論文参考訳（メタデータ） (2020-12-02T04:12:10Z)
GATE: Graph Attention Transformer Encoder for Cross-lingual Relation and Event Extraction [107.8262586956778]
言語に依存しない文表現を学習するために、普遍的な依存解析を伴うグラフ畳み込みネットワーク(GCN)を導入する。 GCNは、長い範囲の依存関係を持つ単語をモデル化するのに苦労する。そこで本研究では,構文的距離の異なる単語間の依存関係を学習するための自己認識機構を提案する。
論文参考訳（メタデータ） (2020-10-06T20:30:35Z)
XCOPA: A Multilingual Dataset for Causal Commonsense Reasoning [68.57658225995966]
XCOPA (Cross-lingual Choice of Plausible Alternatives) は11言語における因果コモンセンス推論のための多言語データセットである。提案手法は,翻訳に基づく転送と比較して,現在の手法の性能が低下していることを明らかにする。
論文参考訳（メタデータ） (2020-05-01T12:22:33Z)
Linguistic Typology Features from Text: Inferring the Sparse Features of World Atlas of Language Structures [73.06435180872293]
我々は、バイト埋め込みと畳み込み層に基づく繰り返しニューラルネットワーク予測器を構築する。様々な言語型の特徴を確実に予測できることを示す。
論文参考訳（メタデータ） (2020-04-30T21:00:53Z)
Bridging Linguistic Typology and Multilingual Machine Translation with Multi-View Language Representations [83.27475281544868]
特異ベクトル標準相関解析を用いて、各情報源からどのような情報が誘導されるかを調べる。我々の表現は類型学を組み込み、言語関係と相関関係を強化する。次に、多言語機械翻訳のための多視点言語ベクトル空間を利用して、競合する全体的な翻訳精度を実現する。
論文参考訳（メタデータ） (2020-04-30T16:25:39Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。