論文の概要: Principal Component Analysis as a Sanity Check for Bayesian
Phylolinguistic Reconstruction
- arxiv url: http://arxiv.org/abs/2402.18877v1
- Date: Thu, 29 Feb 2024 05:47:34 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-01 15:51:39.160249
- Title: Principal Component Analysis as a Sanity Check for Bayesian
Phylolinguistic Reconstruction
- Title(参考訳): ベイジアン・フィロリスティック・リコンストラクションの正当性チェックとしての主成分分析
- Authors: Yugo Murawaki
- Abstract要約: ツリーモデルは、言語は共通の祖先の子孫であり、時間とともに修正されたと仮定する。
この仮定は接触やその他の要因によって異なる範囲で破ることができる。
本稿では,主成分分析によって生成された空間に再構成木を投影する,簡易な正当性チェックを提案する。
- 参考スコア(独自算出の注目度): 3.652806821280741
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Bayesian approaches to reconstructing the evolutionary history of languages
rely on the tree model, which assumes that these languages descended from a
common ancestor and underwent modifications over time. However, this assumption
can be violated to different extents due to contact and other factors.
Understanding the degree to which this assumption is violated is crucial for
validating the accuracy of phylolinguistic inference. In this paper, we propose
a simple sanity check: projecting a reconstructed tree onto a space generated
by principal component analysis. By using both synthetic and real data, we
demonstrate that our method effectively visualizes anomalies, particularly in
the form of jogging.
- Abstract(参考訳): 言語の進化史を再構築するベイズ的アプローチは、これらの言語が共通の祖先から派生し、時間をかけて修正されたと仮定するツリーモデルに依存している。
しかし、この仮定は接触やその他の要因によって異なる範囲で破ることができる。
この仮定に違反する程度を理解することは、系統言語的推論の正確性を検証するために重要である。
本稿では, 主成分分析により生成された空間に再構成木を投影する, 簡易な正当性チェックを提案する。
本手法は,合成データと実データの両方を用いて,特にジョギング形式の異常を効果的に可視化する。
関連論文リスト
- PhyloVAE: Unsupervised Learning of Phylogenetic Trees via Variational Autoencoders [5.505257238864315]
PhyloVAEは、木トポロジーの表現学習と生成モデリングのために設計された教師なし学習フレームワークである。
我々は,高速で並列化されたトポロジ生成を容易にする潜伏変数生成モデルを開発した。
実験では、PhyloVAEの堅牢な表現学習能力と系統樹のトポロジーの高速生成が示されている。
論文 参考訳(メタデータ) (2025-02-07T07:58:47Z) - PhyloGen: Language Model-Enhanced Phylogenetic Inference via Graph Structure Generation [50.80441546742053]
系統樹は種間の進化的関係を解明する。
伝統的なマルコフ連鎖モンテカルロ法は、緩やかな収束と計算上の負担に直面している。
我々は、事前学習されたゲノム言語モデルを活用する新しい方法であるPhyloGenを提案する。
論文 参考訳(メタデータ) (2024-12-25T08:33:05Z) - Gumbel Counterfactual Generation From Language Models [64.55296662926919]
対実的推論が介入と概念的に異なることを示す。
そこで本研究では,真の文字列反事実を生成するためのフレームワークを提案する。
提案手法は,従来の介入手法が望ましくない副作用を有意に生み出しているのに対し,本手法は有意義な反事実を生じさせることを示す。
論文 参考訳(メタデータ) (2024-11-11T17:57:30Z) - Improved Neural Protoform Reconstruction via Reflex Prediction [11.105362395278142]
我々は、プロトフォームはコグネート集合(関連する反射の集合)から推論可能であるだけでなく、プロトフォームからも推論可能であるべきだと主張する。
本稿では,リフレクション予測モデルを用いて,再構成モデルから候補となるプロトフォームをリランクするシステムを提案する。
論文 参考訳(メタデータ) (2024-03-27T17:13:38Z) - Are Sounds Sound for Phylogenetic Reconstruction? [41.85920785319125]
本研究は, 音質とコグネートを用いた系統再建法の性能を初めて検証した。
以上の結果から,レキシカルコニャートから復元した系統は,平均四重項距離に対して約3分の1ほど位相的に近接していることが明らかとなった。
論文 参考訳(メタデータ) (2024-02-05T08:35:33Z) - A Latent-Variable Model for Intrinsic Probing [93.62808331764072]
固有プローブ構築のための新しい潜在変数定式化を提案する。
我々は、事前訓練された表現が言語間交互に絡み合ったモルフォシンタクスの概念を発達させる経験的証拠を見出した。
論文 参考訳(メタデータ) (2022-01-20T15:01:12Z) - Constructing a Family Tree of Ten Indo-European Languages with
Delexicalized Cross-linguistic Transfer Patterns [57.86480614673034]
我々は,デレクシカル化転送を,解釈可能なツリー・ツー・ストリングパターンとツリー・ツー・ツリーパターンとして定式化する。
これにより、言語間移動を定量的に探索し、第二言語習得の問い合わせを拡張することができる。
論文 参考訳(メタデータ) (2020-07-17T15:56:54Z) - Exploiting Syntactic Structure for Better Language Modeling: A Syntactic
Distance Approach [78.77265671634454]
我々はマルチタスクの目的、すなわち、モデルが単語を同時に予測し、また「シンタクティック距離」と呼ばれる形態で真実解析木を解析する。
Penn Treebank と Chinese Treebank のデータセットによる実験結果から,地上の真理解析木を追加の訓練信号として提供すると,そのモデルはより低いパープレキシティを実現し,より良い品質で木を誘導できることが示された。
論文 参考訳(メタデータ) (2020-05-12T15:35:00Z) - Spectral neighbor joining for reconstruction of latent tree models [5.229354894035374]
我々は,潜在木図形モデルの構造を復元する新しい手法であるSpectral Neighbor Joiningを開発した。
我々はSNJが一貫したものであることを証明し、推定された類似性行列から木回復を正すのに十分な条件を導出する。
SNJは,他の再建法と比較して,多数の葉や長い縁を持つ樹木を正確に復元するために,サンプルを少なくする。
論文 参考訳(メタデータ) (2020-02-28T05:13:08Z) - A Critical View of the Structural Causal Model [89.43277111586258]
相互作用を全く考慮せずに原因と効果を識別できることが示される。
本稿では,因果モデルの絡み合った構造を模倣する新たな逆行訓練法を提案する。
我々の多次元手法は, 合成および実世界の両方のデータセットにおいて, 文献的手法よりも優れている。
論文 参考訳(メタデータ) (2020-02-23T22:52:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。