論文の概要: Phylogenetic typology
- arxiv url: http://arxiv.org/abs/2103.10198v2
- Date: Fri, 19 Mar 2021 09:41:32 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-22 12:06:10.467068
- Title: Phylogenetic typology
- Title(参考訳): 系統分類学
- Authors: Gerhard J\"ager and Johannes Wahle
- Abstract要約: 本稿では,言語変数の周波数分布を推定する新しい手法を提案する。
従来の手法とは異なり、我々の手法は利用可能なすべてのデータを使用する。
ケーススタディとして、世界中の言語にまたがる潜在的な単語順序相関について検討する。
- 参考スコア(独自算出の注目度): 0.913755431537592
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this article we propose a novel method to estimate the frequency
distribution of linguistic variables while controlling for statistical
non-independence due to shared ancestry. Unlike previous approaches, our
technique uses all available data, from language families large and small as
well as from isolates, while controlling for different degrees of relatedness
on a continuous scale estimated from the data. Our approach involves three
steps: First, distributions of phylogenies are inferred from lexical data.
Second, these phylogenies are used as part of a statistical model to
statistically estimate transition rates between parameter states. Finally, the
long-term equilibrium of the resulting Markov process is computed. As a case
study, we investigate a series of potential word-order correlations across the
languages of the world.
- Abstract(参考訳): 本稿では,共通祖先による統計的非独立性を制御しながら,言語変数の頻度分布を推定する新しい手法を提案する。
従来の手法と異なり,本手法では,大規模かつ小規模の言語群から分離した言語群まで,データから推定される連続的なスケールで異なる関連度を制御しながら,すべての利用可能なデータを使用する。
まず、系統の分布は語彙データから推測される。
第二に、これらの系統はパラメータ状態間の遷移率を統計的に推定する統計モデルの一部として用いられる。
最後に、結果のマルコフ過程の長期平衡が計算される。
ケーススタディとして、世界中の言語にまたがる潜在的な単語順序相関について検討する。
関連論文リスト
- Bayesian Federated Inference for regression models with heterogeneous
multi-center populations [0.0]
回帰モデルでは、サンプルサイズは予測器の数に対して十分な大きさでなければならない。
異なる(医療)センターで収集された異なるデータセットからデータをポーリングすることはこの問題を軽減するが、プライバシー規制やロジスティックな問題のためにしばしば実現不可能である。
別の方法は、センター内のローカルデータを別々に分析し、統計的推測結果とベイズ連邦推論(BFI)手法を組み合わせることである。
このアプローチの目的は、組み合わせたデータに対して統計的解析を行った場合、何を発見したのかを、別々の中心における推論結果から計算することである。
論文 参考訳(メタデータ) (2024-02-05T11:10:27Z) - Conformal inference for regression on Riemannian Manifolds [49.7719149179179]
回帰シナリオの予測セットは、応答変数が$Y$で、多様体に存在し、Xで表される共変数がユークリッド空間にあるときに検討する。
我々は、多様体上のこれらの領域の経験的バージョンが、その集団に対するほぼ確実に収束していることを証明する。
論文 参考訳(メタデータ) (2023-10-12T10:56:25Z) - Self-contained Beta-with-Spikes Approximation for Inference Under a
Wright-Fisher Model [0.0]
right-Fisherモデル内での進化的パラメータの信頼性の高い推定を行う。
本手法は,アレル周波数分布に対するβ-with-Spikes近似に基づく解析手法である。
論文 参考訳(メタデータ) (2023-03-08T16:32:10Z) - Statistical Efficiency of Score Matching: The View from Isoperimetry [96.65637602827942]
本研究では, スコアマッチングの統計的効率と推定される分布の等尺性との間に, 密接な関係を示す。
これらの結果はサンプル状態と有限状態の両方で定式化する。
論文 参考訳(メタデータ) (2022-10-03T06:09:01Z) - Fisher information of correlated stochastic processes [0.0]
メモリフルプロセスで符号化されたパラメータの推定に関する2つの結果を示す。
まず、有限マルコフ順序の過程に対して、フィッシャー情報は結果の個数において常に線型であることを示す。
第二に、相関が必ずしもメートル法精度を高めるとは限らないことを適切な例で証明する。
論文 参考訳(メタデータ) (2022-06-01T12:51:55Z) - A Unifying Framework for Some Directed Distances in Statistics [0.0]
密度に基づく有向距離(特に発散距離)は統計学で広く使われている。
本稿では、密度ベースと分布関数ベースの分散アプローチの両方を網羅する一般的なフレームワークを提供する。
我々は、有望な相互情報の代替として、確率変数間の依存の新たな概念を導出する。
論文 参考訳(メタデータ) (2022-03-02T04:24:13Z) - A comprehensive comparative evaluation and analysis of Distributional
Semantic Models [61.41800660636555]
我々は、静的DSMによって生成されたり、BERTによって生成された文脈化されたベクトルを平均化して得られるような、型分布ベクトルの包括的評価を行う。
その結果、予測ベースモデルの優越性は現実よりも明らかであり、ユビキタスではないことが明らかとなった。
我々は認知神経科学からRepresentational similarity Analysis(RSA)の方法論を借りて、分布モデルによって生成された意味空間を検査する。
論文 参考訳(メタデータ) (2021-05-20T15:18:06Z) - Modeling Voting for System Combination in Machine Translation [92.09572642019145]
本稿では,機械翻訳におけるシステムの組み合わせに対する投票のモデル化手法を提案する。
提案手法は,仮説間の関係を解析できるだけでなく,エンドツーエンドのトレーニングを可能にするため,統計的手法とニューラル手法の利点を組み合わせたものである。
論文 参考訳(メタデータ) (2020-07-14T09:59:38Z) - On Disentangled Representations Learned From Correlated Data [59.41587388303554]
相関データに対する最も顕著な絡み合うアプローチの挙動を解析することにより、現実のシナリオにギャップを埋める。
本研究では,データセットの体系的相関が学習され,潜在表現に反映されていることを示す。
また、トレーニング中の弱い監督や、少数のラベルで事前訓練されたモデルを修正することで、これらの潜伏相関を解消する方法を実証する。
論文 参考訳(メタデータ) (2020-06-14T12:47:34Z) - Stable Prediction via Leveraging Seed Variable [73.9770220107874]
従来の機械学習手法は、非因果変数によって誘導されるトレーニングデータにおいて、微妙に刺激的な相関を利用して予測する。
本研究では, 条件付き独立性テストに基づくアルゴリズムを提案し, 種子変数を先行変数とする因果変数を分離し, 安定な予測に採用する。
我々のアルゴリズムは、安定した予測のための最先端の手法より優れている。
論文 参考訳(メタデータ) (2020-06-09T06:56:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。