論文の概要: Evolution of the lexicon: a probabilistic point of view
- arxiv url: http://arxiv.org/abs/2510.22220v1
- Date: Sat, 25 Oct 2025 08:48:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 19:54:32.506761
- Title: Evolution of the lexicon: a probabilistic point of view
- Title(参考訳): 語彙の進化-確率論的視点
- Authors: Maurizio Serva,
- Abstract要約: 2つの言語間の時間的分離を決定するスワデシュのアプローチは、単語置換のプロセスに依存している。
スワデシュのアプローチの基本的な仮定は、様々な汚染現象や誤った判断のためにしばしば非現実的である。
純粋に確率論的観点から、この第2のランダムなプロセスを考慮すると、2つの言語間の時間的分離を決定する精度が著しく向上することを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Swadesh approach for determining the temporal separation between two languages relies on the stochastic process of words replacement (when a complete new word emerges to represent a given concept). It is well known that the basic assumptions of the Swadesh approach are often unrealistic due to various contamination phenomena and misjudgments (horizontal transfers, variations over time and space of the replacement rate, incorrect assessments of cognacy relationships, presence of synonyms, and so on). All of this means that the results cannot be completely correct. More importantly, even in the unrealistic case that all basic assumptions are satisfied, simple mathematics places limits on the accuracy of estimating the temporal separation between two languages. These limits, which are purely probabilistic in nature and which are often neglected in lexicostatistical studies, are analyzed in detail in this article. Furthermore, in this work we highlight that the evolution of a language's lexicon is also driven by another stochastic process: gradual lexical modification of words. We show that this process equally also represents a major contribution to the reshaping of the vocabulary of languages over the centuries and we also show, from a purely probabilistic perspective, that taking into account this second random process significantly increases the precision in determining the temporal separation between two languages.
- Abstract(参考訳): 2つの言語間の時間的分離を決定するスワデシュのアプローチは、単語置換の確率的プロセスに依存している(与えられた概念を表すために完全な新しい単語が現れる)。
スワデシュのアプローチの基本的な仮定は、様々な汚染現象や誤った判断(水平移動、置換率の時間と空間の変化、コニャーシー関係の不正確な評価、同義語の存在など)により、しばしば非現実的であることが知られている。
全ては結果が完全に正しいとは限らないことを意味している。
さらに重要なのは、すべての基本的な仮定が満たされる非現実的な場合においても、単純数学は2つの言語間の時間的分離を推定する精度に制限を与える。
これらの限界は、自然界において純粋に確率的であり、しばしばレキシコ統計学研究で無視されるものであるが、本項では詳細に分析する。
さらに、この研究において、言語の語彙の進化は別の確率過程、すなわち単語の段階的な語彙修正によっても引き起こされることを強調した。
このプロセスは、何世紀にもわたって言語語彙の再構築に大きな貢献をしており、純粋に確率論的観点から、この第2のランダムなプロセスを考慮すると、2つの言語間の時間的分離を決定する精度が著しく向上することを示す。
関連論文リスト
- A quantum semantic framework for natural language processing [0.0]
セマンティック・デジェネリズムは、自然言語自体で機能するため、現代のNLPシステムに根本的な制限を課していると論じる。
表現の複雑さが増大するにつれて、そのあいまいさを確実に解決するために必要な文脈情報の量が爆発的に増加することを示す。
我々は、非決定論的性質が非古典的、量子的な論理によって最も適切に記述されるプロセスである、オブザーバ依存の解釈行為によって、意味が動的に実現されると主張する。
論文 参考訳(メタデータ) (2025-06-11T18:00:30Z) - Robustness of the Random Language Model [0.0]
このモデルは、潜在的言語の広大な空間におけるアニーリングの一種として、最初の言語学習の簡単な図を示唆している。
これは、潜在的な単語とカテゴリ間の対称性が自発的に壊れる文法構文への単一の連続的な遷移を意味する。
結果は、言語学における第一言語習得の理論と、機械学習における最近の成功を踏まえて議論される。
論文 参考訳(メタデータ) (2023-09-26T13:14:35Z) - Probabilistic Method of Measuring Linguistic Productivity [0.0]
本稿では, 言語的生産性を客観的に評価する手法を提案する。
トークン周波数は生産性指標を支配せず、基地のサンプリングに自然に影響を及ぼす。
コーパスに基づくアプローチとランダム化設計により、昔に作られた真のネオロジズムと単語が平等に選択される可能性が保証される。
論文 参考訳(メタデータ) (2023-08-24T08:36:28Z) - Reliable Detection and Quantification of Selective Forces in Language
Change [3.55026004901472]
我々は,最近導入された手法をコーパスデータに適用し,歴史的言語変化の特定の事例における選択の強さを定量化する。
本手法は,従来適用されてきた類似手法よりも信頼性が高く,解釈可能であることを示す。
論文 参考訳(メタデータ) (2023-05-25T10:20:15Z) - Contextualized language models for semantic change detection: lessons
learned [4.436724861363513]
本稿では,ダイアクロニック・セマンティック・チェンジを検出する文脈的埋め込みに基づく手法の出力の質的分析を行う。
本研究の結果から,文脈化手法は,実際のダイアクロニック・セマンティック・シフトを行なわない単語に対して,高い変化スコアを予測できることが示唆された。
我々の結論は、事前学習された文脈化言語モデルは、語彙感覚の変化と文脈分散の変化を補う傾向にあるということである。
論文 参考訳(メタデータ) (2022-08-31T23:35:24Z) - A Latent-Variable Model for Intrinsic Probing [93.62808331764072]
固有プローブ構築のための新しい潜在変数定式化を提案する。
我々は、事前訓練された表現が言語間交互に絡み合ったモルフォシンタクスの概念を発達させる経験的証拠を見出した。
論文 参考訳(メタデータ) (2022-01-20T15:01:12Z) - Speakers Fill Lexical Semantic Gaps with Context [65.08205006886591]
我々は単語の語彙的あいまいさを意味のエントロピーとして運用する。
単語のあいまいさの推定値と,WordNetにおける単語の同義語数との間には,有意な相関関係が認められた。
これは、あいまいさの存在下では、話者が文脈をより情報的にすることで補うことを示唆している。
論文 参考訳(メタデータ) (2020-10-05T17:19:10Z) - Where New Words Are Born: Distributional Semantic Analysis of Neologisms
and Their Semantic Neighborhoods [51.34667808471513]
分散意味論のパラダイムで定式化されたセマンティック隣人のセマンティック・スパシティと周波数成長率という2つの要因の重要性について検討する。
いずれの因子も単語の出現を予測できるが,後者の仮説はより支持される。
論文 参考訳(メタデータ) (2020-01-21T19:09:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。