論文の概要: Subdiffusive semantic evolution in Indo-European languages
- arxiv url: http://arxiv.org/abs/2209.04701v1
- Date: Sat, 10 Sep 2022 15:57:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-13 13:32:35.234420
- Title: Subdiffusive semantic evolution in Indo-European languages
- Title(参考訳): インド・ヨーロッパ諸語における部分拡散的意味進化
- Authors: Bogd\'an Asztalos, Gergely Palla, D\'aniel Cz\'egel
- Abstract要約: セマンティック進化は5つの主要なインド・ヨーロッパ諸語に強く分散している。
単語は異常拡散指数を持つ意味空間の軌跡に従うことを示す。
さらに,データ解析と解釈において,強い部分拡散は多種多様な選択の下で頑健な現象であることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: How do words change their meaning? Although semantic evolution is driven by a
variety of distinct factors, including linguistic, societal, and technological
ones, we find that there is one law that holds universally across five major
Indo-European languages: that semantic evolution is strongly subdiffusive.
Using an automated pipeline of diachronic distributional semantic embedding
that controls for underlying symmetries, we show that words follow stochastic
trajectories in meaning space with an anomalous diffusion exponent $\alpha=
0.45\pm 0.05$ across languages, in contrast with diffusing particles that
follow $\alpha=1$. Randomization methods indicate that preserving temporal
correlations in semantic change directions is necessary to recover strongly
subdiffusive behavior; however, correlations in change sizes play an important
role too. We furthermore show that strong subdiffusion is a robust phenomenon
under a wide variety of choices in data analysis and interpretation, such as
the choice of fitting an ensemble average of displacements or averaging
best-fit exponents of individual word trajectories.
- Abstract(参考訳): 言葉はどのように意味を変えるのか?
意味進化は、言語的、社会的、技術的要因を含む様々な異なる要因によって駆動されるが、インド・ヨーロッパの主要な5つの言語に普遍的に保持する法則が1つあることが分かる。
基礎となる対称性を制御したダイアクロニックな分布セマンティック埋め込みの自動パイプラインを用いて、不規則な拡散指数 $\alpha = 0.45\pm 0.05$ の空間において、単語が確率的軌跡に従うことを示す。
ランダム化法は, 意味変化方向における時間的相関の保存が, 強い拡散行動の回復に必要であることを示しているが, 変化サイズの相関も重要な役割を果たす。
さらに,データ分析や解釈において,個々の単語トラジェクトリの最適指数を平均化したり,アンサンブル平均の変位を調整したりすることで,強拡散は頑健な現象であることを示す。
関連論文リスト
- Semantic Cells: Evolutional Process to Acquire Sense Diversity of Items [0.0]
著者は、単語や項目が他との相互作用を通じて進化する複数の意味ベクトルを受け入れる方法を提示している。
2つの予備的な結果を得た: 意味ベクトルの最大または下位の分散を得るために進化する単語の役割は説明可能である傾向にある。
クロスオーバーにより大きなばらつきを生じる地震の震源は、地地殻の多様な領域との相互作用に対応し、今後の大地震の震源に対応すると考えられる。
論文 参考訳(メタデータ) (2024-04-23T05:11:08Z) - Unsupervised Semantic Variation Prediction using the Distribution of
Sibling Embeddings [17.803726860514193]
単語の意味的変化の検出は,様々なNLPアプリケーションにおいて重要な課題である。
意味表現だけではそのような意味的バリエーションを正確に捉えることはできないと我々は主張する。
対象単語の文脈的埋め込みのコホート全体を利用する手法を提案する。
論文 参考訳(メタデータ) (2023-05-15T13:58:21Z) - Cross-Linguistic Syntactic Difference in Multilingual BERT: How Good is
It and How Does It Affect Transfer? [50.48082721476612]
マルチリンガルBERT (mBERT) は, 言語間シンタクティックな機能を示した。
我々は,mBERTから引き起こされる文法的関係の分布を,24言語に類型的に異なる文脈で検討した。
論文 参考訳(メタデータ) (2022-12-21T09:44:08Z) - Crosslinguistic word order variation reflects evolutionary pressures of
dependency and information locality [4.869029215261254]
世界の言語の約40%は主目的語順であり、約40%は主目的語順である。
単語順の変動は、依存関係の局所性と情報局所性の競合する圧力のバランスの異なる方法を反映していることを示す。
本研究は,言語間の統語構造と使用法が,限られた認知資源下での効率的なコミュニケーションを支援するのに相応しいことを示唆している。
論文 参考訳(メタデータ) (2022-06-09T02:56:53Z) - Contextualized Semantic Distance between Highly Overlapped Texts [85.1541170468617]
テキスト編集や意味的類似性評価といった自然言語処理タスクにおいて、ペア化されたテキストに重複が頻繁に発生する。
本稿では,マスク・アンド・予測戦略を用いてこの問題に対処することを目的とする。
本稿では,最も長い単語列の単語を隣接する単語とみなし,その位置の分布を予測するためにマスク付き言語モデリング(MLM)を用いる。
セマンティックテキスト類似性の実験では、NDDは様々な意味的差異、特に高い重なり合うペアテキストに対してより敏感であることが示されている。
論文 参考訳(メタデータ) (2021-10-04T03:59:15Z) - Grammatical Profiling for Semantic Change Detection [6.3596637237946725]
文法的プロファイリングを意味変化検出の代替手法として用いている。
意味的変化の検出に使用することができ、また、いくつかの分布的意味的手法よりも優れていることを実証する。
論文 参考訳(メタデータ) (2021-09-21T18:38:18Z) - Fake it Till You Make it: Self-Supervised Semantic Shifts for
Monolingual Word Embedding Tasks [58.87961226278285]
語彙意味変化をモデル化するための自己教師付きアプローチを提案する。
本手法は,任意のアライメント法を用いて意味変化の検出に利用できることを示す。
3つの異なるデータセットに対する実験結果を用いて,本手法の有用性について述べる。
論文 参考訳(メタデータ) (2021-01-30T18:59:43Z) - Investigating Cross-Linguistic Adjective Ordering Tendencies with a
Latent-Variable Model [66.84264870118723]
本稿では,多言語形容詞順序付けを潜在変数モデルとして,初めて純粋コーパス駆動モデルを提案する。
我々は普遍的、言語横断的、階層的形容詞順序付け傾向の存在の強い確固たる証拠を提供する。
論文 参考訳(メタデータ) (2020-10-09T18:27:55Z) - Gender Bias in Multilingual Embeddings and Cross-Lingual Transfer [101.58431011820755]
多言語埋め込みにおけるジェンダーバイアスとNLPアプリケーションの伝達学習への影響について検討する。
我々は、バイアス分析のための多言語データセットを作成し、多言語表現におけるバイアスの定量化方法をいくつか提案する。
論文 参考訳(メタデータ) (2020-05-02T04:34:37Z) - Where New Words Are Born: Distributional Semantic Analysis of Neologisms
and Their Semantic Neighborhoods [51.34667808471513]
分散意味論のパラダイムで定式化されたセマンティック隣人のセマンティック・スパシティと周波数成長率という2つの要因の重要性について検討する。
いずれの因子も単語の出現を予測できるが,後者の仮説はより支持される。
論文 参考訳(メタデータ) (2020-01-21T19:09:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。