論文の概要: Crosslinguistic word order variation reflects evolutionary pressures of
dependency and information locality
- arxiv url: http://arxiv.org/abs/2206.04239v1
- Date: Thu, 9 Jun 2022 02:56:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-10 14:08:08.548112
- Title: Crosslinguistic word order variation reflects evolutionary pressures of
dependency and information locality
- Title(参考訳): 言語間の単語順変化は依存の進化的圧力と情報の局所性を反映する
- Authors: Michael Hahn, Yang Xu
- Abstract要約: 世界の言語の約40%は主目的語順であり、約40%は主目的語順である。
単語順の変動は、依存関係の局所性と情報局所性の競合する圧力のバランスの異なる方法を反映していることを示す。
本研究は,言語間の統語構造と使用法が,限られた認知資源下での効率的なコミュニケーションを支援するのに相応しいことを示唆している。
- 参考スコア(独自算出の注目度): 4.869029215261254
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Languages vary considerably in syntactic structure. About 40% of the world's
languages have subject-verb-object order, and about 40% have
subject-object-verb order. Extensive work has sought to explain this word order
variation across languages. However, the existing approaches are not able to
explain coherently the frequency distribution and evolution of word order in
individual languages. We propose that variation in word order reflects
different ways of balancing competing pressures of dependency locality and
information locality, whereby languages favor placing elements together when
they are syntactically related or contextually informative about each other.
Using data from 80 languages in 17 language families and phylogenetic modeling,
we demonstrate that languages evolve to balance these pressures, such that word
order change is accompanied by change in the frequency distribution of the
syntactic structures which speakers communicate to maintain overall efficiency.
Variability in word order thus reflects different ways in which languages
resolve these evolutionary pressures. We identify relevant characteristics that
result from this joint optimization, particularly the frequency with which
subjects and objects are expressed together for the same verb. Our findings
suggest that syntactic structure and usage across languages co-adapt to support
efficient communication under limited cognitive resources.
- Abstract(参考訳): 言語は構文構造がかなり異なる。
世界の言語の約40%は主目的語順であり、約40%は主目的語順である。
広範囲にわたる研究は、この単語の順序の変化を言語間で説明しようとした。
しかし、既存のアプローチでは、個々の言語における単語順序の頻度分布と進化をコヒーレントに説明できない。
単語順の変動は、係り受けの局所性や情報局所性の相反する圧力のバランスの相違を反映し、言語同士が構文的あるいは文脈的に相互に関連付けられている場合に要素をまとめることを好む。
17言語家族の80言語のデータと系統モデルを用いて、言語はこれらの圧力のバランスを保ちながら進化し、語順の変化は話者が全体的な効率を維持するために通信する構文構造の周波数分布の変化を伴うことを示した。
したがって、単語順の可変性は、言語がこれらの進化的圧力を解決する様々な方法を反映している。
この統合最適化の結果生じる関連する特徴、特に同一動詞に対して主語と対象語が一緒に表現される頻度を識別する。
本研究は,言語間の構文構造と利用が協調して,限定された認知的資源下での効率的なコミュニケーションを支援することを示唆する。
関連論文リスト
- Assessing the Role of Lexical Semantics in Cross-lingual Transfer through Controlled Manipulations [15.194196775504613]
我々は、英語と対象言語の違いが、英語の事前訓練された表現空間と言語を整合させる能力にどのように影響するかを分析する。
文字や単語の順序などの特性はアライメント品質に限られた影響しか与えないが、翻訳エントロピーの尺度を用いて定義する2言語間の語彙マッチングの程度は、それに大きな影響を及ぼすことを示す。
論文 参考訳(メタデータ) (2024-08-14T14:59:20Z) - Linguistic Structure from a Bottleneck on Sequential Information Processing [5.850665541267672]
予測情報によって制約されたコードに自然言語のような体系性が生じることを示す。
人間の言語は、音韻学、形態学、構文学、意味論のレベルにおいて、低い予測情報を持つように構成されている。
論文 参考訳(メタデータ) (2024-05-20T15:25:18Z) - A Cross-Linguistic Pressure for Uniform Information Density in Word
Order [79.54362557462359]
実数列が反実数列よりも大きな情報均一性をもたらすかどうかを計算モデルを用いて検証する。
SVO言語の中では、実語順は逆語順よりも一様である。
言語的に不可解な反実順序のみが、実際の順序の均一性を超えている。
論文 参考訳(メタデータ) (2023-06-06T14:52:15Z) - Reliable Detection and Quantification of Selective Forces in Language
Change [3.55026004901472]
我々は,最近導入された手法をコーパスデータに適用し,歴史的言語変化の特定の事例における選択の強さを定量化する。
本手法は,従来適用されてきた類似手法よりも信頼性が高く,解釈可能であることを示す。
論文 参考訳(メタデータ) (2023-05-25T10:20:15Z) - Cross-Linguistic Syntactic Difference in Multilingual BERT: How Good is
It and How Does It Affect Transfer? [50.48082721476612]
マルチリンガルBERT (mBERT) は, 言語間シンタクティックな機能を示した。
我々は,mBERTから引き起こされる文法的関係の分布を,24言語に類型的に異なる文脈で検討した。
論文 参考訳(メタデータ) (2022-12-21T09:44:08Z) - Transparency Helps Reveal When Language Models Learn Meaning [71.96920839263457]
合成データを用いた体系的な実験により,すべての表現が文脈に依存しない意味を持つ言語では,自己回帰型とマスキング型の両方の言語モデルが,表現間の意味的関係をエミュレートする。
自然言語に目を向けると、特定の現象(参照不透明さ)による実験は、現在の言語モデルが自然言語の意味論をうまく表現していないという証拠を増大させる。
論文 参考訳(メタデータ) (2022-10-14T02:35:19Z) - Subdiffusive semantic evolution in Indo-European languages [0.0]
セマンティック進化は5つの主要なインド・ヨーロッパ諸語に強く分散している。
単語は異常拡散指数を持つ意味空間の軌跡に従うことを示す。
さらに,データ解析と解釈において,強い部分拡散は多種多様な選択の下で頑健な現象であることを示す。
論文 参考訳(メタデータ) (2022-09-10T15:57:32Z) - When is BERT Multilingual? Isolating Crucial Ingredients for
Cross-lingual Transfer [15.578267998149743]
サブワード重複の欠如は,言語が単語順に異なる場合,ゼロショット転送に大きく影響することを示す。
言語間の伝達性能と単語埋め込みアライメントの間には強い相関関係がある。
その結果、言語間の単語埋め込みアライメントを明示的に改善する多言語モデルに焦点が当てられた。
論文 参考訳(メタデータ) (2021-10-27T21:25:39Z) - A Massively Multilingual Analysis of Cross-linguality in Shared
Embedding Space [61.18554842370824]
言語間モデルでは、多くの異なる言語に対する表現は同じ空間に存在している。
我々は,bitext検索性能の形式で,言語間アライメントのタスクベース尺度を計算した。
我々はこれらのアライメント指標の潜在的な予測因子として言語的、準言語的、および訓練関連の特徴について検討する。
論文 参考訳(メタデータ) (2021-09-13T21:05:37Z) - On the Importance of Word Order Information in Cross-lingual Sequence
Labeling [80.65425412067464]
ソース言語の単語順に適合する言語間モデルでは、ターゲット言語を処理できない可能性がある。
本研究では,ソース言語の単語順序に敏感なモデルを作成することで,対象言語の適応性能が向上するかどうかを検討する。
論文 参考訳(メタデータ) (2020-01-30T03:35:44Z) - Where New Words Are Born: Distributional Semantic Analysis of Neologisms
and Their Semantic Neighborhoods [51.34667808471513]
分散意味論のパラダイムで定式化されたセマンティック隣人のセマンティック・スパシティと周波数成長率という2つの要因の重要性について検討する。
いずれの因子も単語の出現を予測できるが,後者の仮説はより支持される。
論文 参考訳(メタデータ) (2020-01-21T19:09:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。