論文の概要: Correlation Does Not Imply Compensation: Complexity and Irregularity in the Lexicon
- arxiv url: http://arxiv.org/abs/2406.05186v1
- Date: Fri, 7 Jun 2024 18:09:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-11 22:55:40.704041
- Title: Correlation Does Not Imply Compensation: Complexity and Irregularity in the Lexicon
- Title(参考訳): 相関は補償を含まない:語彙の複雑さと不規則性
- Authors: Amanda Doucette, Ryan Cotterell, Morgan Sonderegger, Timothy J. O'Donnell,
- Abstract要約: 形態的不規則性と音韻的複雑性との間に正の相関が認められた。
また,単語長と形態的不規則性の負の関係の弱い証拠も見出した。
- 参考スコア(独自算出の注目度): 48.00488140516432
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: It has been claimed that within a language, morphologically irregular words are more likely to be phonotactically simple and morphologically regular words are more likely to be phonotactically complex. This inverse correlation has been demonstrated in English for a small sample of words, but has yet to be shown for a larger sample of languages. Furthermore, frequency and word length are known to influence both phonotactic complexity and morphological irregularity, and they may be confounding factors in this relationship. Therefore, we examine the relationships between all pairs of these four variables both to assess the robustness of previous findings using improved methodology and as a step towards understanding the underlying causal relationship. Using information-theoretic measures of phonotactic complexity and morphological irregularity (Pimentel et al., 2020; Wu et al., 2019) on 25 languages from UniMorph, we find that there is evidence of a positive relationship between morphological irregularity and phonotactic complexity within languages on average, although the direction varies within individual languages. We also find weak evidence of a negative relationship between word length and morphological irregularity that had not been previously identified, and that some existing findings about the relationships between these four variables are not as robust as previously thought.
- Abstract(参考訳): 言語の中では、形態的に不規則な単語は音韻論的に単純であり、形態学的に正規な単語は音韻論的に複雑である可能性が高いと主張されている。
この逆相関は、少数の単語のサンプルでは英語で実証されているが、より大きな言語のサンプルでは示されていない。
さらに、周波数と単語の長さは、音韻的複雑性と形態的不規則の両方に影響を与えることが知られており、これらは、この関係に矛盾する要因である可能性がある。
そこで本研究では,これらの4変数のすべてのペア間の関係を,改善手法を用いて過去の知見の堅牢性を評価するとともに,根底にある因果関係を理解するためのステップとして検討する。
UniMorphの25言語における音韻的複雑性と形態的不規則性(Pimentel et al , 2020; Wu et al , 2019)に関する情報理論的尺度を用いて、各言語で方向が異なるが、平均的な言語における形態的不規則性と音韻的不規則性の間には正の相関があることを示す。
また,従来確認されていなかった単語長と形態的不規則性の負の関係の弱い証拠や,これらの4変数間の関係に関する既往の発見が,従来考えられていたほど堅牢ではないことも見いだした。
関連論文リスト
- Mapping 'when'-clauses in Latin American and Caribbean languages: an experiment in subtoken-based typology [0.0]
本稿は,ラテンアメリカとカリブ海の言語間における時間的順序付け("when'-clauses")の表現の変動について考察する。
この地域の言語に基づいて計算された確率論的意味写像を提示し、レックス化されたコネクタのみを使用する多くの世界の言語に対する偏見を避ける。
このアプローチにより、レックス化されたコネクタに加えて、形態的節間リンク装置をキャプチャでき、時間的部分座標のタイプ論的変動の大規模かつ戦略に依存しない分析を行うことができる。
論文 参考訳(メタデータ) (2024-04-28T17:43:24Z) - Phonotactic Complexity across Dialects [9.169501109658675]
言語型学における知恵の受け取りは、ある言語の構造がある次元においてより複雑になると、別の次元では単純化されるというものである。
オランダ語方言(366点以上)とミン方言(60点以上)の厳密に制御されたサンプルを用いて,この主張をマイクロレベルで研究する。
LSTMに基づく音声レベル言語モデルから,単語長と音韻的複雑性の計算量とのトレードオフの実証的証拠を求める。
論文 参考訳(メタデータ) (2024-02-20T13:25:39Z) - Syntactic Language Change in English and German: Metrics, Parsers, and Convergences [56.47832275431858]
本論文は,過去160年間の議会討論のコーパスを用いて,英語とドイツ語の統語的言語変化のダイアクロニックな傾向を考察する。
私たちは、広く使われているStanford Coreと、新しい4つの選択肢を含む5つの依存関係をベースとしています。
文長分布の尾部では,構文的尺度の変化が頻繁であることが明らかとなった。
論文 参考訳(メタデータ) (2024-02-18T11:46:16Z) - Universality and diversity in word patterns [0.0]
本稿では,11言語を対象とした語彙統計関係の分析を行う。
言語が単語関係を表現するために利用する多種多様な方法が、ユニークなパターン分布を生み出していることがわかった。
論文 参考訳(メタデータ) (2022-08-23T20:03:27Z) - Quantifying Synthesis and Fusion and their Impact on Machine Translation [79.61874492642691]
自然言語処理(NLP)では、一般に、融合や凝集のような厳密な形態を持つ言語全体をラベル付けする。
本研究では,単語とセグメントレベルで形態型を定量化することにより,そのようなクレームの剛性を低減することを提案する。
本研究では, 英語, ドイツ語, トルコ語の非教師なし・教師付き形態素分割法について検討する一方, 融合ではスペイン語を用いた半自動手法を提案する。
そして、機械翻訳品質と単語(名詞と動詞)における合成・融合の程度との関係を分析する。
論文 参考訳(メタデータ) (2022-05-06T17:04:58Z) - Translating from Morphologically Complex Languages: A Paraphrase-Based
Approach [45.900339652085584]
形態的関連語間の相互関係を潜在的なパラフレーズとして扱い,単語,句,文レベルでのパラフレーズ化手法を用いて処理する。
マレー語から英語に翻訳された実験は、競合するアプローチよりも大幅に改善されている。
論文 参考訳(メタデータ) (2021-09-27T07:02:19Z) - Linguistic dependencies and statistical dependence [76.89273585568084]
文脈における単語の確率を推定するために,事前学習した言語モデルを用いる。
最大CPMI木は非文脈PMI推定値から抽出した木よりも言語的依存関係によく対応していることがわかった。
論文 参考訳(メタデータ) (2021-04-18T02:43:37Z) - Speakers Fill Lexical Semantic Gaps with Context [65.08205006886591]
我々は単語の語彙的あいまいさを意味のエントロピーとして運用する。
単語のあいまいさの推定値と,WordNetにおける単語の同義語数との間には,有意な相関関係が認められた。
これは、あいまいさの存在下では、話者が文脈をより情報的にすることで補うことを示唆している。
論文 参考訳(メタデータ) (2020-10-05T17:19:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。