論文の概要: Evolution of Part-of-Speech in Classical Chinese
- arxiv url: http://arxiv.org/abs/2009.11144v1
- Date: Wed, 23 Sep 2020 13:41:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-15 16:01:29.160413
- Title: Evolution of Part-of-Speech in Classical Chinese
- Title(参考訳): 古典中国語におけるパート・オブ・スペルの進化
- Authors: Bai Li
- Abstract要約: Bisang (2008) は古典中国語は前分類型言語であり、ある単語の統語的位置がその音声のカテゴリーを決定すると主張した。
エントロピーに基づくメトリクスを用いて,これらの主張を歴史的コーパスで評価する。
- 参考スコア(独自算出の注目度): 2.870517198186329
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Classical Chinese is a language notable for its word class flexibility: the
same word may often be used as a noun or a verb. Bisang (2008) claimed that
Classical Chinese is a precategorical language, where the syntactic position of
a word determines its part-of-speech category. In this paper, we apply
entropy-based metrics to evaluate these claims on historical corpora. We
further explore differences between nouns and verbs in Classical Chinese: using
psycholinguistic norms, we find a positive correlation between concreteness and
noun usage. Finally, we align character embeddings from Classical and Modern
Chinese, and find that verbs undergo more semantic change than nouns.
- Abstract(参考訳): 古典中国語は単語のクラスの柔軟性に特有な言語であり、同じ単語が名詞や動詞として使われることが多い。
Bisang (2008) は古典中国語は前分類型言語であり、ある単語の統語的位置がその音声のカテゴリーを決定すると主張した。
本稿では,エントロピーに基づく指標を用いて,これらの主張を歴史的コーパス上で評価する。
古典中国語における名詞と動詞の違いをさらに探求する: 心理学的規範を用いて、具体性と名詞使用の正の相関を見出す。
最後に、古典中国語や現代中国語からの文字埋め込みを整理し、動詞が名詞よりも意味的変化を起こすことを見出した。
関連論文リスト
- What an Elegant Bridge: Multilingual LLMs are Biased Similarly in Different Languages [51.0349882045866]
本稿では,Large Language Models (LLMs) の文法的ジェンダーのレンズによるバイアスについて検討する。
様々な言語における形容詞を持つ名詞を記述するためのモデルを提案し,特に文法性のある言語に焦点を当てた。
単純な分類器は、偶然以上の名詞の性別を予測できるだけでなく、言語間の移動可能性も示せる。
論文 参考訳(メタデータ) (2024-07-12T22:10:16Z) - Computational Modelling of Plurality and Definiteness in Chinese Noun
Phrases [13.317456093426808]
中国語名詞句(NPs)における複数・定性マーカーの欠落に着目した。
我々は中国語のNPのコーパスを構築し、そのそれぞれに対応する文脈と、その特異性/複数性と定性/不定性を示すラベルを添える。
従来の機械学習モデルと最先端の事前学習言語モデルの両方を用いて計算モデルのバンクを訓練し、各NPの多重性と定性を予測する。
論文 参考訳(メタデータ) (2024-03-07T10:06:54Z) - Shuo Wen Jie Zi: Rethinking Dictionaries and Glyphs for Chinese Language
Pre-training [50.100992353488174]
辞書知識と漢字の構造を持つ中国語PLMの意味理解能力を高める新しい学習パラダイムであるCDBERTを紹介する。
我々はCDBERTの2つの中核モジュールを Shuowen と Jiezi と名付け、そこで Shuowen は中国語辞書から最も適切な意味を取り出す過程を指す。
本パラダイムは,従来の中国語PLMのタスク間における一貫した改善を実証する。
論文 参考訳(メタデータ) (2023-05-30T05:48:36Z) - Noun2Verb: Probabilistic frame semantics for word class conversion [8.939269057094661]
本稿では,新規な名詞用動詞の生成と理解をシミュレートする形式的枠組みを提案する。
話者とリスナーが協調して意味的フレーム要素上の結合分布を学習するモデルは、経験的名詞使用法をよりよく説明できることを示す。
論文 参考訳(メタデータ) (2022-05-12T19:16:12Z) - When is Wall a Pared and when a Muro? -- Extracting Rules Governing
Lexical Selection [85.0262994506624]
本稿では,微細な語彙の区別を自動的に識別する手法を提案する。
我々は、これらの区別を説明する簡潔な記述を、人間と機械で読める形式で抽出する。
我々はこれらの記述を用いて、与えられた曖昧な単語を異なる可能な翻訳に翻訳する時、非ネイティブ話者に教える。
論文 参考訳(メタデータ) (2021-09-13T14:49:00Z) - Lexical semantic change for Ancient Greek and Latin [61.69697586178796]
歴史的文脈における単語の正しい意味の連想は、ダイアクロニック研究の中心的な課題である。
我々は、動的ベイズ混合モデルに基づくセマンティック変化に対する最近の計算的アプローチに基づいて構築する。
本研究では,動的ベイズ混合モデルと最先端埋め込みモデルとのセマンティックな変化を系統的に比較する。
論文 参考訳(メタデータ) (2021-01-22T12:04:08Z) - Word class flexibility: A deep contextualized approach [18.50173460090958]
単語クラス柔軟性の規則性を探求する原理的手法を提案する。
文脈的埋め込みは、英語の単語におけるクラス変化の人間の判断を捉える。
フレキシブルなレムマが支配的な単語クラスで使用される場合、より意味的なバリエーションがより大きくなる。
論文 参考訳(メタデータ) (2020-09-19T14:41:50Z) - Corpus of Chinese Dynastic Histories: Gender Analysis over Two Millennia [3.2851864672627618]
王朝の歴史は紀元前3世紀から紀元前18世紀にかけて、およそ2000年の長い連続した言語空間を形成している。
歴史は古典(文学)中国語で2000万文字以上のコーパスで記録されており、歴史的辞書の計算分析や意味変化に適している。
このプロジェクトでは,Creative Commonsライセンスでカバーされた24のダイナスティックヒストリーの新たなオープンソースコーパスを導入する。
論文 参考訳(メタデータ) (2020-05-18T15:14:33Z) - Predicting Declension Class from Form and Meaning [70.65971611552871]
クラスメンバーシップは決定論的には程遠いが、名詞と/またはその意味の音韻学的形式は、しばしば不完全な手がかりを与える。
我々は、どの程度の情報、ビットで、名詞の形式や意味を知ることの難しさを測ることによって、これを運用する。
2つのインド・ヨーロッパ語(チェコ語とドイツ語)がそれぞれ、大量の情報をクラスと共有していることがわかった。
論文 参考訳(メタデータ) (2020-05-01T21:48:48Z) - A Corpus of Adpositional Supersenses for Mandarin Chinese [15.757892250956715]
マンダリン中国語ですべての表記が意味論的に注釈付けされたコーパスについて述べる。
提案手法は, 言語に依存しない意味的基準に従って, 超感覚の一般的な集合を定義する枠組みに適応する。
このスーパーセンスカテゴリーは、英語と構文的差異があるにもかかわらず、中国語の表記に適していることがわかった。
論文 参考訳(メタデータ) (2020-03-18T18:59:55Z) - Where New Words Are Born: Distributional Semantic Analysis of Neologisms
and Their Semantic Neighborhoods [51.34667808471513]
分散意味論のパラダイムで定式化されたセマンティック隣人のセマンティック・スパシティと周波数成長率という2つの要因の重要性について検討する。
いずれの因子も単語の出現を予測できるが,後者の仮説はより支持される。
論文 参考訳(メタデータ) (2020-01-21T19:09:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。