論文の概要: A Resource for Studying Chatino Verbal Morphology
- arxiv url: http://arxiv.org/abs/2004.02083v1
- Date: Sun, 5 Apr 2020 03:30:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-16 12:45:21.813816
- Title: A Resource for Studying Chatino Verbal Morphology
- Title(参考訳): チャチノの言語形態研究の資源
- Authors: Hilaria Cruz, Gregory Stump, and Antonios Anastasopoulos
- Abstract要約: メキシコで話されている調音メソアメリカ語であるサンフアン・キアヒエ・チャティーノの動詞の屈折形態に着目した最初の資料を提示する。
我々はUniMorphスキーマに基づく形態的タグ付き198レマタの完全なインフレクションテーブルのコレクションを提供する。
- 参考スコア(独自算出の注目度): 27.779138110076424
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present the first resource focusing on the verbal inflectional morphology
of San Juan Quiahije Chatino, a tonal mesoamerican language spoken in Mexico.
We provide a collection of complete inflection tables of 198 lemmata, with
morphological tags based on the UniMorph schema. We also provide baseline
results on three core NLP tasks: morphological analysis, lemmatization, and
morphological inflection.
- Abstract(参考訳): メキシコで話されているメソアメリカ語サンフアン・キアヒエ・チャティノの言語的抑揚形態に焦点をあてた最初の資料を紹介する。
我々はUniMorphスキーマに基づく形態的タグ付き198レマタの完全なインフレクションテーブルのコレクションを提供する。
また, 形態素解析, 補間, 形態素変換の3つのコアnlpタスクについて基礎的結果を提供する。
関連論文リスト
- Exploring Linguistic Probes for Morphological Generalization [11.568042812213712]
これらのプローブを3つの形態学的に異なる言語で検証したところ、3つの主要な形態素インフレクション系が共役類に対して異なる一般化戦略と正書法および音韻的に書き起こされた入力上の特徴集合を用いているという証拠が得られた。
論文 参考訳(メタデータ) (2023-10-20T17:45:30Z) - UniMorph 4.0: Universal Morphology [104.69846084893298]
本稿は,過去2年間のいくつかの前線における展開と改善について述べる。
多くの言語学者による共同作業により、30の絶滅危惧言語を含む67の新しい言語が追加された。
前回のUniMorphリリースに合わせて,16言語で形態素セグメンテーションを施したデータベースも拡張した。
論文 参考訳(メタデータ) (2022-05-07T09:19:02Z) - Quantifying Synthesis and Fusion and their Impact on Machine Translation [79.61874492642691]
自然言語処理(NLP)では、一般に、融合や凝集のような厳密な形態を持つ言語全体をラベル付けする。
本研究では,単語とセグメントレベルで形態型を定量化することにより,そのようなクレームの剛性を低減することを提案する。
本研究では, 英語, ドイツ語, トルコ語の非教師なし・教師付き形態素分割法について検討する一方, 融合ではスペイン語を用いた半自動手法を提案する。
そして、機械翻訳品質と単語(名詞と動詞)における合成・融合の程度との関係を分析する。
論文 参考訳(メタデータ) (2022-05-06T17:04:58Z) - Modeling Target-Side Morphology in Neural Machine Translation: A
Comparison of Strategies [72.56158036639707]
形態的に豊かな言語は機械翻訳に困難をもたらす。
多数の異なる屈折する単語曲面は、より大きな語彙を必要とする。
いくつかの頻度の低い用語は、通常、トレーニングコーパスには現れない。
言語的合意は、出力文中の屈折語形間の文法的カテゴリを正しく一致させる必要がある。
論文 参考訳(メタデータ) (2022-03-25T10:13:20Z) - Translating from Morphologically Complex Languages: A Paraphrase-Based
Approach [45.900339652085584]
形態的関連語間の相互関係を潜在的なパラフレーズとして扱い,単語,句,文レベルでのパラフレーズ化手法を用いて処理する。
マレー語から英語に翻訳された実験は、競合するアプローチよりも大幅に改善されている。
論文 参考訳(メタデータ) (2021-09-27T07:02:19Z) - Evaluation of Morphological Embeddings for the Russian Language [0.0]
SkipgramObjectiveで訓練されたモルフォロジーベースの埋め込みは、既存の埋め込みモデル-FastTextを上回っません。
より複雑な、しかしモルフォロジーを知らないモデル、BERTは、単語のモルフォロジーの理解を必要とするタスクで大幅に大きなパフォーマンスを達成することができます。
論文 参考訳(メタデータ) (2021-03-11T11:59:11Z) - Morphology Matters: A Multilingual Language Modeling Analysis [8.791030561752384]
先行研究では、言語のモデル化が難しくなるかどうかについては意見が一致していない。
我々は92の言語で145の聖書翻訳のより大きなコーパスをコンパイルし、多くの類型的特徴を蓄積する。
いくつかの形態学的測定は、LSTMモデルがBPEセグメントデータで訓練されると、より高い推定値と有意に関連します。
論文 参考訳(メタデータ) (2020-12-11T11:55:55Z) - Morphologically Aware Word-Level Translation [82.59379608647147]
本稿では,バイリンガルレキシコン誘導のための新しい形態素認識確率モデルを提案する。
我々のモデルは、レキセメが意味の鍵となる語彙単位であるという基本的な言語的直観を生かしている。
論文 参考訳(メタデータ) (2020-11-15T17:54:49Z) - Morphological Disambiguation from Stemming Data [1.2183405753834562]
形態学的に豊かな言語であるKinyarwandaは、現在、自動形態素解析のためのツールを欠いている。
我々は、クラウドソーシングを通じて収集された新しいスリーミングデータセットから、Kinyarwandaの動詞形を形態的に曖昧にすることを学ぶ。
本実験により, 茎の屈折特性と形態素関連規則が, 曖昧さの最も識別的な特徴であることが判明した。
論文 参考訳(メタデータ) (2020-11-11T01:44:09Z) - Neural disambiguation of lemma and part of speech in morphologically
rich languages [0.6346772579930928]
形態的に豊かな言語における不明瞭な単語の補題と発話の一部を曖昧にすることの問題点を考察する。
そこで本稿では, テキストの未注釈コーパスと形態素解析を用いて, 文脈におけるあいまいな単語の曖昧さを解消する手法を提案する。
論文 参考訳(メタデータ) (2020-07-12T21:48:52Z) - Evaluating Transformer-Based Multilingual Text Classification [55.53547556060537]
我々は,NLPツールが構文的・形態学的に異なる言語で不平等に機能すると主張している。
実験研究を支援するために,単語順と形態的類似度指標を算出した。
論文 参考訳(メタデータ) (2020-04-29T03:34:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。