論文の概要: KoParadigm: A Korean Conjugation Paradigm Generator
- arxiv url: http://arxiv.org/abs/2004.13221v1
- Date: Tue, 28 Apr 2020 00:28:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-08 22:50:11.873594
- Title: KoParadigm: A Korean Conjugation Paradigm Generator
- Title(参考訳): KoParadigm:韓国の共役パラダイムジェネレータ
- Authors: Kyubyong Park
- Abstract要約: 我々はKoParadigmと呼ばれる韓国の共役パラダイムジェネレータを紹介する。
我々の知る限りでは、同時代の韓国語動詞と終末を網羅する最初の韓国語活用モジュールである。
KoParadigmは言語的によく確立されているが、計算的に単純かつ効率的である。
- 参考スコア(独自算出の注目度): 4.6275185782868045
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Korean is a morphologically rich language. Korean verbs change their forms in
a fickle manner depending on tense, mood, speech level, meaning, etc.
Therefore, it is challenging to construct comprehensive conjugation paradigms
of Korean verbs. In this paper we introduce a Korean (verb) conjugation
paradigm generator, dubbed KoParadigm. To the best of our knowledge, it is the
first Korean conjugation module that covers all contemporary Korean verbs and
endings. KoParadigm is not only linguistically well established, but also
computationally simple and efficient. We share it via PyPi.
- Abstract(参考訳): 韓国語は形態的に豊かな言語である。
韓国語の動詞は、時制、ムード、発話レベル、意味などによって形を変える。
そのため、朝鮮語動詞の包括的活用パラダイムの構築は困難である。
本稿では,koparadigmと呼ばれる韓国語(verb)共用パラダイム生成器について紹介する。
我々の知る限りでは、同時代の韓国語動詞と終末を網羅する最初の韓国語活用モジュールである。
KoParadigmは言語的に十分に確立されているだけでなく、計算的にシンプルで効率的である。
PyPiで共有しています。
関連論文リスト
- Does Incomplete Syntax Influence Korean Language Model? Focusing on Word Order and Case Markers [7.275938266030414]
語順やケースマーカーなどの構文要素は自然言語処理において基本的なものである。
本研究は,韓国語モデルがこの柔軟性を正確に捉えることができるかどうかを考察する。
論文 参考訳(メタデータ) (2024-07-12T11:33:41Z) - HyperCLOVA X Technical Report [119.94633129762133]
韓国語と文化に合わせた大型言語モデル(LLM)のファミリーであるHyperCLOVA Xを紹介する。
HyperCLOVA Xは韓国語、英語、コードデータのバランスの取れた混合でトレーニングされ、その後、高品質な人間アノテーション付きデータセットによる命令チューニングが行われた。
このモデルは、韓国語と英語の両方で、包括的な推論、知識、常識、事実性、コーディング、数学、チャット、指示追従、無害など、様々なベンチマークで評価されている。
論文 参考訳(メタデータ) (2024-04-02T13:48:49Z) - KoDialogBench: Evaluating Conversational Understanding of Language Models with Korean Dialogue Benchmark [19.14739816385178]
韓国語における言語モデルの対話能力を評価するためのベンチマークであるKoDialogBenchを紹介する。
日常の話題に関する韓国語の対話を公開情報源から収集したり、他言語からの対話を翻訳したりする。
次に、これらの会話を多様なテストデータセットに構成し、対話理解から応答選択タスクにまたがる。
論文 参考訳(メタデータ) (2024-02-27T10:14:57Z) - Word segmentation granularity in Korean [1.0619039878979954]
韓国語では、単語のセグメンテーションの粒度には複数のレベルがある。
特定の言語処理やコーパスアノテーションタスクでは、いくつかの異なる粒度レベルが提案され、利用されている。
興味深いことに、機能的形態素のみを分離した粒度は、句構造解析の最適性能をもたらす。
論文 参考訳(メタデータ) (2023-09-07T13:42:05Z) - K-UniMorph: Korean Universal Morphology and its Feature Schema [1.3048920509133806]
韓国語に対する新しいユニバーサル・モルフォロジー・データセットを提案する。
文末の文法的基準を詳細に概説し, 屈折形を抽出する方法を明らかにし, 形態的スキーマの生成方法を示す。
我々は,韓国語の3つの単語形式(文字,音節,形態素)を用いて屈折処理を行う。
論文 参考訳(メタデータ) (2023-05-10T17:44:01Z) - Translating Hanja Historical Documents to Contemporary Korean and
English [52.625998002213585]
李氏朝鮮のアナルスには、朝鮮の近代国家に先立つ500年の王国である李氏朝鮮の日記がある。
アナル文字はもともとは古代朝鮮の文体「ハンジャ」で書かれ、1968年から1993年にかけて朝鮮語に翻訳された。
以後、10年間に1人の王の記録が完成した。
本稿では,ハンハの歴史的文書を韓国語や英語に翻訳するニューラルネットワーク翻訳モデルH2KEを提案する。
論文 参考訳(メタデータ) (2022-05-20T08:25:11Z) - Quantifying Synthesis and Fusion and their Impact on Machine Translation [79.61874492642691]
自然言語処理(NLP)では、一般に、融合や凝集のような厳密な形態を持つ言語全体をラベル付けする。
本研究では,単語とセグメントレベルで形態型を定量化することにより,そのようなクレームの剛性を低減することを提案する。
本研究では, 英語, ドイツ語, トルコ語の非教師なし・教師付き形態素分割法について検討する一方, 融合ではスペイン語を用いた半自動手法を提案する。
そして、機械翻訳品質と単語(名詞と動詞)における合成・融合の程度との関係を分析する。
論文 参考訳(メタデータ) (2022-05-06T17:04:58Z) - Design of a novel Korean learning application for efficient
pronunciation correction [2.008880264104061]
提案システムでは,音声認識,音声テキスト,音声波形の3つが重要なシステムである。
すると、ソフトウェアはユーザのフレーズと回答を表示し、赤で強調された要素を誤って表示する。
論文 参考訳(メタデータ) (2022-05-04T11:19:29Z) - ConjNLI: Natural Language Inference Over Conjunctive Sentences [89.50542552451368]
連接文における連接関係の推論は、連接関係のより深い理解にとって重要である。
既存のNLIストレステストでは、結合の非ブール的使用は考慮されていない。
本稿では,接続文に対する自然言語推論のためのストレステストであるConjNLIを紹介する。
論文 参考訳(メタデータ) (2020-10-20T16:29:13Z) - Investigating Cross-Linguistic Adjective Ordering Tendencies with a
Latent-Variable Model [66.84264870118723]
本稿では,多言語形容詞順序付けを潜在変数モデルとして,初めて純粋コーパス駆動モデルを提案する。
我々は普遍的、言語横断的、階層的形容詞順序付け傾向の存在の強い確固たる証拠を提供する。
論文 参考訳(メタデータ) (2020-10-09T18:27:55Z) - A Simple Joint Model for Improved Contextual Neural Lemmatization [60.802451210656805]
本稿では,20言語で最先端の成果を得られる,単純結合型ニューラルモデルを提案する。
本論文では,トレーニングと復号化に加えて,本モデルについて述べる。
論文 参考訳(メタデータ) (2019-04-04T02:03:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。