論文の概要: Hybrid lemmatization in HuSpaCy
- arxiv url: http://arxiv.org/abs/2306.07636v1
- Date: Tue, 13 Jun 2023 09:15:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-14 14:32:41.217306
- Title: Hybrid lemmatization in HuSpaCy
- Title(参考訳): HuSpaCyのハイブリッド化
- Authors: P\'eter Berkecz, Gy\"orgy Orosz, Zsolt Sz\'ant\'o, Gerg\H{o} Szab\'o,
Rich\'ard Farkas
- Abstract要約: 本稿では,ニューラルモデル,辞書,手作りルールを併用したハイブリッド補間器を提案する。
我々は、広く使われているハンガリーのデータセットに実証的な結果とともにハイブリッドアーキテクチャを導入する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Lemmatization is still not a trivial task for morphologically rich languages.
Previous studies showed that hybrid architectures usually work better for these
languages and can yield great results. This paper presents a hybrid lemmatizer
utilizing both a neural model, dictionaries and hand-crafted rules. We
introduce a hybrid architecture along with empirical results on a widely used
Hungarian dataset. The presented methods are published as three HuSpaCy models.
- Abstract(参考訳): Lemmatizationは、まだ形態的にリッチな言語のための簡単なタスクではありません。
以前の研究では、ハイブリッドアーキテクチャは通常これらの言語でうまく機能し、大きな結果をもたらすことが示されていた。
本稿では,ニューラルモデル,辞書,手作りルールを併用したハイブリッドレンマタイザを提案する。
我々は、広く使われているハンガリーのデータセットに実験結果とともにハイブリッドアーキテクチャを導入する。
提案手法は3つのヒューピアシーモデルとして公表される。
関連論文リスト
- Hybrid Spatial Representations for Species Distribution Modeling [4.015569252776372]
種分布モデリング(SDM)は、ある種が地球上の特定の位置に存在するかどうかを予測することを目的としている。
これまでの研究では、有望な結果を達成するモデルを構築するために、ニューラルな暗黙表現を使用してきた。
暗黙の埋め込みと明示的な埋め込みを組み合わせたハイブリッドな埋め込み方式を提案する。
論文 参考訳(メタデータ) (2024-10-14T17:59:58Z) - Cognitive Modeling with Scaffolded LLMs: A Case Study of Referential Expression Generation [5.5711773076846365]
本稿では,参照表現生成のアルゴリズム的認知モデルのニューラルシンボリック実装について検討する。
私たちのハイブリッドアプローチは認知的に妥当であり、複雑な状況下ではうまく機能します。
論文 参考訳(メタデータ) (2024-07-04T10:28:48Z) - Beyond Contrastive Learning: A Variational Generative Model for
Multilingual Retrieval [109.62363167257664]
本稿では,多言語テキスト埋め込み学習のための生成モデルを提案する。
我々のモデルは、$N$言語で並列データを操作する。
本手法は, 意味的類似性, ビットクストマイニング, 言語間質問検索などを含む一連のタスクに対して評価を行う。
論文 参考訳(メタデータ) (2022-12-21T02:41:40Z) - Twist Decoding: Diverse Generators Guide Each Other [116.20780037268801]
様々なモデルの恩恵を受けながらテキストを生成するシンプルで一般的な推論アルゴリズムであるTwist decodingを導入する。
我々の方法は、語彙、トークン化、あるいは生成順序が共有されていると仮定しない。
論文 参考訳(メタデータ) (2022-05-19T01:27:53Z) - Better Language Model with Hypernym Class Prediction [101.8517004687825]
クラスベース言語モデル (LM) は、コンテキストの疎結合に$n$-gramのLMで対処するために長年開発されてきた。
本研究では,このアプローチをニューラルLMの文脈で再考する。
論文 参考訳(メタデータ) (2022-03-21T01:16:44Z) - Taxonomy Enrichment with Text and Graph Vector Representations [61.814256012166794]
我々は,既存の分類学に新たな語を加えることを目的とした分類学の豊かさの問題に対処する。
我々は,この課題に対して,少ない労力で高い結果を得られる新しい手法を提案する。
我々は、異なるデータセットにわたる最先端の結果を達成し、ミスの詳細なエラー分析を提供する。
論文 参考訳(メタデータ) (2022-01-21T09:01:12Z) - UnitedQA: A Hybrid Approach for Open Domain Question Answering [70.54286377610953]
最近の訓練済みのニューラル言語モデルに基づいて,抽出的および生成的読取能力を高めるために,新しい手法を適用した。
私たちのアプローチは、それぞれNaturalQuestionsとTriviaQAと正確な一致で、以前の最先端のモデルを3.3と2.7ポイント上回る。
論文 参考訳(メタデータ) (2021-01-01T06:36:16Z) - In search of isoglosses: continuous and discrete language embeddings in
Slavic historical phonology [0.0]
私たちは3種類の言語埋め込み(dense, sigmoid, ストレートスルー)を採用しています。
Sigmoid モデルの言語埋め込みは,従来のスラヴ語のサブグループ化と最強の一致を示している。
論文 参考訳(メタデータ) (2020-05-27T18:10:46Z) - A Simple Joint Model for Improved Contextual Neural Lemmatization [60.802451210656805]
本稿では,20言語で最先端の成果を得られる,単純結合型ニューラルモデルを提案する。
本論文では,トレーニングと復号化に加えて,本モデルについて述べる。
論文 参考訳(メタデータ) (2019-04-04T02:03:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。