Fugu-MT 論文翻訳(概要): Hybrid lemmatization in HuSpaCy

論文の概要: Hybrid lemmatization in HuSpaCy

arxiv url: http://arxiv.org/abs/2306.07636v1
Date: Tue, 13 Jun 2023 09:15:40 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-14 14:32:41.217306
Title: Hybrid lemmatization in HuSpaCy
Title（参考訳）: HuSpaCyのハイブリッド化
Authors: P\'eter Berkecz, Gy\"orgy Orosz, Zsolt Sz\'ant\'o, Gerg\H{o} Szab\'o, Rich\'ard Farkas
Abstract要約: 本稿では,ニューラルモデル,辞書,手作りルールを併用したハイブリッド補間器を提案する。我々は、広く使われているハンガリーのデータセットに実証的な結果とともにハイブリッドアーキテクチャを導入する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Lemmatization is still not a trivial task for morphologically rich languages. Previous studies showed that hybrid architectures usually work better for these languages and can yield great results. This paper presents a hybrid lemmatizer utilizing both a neural model, dictionaries and hand-crafted rules. We introduce a hybrid architecture along with empirical results on a widely used Hungarian dataset. The presented methods are published as three HuSpaCy models.
Abstract（参考訳）: Lemmatizationは、まだ形態的にリッチな言語のための簡単なタスクではありません。以前の研究では、ハイブリッドアーキテクチャは通常これらの言語でうまく機能し、大きな結果をもたらすことが示されていた。本稿では,ニューラルモデル,辞書,手作りルールを併用したハイブリッドレンマタイザを提案する。我々は、広く使われているハンガリーのデータセットに実験結果とともにハイブリッドアーキテクチャを導入する。提案手法は3つのヒューピアシーモデルとして公表される。

関連論文リスト

Hybrid Neural-LLM Pipeline for Morphological Glossing in Endangered Language Documentation: A Case Study of Jungar Tuvan [6.367163817135528]
本稿では,ニューラルシークエンスラベリングと大規模言語モデル(LLM)を併用したハイブリッド自動グロスパイプラインを提案する。検索強化プロンプトは、ランダムなサンプル選択よりも大幅に向上することを示す。また, 形態素辞書は, 辞書を全く提供していない場合に比べて, パラドックス的に性能を損なうことが判明した。
論文参考訳（メタデータ） (2026-03-01T05:03:11Z)
The Cognate Data Bottleneck in Language Phylogenetics [49.1574468325115]
より大きなデータセットを必要とする系統データ分析アプローチは、コグネートデータには適用できない。これらの計算手法が歴史的言語学にどのように適用できるか、またどのように適用できるかは、まだ明らかな疑問である。
論文参考訳（メタデータ） (2025-07-01T16:14:20Z)
Hierarchical Mamba Meets Hyperbolic Geometry: A New Paradigm for Structured Language Embeddings [1.4183971140167244]
階層型マンバ (HiM) を用いて階層型言語埋め込みを学習する。 HiMは効率的なMamba2と指数関数的な成長と双曲幾何学の曲線の性質を統合している。両モデルが4つの存在論的データセットの階層的関係を効果的に捉えていることを示す。
論文参考訳（メタデータ） (2025-05-25T04:45:06Z)
Hybrid Spatial Representations for Species Distribution Modeling [4.015569252776372]
種分布モデリング(SDM)は、ある種が地球上の特定の位置に存在するかどうかを予測することを目的としている。これまでの研究では、有望な結果を達成するモデルを構築するために、ニューラルな暗黙表現を使用してきた。暗黙の埋め込みと明示的な埋め込みを組み合わせたハイブリッドな埋め込み方式を提案する。
論文参考訳（メタデータ） (2024-10-14T17:59:58Z)
Cognitive Modeling with Scaffolded LLMs: A Case Study of Referential Expression Generation [5.5711773076846365]
本稿では,参照表現生成のアルゴリズム的認知モデルのニューラルシンボリック実装について検討する。私たちのハイブリッドアプローチは認知的に妥当であり、複雑な状況下ではうまく機能します。
論文参考訳（メタデータ） (2024-07-04T10:28:48Z)
Beyond Contrastive Learning: A Variational Generative Model for Multilingual Retrieval [109.62363167257664]
本稿では,多言語テキスト埋め込み学習のための生成モデルを提案する。我々のモデルは、$N$言語で並列データを操作する。本手法は, 意味的類似性, ビットクストマイニング, 言語間質問検索などを含む一連のタスクに対して評価を行う。
論文参考訳（メタデータ） (2022-12-21T02:41:40Z)
Twist Decoding: Diverse Generators Guide Each Other [116.20780037268801]
様々なモデルの恩恵を受けながらテキストを生成するシンプルで一般的な推論アルゴリズムであるTwist decodingを導入する。我々の方法は、語彙、トークン化、あるいは生成順序が共有されていると仮定しない。
論文参考訳（メタデータ） (2022-05-19T01:27:53Z)
Better Language Model with Hypernym Class Prediction [101.8517004687825]
クラスベース言語モデル (LM) は、コンテキストの疎結合に$n$-gramのLMで対処するために長年開発されてきた。本研究では,このアプローチをニューラルLMの文脈で再考する。
論文参考訳（メタデータ） (2022-03-21T01:16:44Z)
Taxonomy Enrichment with Text and Graph Vector Representations [61.814256012166794]
我々は,既存の分類学に新たな語を加えることを目的とした分類学の豊かさの問題に対処する。我々は,この課題に対して,少ない労力で高い結果を得られる新しい手法を提案する。我々は、異なるデータセットにわたる最先端の結果を達成し、ミスの詳細なエラー分析を提供する。
論文参考訳（メタデータ） (2022-01-21T09:01:12Z)
UnitedQA: A Hybrid Approach for Open Domain Question Answering [70.54286377610953]
最近の訓練済みのニューラル言語モデルに基づいて,抽出的および生成的読取能力を高めるために,新しい手法を適用した。私たちのアプローチは、それぞれNaturalQuestionsとTriviaQAと正確な一致で、以前の最先端のモデルを3.3と2.7ポイント上回る。
論文参考訳（メタデータ） (2021-01-01T06:36:16Z)
In search of isoglosses: continuous and discrete language embeddings in Slavic historical phonology [0.0]
私たちは3種類の言語埋め込み(dense, sigmoid, ストレートスルー)を採用しています。 Sigmoid モデルの言語埋め込みは,従来のスラヴ語のサブグループ化と最強の一致を示している。
論文参考訳（メタデータ） (2020-05-27T18:10:46Z)
A Simple Joint Model for Improved Contextual Neural Lemmatization [60.802451210656805]
本稿では,20言語で最先端の成果を得られる,単純結合型ニューラルモデルを提案する。本論文では,トレーニングと復号化に加えて,本モデルについて述べる。
論文参考訳（メタデータ） (2019-04-04T02:03:19Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。