Fugu-MT 論文翻訳(概要): Detection of Non-recorded Word Senses in English and Swedish

論文の概要: Detection of Non-recorded Word Senses in English and Swedish

arxiv url: http://arxiv.org/abs/2403.02285v1
Date: Mon, 4 Mar 2024 18:15:14 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-06 17:49:54.064155
Title: Detection of Non-recorded Word Senses in English and Swedish
Title（参考訳）: 英語とスウェーデン語における非記録単語知覚の検出
Authors: Jonathan Lautenschlager, Emma Sk\"oldberg, Simon Hengchen, Dominik Schlechtweg
Abstract要約: 本研究は,英語とスウェーデン語における未知のセンス検出の課題に対処する。このタスクの主な目的は、特定の単語使用の意味が辞書に記録されているかどうかを決定することである。この目的のために、センスエントリは現代・歴史的コーパスの語用例と比較される。
参考スコア（独自算出の注目度）: 4.088260994903874
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This study addresses the task of Unknown Sense Detection in English and Swedish. The primary objective of this task is to determine whether the meaning of a particular word usage is documented in a dictionary or not. For this purpose, sense entries are compared with word usages from modern and historical corpora using a pre-trained Word-in-Context embedder that allows us to model this task in a few-shot scenario. Additionally, we use human annotations to adapt and evaluate our models. Compared to a random sample from a corpus, our model is able to considerably increase the detected number of word usages with non-recorded senses.
Abstract（参考訳）: 本研究は,英語とスウェーデン語における未知のセンス検出の課題に対処する。このタスクの主な目的は、特定の単語使用の意味が辞書に記録されているかどうかを決定することである。この目的のために、センスエントリは、学習済みのWord-in-Context埋め込みを用いて、現代および歴史的コーパスからの単語使用量と比較される。さらに、人間のアノテーションを使ってモデルを適応し、評価します。コーパスからのランダムなサンプルと比較すると,非記録感覚で検出された単語使用量を大幅に増加させることができる。

関連論文リスト

An Energy-based Model for Word-level AutoCompletion in Computer-aided Translation [97.3797716862478]
Word-level AutoCompletion (WLAC) は、コンピュータ支援翻訳における報奨だが挑戦的なタスクである。既存の作業は、入力コンテキストの隠れベクターを対応するラベルにマッピングするニューラルネットワークに基づく分類モデルを通じて、このタスクに対処する。そこで本研究では,WLACのエネルギーモデルを提案する。
論文参考訳（メタデータ） (2024-07-29T15:07:19Z)
Cross-lingual paraphrase identification [0.0]
複数の言語にまたがるハードパラフレーズを検出するために,両エンコーダモデルを対照的に訓練する。私たちのパフォーマンスは最先端のクロスエンコーダに匹敵します。
論文参考訳（メタデータ） (2024-06-21T11:37:24Z)
Presence or Absence: Are Unknown Word Usages in Dictionaries? [6.185216877366987]
我々は,フィンランド語,ロシア語,ドイツ語の共用課題であるAXOLOTL-24の評価を行った。未知の単語使用量と辞書エントリ間のマッピングを予測するために,グラフベースのクラスタリング手法を用いる。私たちのシステムはフィンランド語とドイツ語で第1位、ロシア語で第2位、Subtask 2テストフェーズのリーダーボードで第2位にランクインします。
論文参考訳（メタデータ） (2024-06-02T07:57:45Z)
Assessing Word Importance Using Models Trained for Semantic Tasks [0.0]
我々は、自然言語推論とパラフレーズ同定という、意味的課題を解決するために訓練されたモデルから単語の意義を導き出す。我々は、いわゆるクロスタスク評価を用いて、それらの妥当性を評価する。本手法は, 文章中の重要な単語を, 学習における単語のラベル付けを伴わずに識別することができる。
論文参考訳（メタデータ） (2023-05-31T09:34:26Z)
Unsupervised Semantic Variation Prediction using the Distribution of Sibling Embeddings [17.803726860514193]
単語の意味的変化の検出は,様々なNLPアプリケーションにおいて重要な課題である。意味表現だけではそのような意味的バリエーションを正確に捉えることはできないと我々は主張する。対象単語の文脈的埋め込みのコホート全体を利用する手法を提案する。
論文参考訳（メタデータ） (2023-05-15T13:58:21Z)
Beyond Contrastive Learning: A Variational Generative Model for Multilingual Retrieval [109.62363167257664]
本稿では,多言語テキスト埋め込み学習のための生成モデルを提案する。我々のモデルは、$N$言語で並列データを操作する。本手法は, 意味的類似性, ビットクストマイニング, 言語間質問検索などを含む一連のタスクに対して評価を行う。
論文参考訳（メタデータ） (2022-12-21T02:41:40Z)
Connect-the-Dots: Bridging Semantics between Words and Definitions via Aligning Word Sense Inventories [47.03271152494389]
Word Sense Disambiguationは、そのコンテキストに応じて、ある単語の正確な意味を自動的に識別することを目的としている。既存の教師付きモデルは、限られた訓練データのために稀な単語感覚の正確な予測に苦慮している。我々は,定義文を異なる意味の在庫から同じ意味に整合させ,豊富な語彙知識を収集する光沢アライメントアルゴリズムを提案する。
論文参考訳（メタデータ） (2021-10-27T00:04:33Z)
On The Ingredients of an Effective Zero-shot Semantic Parser [95.01623036661468]
我々は、標準発話とプログラムの訓練例を文法から言い換えて、ゼロショット学習を分析する。改良された文法,より強力なパラフレーズ,効率的な学習手法を用いて,これらのギャップを埋めることを提案する。我々のモデルはラベル付きデータゼロの2つの意味解析ベンチマーク(Scholar, Geo)で高い性能を達成する。
論文参考訳（メタデータ） (2021-10-15T21:41:16Z)
MASKER: Masked Keyword Regularization for Reliable Text Classification [73.90326322794803]
文脈に基づく予測を容易にする微調整手法であるマスク付きキーワード正規化(MASKER)を提案する。 maskerはモデルを規則化し、他の単語からキーワードを再構築し、十分な文脈なしに低信頼の予測を行う。分類精度を低下させることなくOOD検出とクロスドメインの一般化を改善したMASKERを提案する。
論文参考訳（メタデータ） (2020-12-17T04:54:16Z)
Words aren't enough, their order matters: On the Robustness of Grounding Visual Referring Expressions [87.33156149634392]
視覚的参照表現認識のための標準ベンチマークであるRefCOgを批判的に検討する。 83.7%のケースでは言語構造に関する推論は不要である。比較学習とマルチタスク学習の2つの手法を提案し,ViLBERTのロバスト性を高める。
論文参考訳（メタデータ） (2020-05-04T17:09:15Z)
Word Sense Disambiguation for 158 Languages using Word Embeddings Only [80.79437083582643]
文脈における単語感覚の曖昧さは人間にとって容易であるが、自動的アプローチでは大きな課題である。本稿では,学習前の標準単語埋め込みモデルを入力として,完全に学習した単語認識のインベントリを誘導する手法を提案する。この手法を用いて、158の言語に対して、事前訓練されたfastText単語の埋め込みに基づいて、センスインベントリのコレクションを誘導する。
論文参考訳（メタデータ） (2020-03-14T14:50:04Z)
Lexical Sememe Prediction using Dictionary Definitions by Capturing Local Semantic Correspondence [94.79912471702782]
セメムは人間の言語の最小の意味単位として定義されており、多くのNLPタスクで有用であることが証明されている。本稿では,このようなマッチングを捕捉し,セメムを予測できるセメム対応プールモデルを提案する。我々は,有名なSememe KB HowNetのモデルとベースライン手法を評価し,そのモデルが最先端のパフォーマンスを実現することを発見した。
論文参考訳（メタデータ） (2020-01-16T17:30:36Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。