論文の概要: Semi-automatic WordNet Linking using Word Embeddings
- arxiv url: http://arxiv.org/abs/2201.01747v1
- Date: Wed, 5 Jan 2022 18:15:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-06 14:31:58.178215
- Title: Semi-automatic WordNet Linking using Word Embeddings
- Title(参考訳): 単語埋め込みを用いた半自動ワードネットリンク
- Authors: Kevin Patel, Diptesh Kanojia, Pushpak Bhattacharyya
- Abstract要約: リンクされたワードネットは、異なる言語のワードネットで同様の概念をリンクするワードネットの拡張である。
本稿では,ワードネットをリンクする手法を提案する。ソースコードのシンセセットが与えられた場合,候補候補シンセセットのランクリストを返す。
我々の手法は、すべての合成集合の60%と名詞の合成集合の70%で上位10位の合成集合を検索することができる。
- 参考スコア(独自算出の注目度): 33.15250956247636
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Wordnets are rich lexico-semantic resources. Linked wordnets are extensions
of wordnets, which link similar concepts in wordnets of different languages.
Such resources are extremely useful in many Natural Language Processing (NLP)
applications, primarily those based on knowledge-based approaches. In such
approaches, these resources are considered as gold standard/oracle. Thus, it is
crucial that these resources hold correct information. Thereby, they are
created by human experts. However, manual maintenance of such resources is a
tedious and costly affair. Thus techniques that can aid the experts are
desirable. In this paper, we propose an approach to link wordnets. Given a
synset of the source language, the approach returns a ranked list of potential
candidate synsets in the target language from which the human expert can choose
the correct one(s). Our technique is able to retrieve a winner synset in the
top 10 ranked list for 60% of all synsets and 70% of noun synsets.
- Abstract(参考訳): ワードネットは豊富なレキシコ・セマンティクス資源である。
linked wordnets は wordnet の拡張であり、異なる言語の wordnet で同様の概念をリンクする。
このようなリソースは多くの自然言語処理(NLP)アプリケーションで非常に有用であり、主に知識に基づくアプローチに基づいている。
このようなアプローチでは、これらのリソースはゴールドスタンダード/オラクルとみなされる。
したがって、これらの資源が正しい情報を持っていることが重要である。
したがって、人間の専門家によって創造される。
しかし、こうした資源を手動で管理するのは面倒で費用がかかる。
したがって、専門家を助ける技術が望ましい。
本稿では,ワードネットをリンクする手法を提案する。
ソース言語のシンセットが与えられると、このアプローチは、人間の専門家が正しいシンセットを選択できるターゲット言語における潜在的なシンセットのランクリストを返す。
本手法は,全シンセットの60%と名詞シンセットの70%で上位10位にランクインした勝者シンセットを検索できる。
関連論文リスト
- Automatically constructing Wordnet synsets [2.363388546004777]
本稿では,資源に富む言語と資源に乏しい言語に対して,Wordnetシンセセットを生成する手法を提案する。
提案アルゴリズムは,既存のWordnetの構文を対象言語Tに翻訳し,翻訳候補にランク付け手法を適用してTで最良の翻訳を見つける。
論文 参考訳(メタデータ) (2022-08-08T02:02:18Z) - Towards Automatic Construction of Filipino WordNet: Word Sense Induction
and Synset Induction Using Sentence Embeddings [0.7214142393172727]
本研究では,2つの言語資源のみを用いた単語知覚誘導と合成誘導の手法を提案する。
結果として得られる感覚のインベントリとシノニムセットは、ワードネットを自動生成するのに使用することができる。
本研究は、誘導された単語感覚の30%が有効であり、誘導された合成セットの40%が新規な合成セットであることを示す。
論文 参考訳(メタデータ) (2022-04-07T06:50:37Z) - Expanding Pretrained Models to Thousands More Languages via
Lexicon-based Adaptation [133.7313847857935]
我々の研究は、NLPメソッドが現在の技術で不足している何千もの言語にどのように適応できるかを強調した。
3つのタスクにまたがる19の非表現言語に対して、我々の手法は、それぞれ追加のモノリンガルテキストによる最大5点と15点の改善をもたらす。
論文 参考訳(メタデータ) (2022-03-17T16:48:22Z) - Indian Language Wordnets and their Linkages with Princeton WordNet [38.50911435531732]
Princeton WordNetにリンクした18の言語ワードネットのマッピングをリリースする。
このようなリソースの入手は、これらの言語におけるNLPの進歩に直接的な影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-01-09T10:12:31Z) - Multilingual Irony Detection with Dependency Syntax and Neural Models [61.32653485523036]
これは構文知識からの貢献に焦点を当て、普遍依存スキームに従って構文が注釈付けされた言語資源を活用する。
その結果, 依存性をベースとした微粒な構文情報は, アイロンの検出に有用であることが示唆された。
論文 参考訳(メタデータ) (2020-11-11T11:22:05Z) - Computational linguistic assessment of textbook and online learning
media by means of threshold concepts in business education [59.003956312175795]
言語学的観点では、しきい値の概念は特別な語彙の例であり、特定の言語的特徴を示す。
ビジネス教育における63のしきい値の概念のプロファイルは、教科書、新聞、ウィキペディアで調査されている。
3種類のリソースは、しきい値の概念のプロファイルから区別できる。
論文 参考訳(メタデータ) (2020-08-05T12:56:16Z) - An Algorithm for Fuzzification of WordNets, Supported by a Mathematical
Proof [3.684688928766659]
任意の言語のWLDのファジィバージョンを構築するアルゴリズムを提案する。
英語WordNet(FWN)のファジフィケーション版をオンラインで公開する。
論文 参考訳(メタデータ) (2020-06-07T04:47:40Z) - Word Sense Disambiguation for 158 Languages using Word Embeddings Only [80.79437083582643]
文脈における単語感覚の曖昧さは人間にとって容易であるが、自動的アプローチでは大きな課題である。
本稿では,学習前の標準単語埋め込みモデルを入力として,完全に学習した単語認識のインベントリを誘導する手法を提案する。
この手法を用いて、158の言語に対して、事前訓練されたfastText単語の埋め込みに基づいて、センスインベントリのコレクションを誘導する。
論文 参考訳(メタデータ) (2020-03-14T14:50:04Z) - Automatic Compilation of Resources for Academic Writing and Evaluating
with Informal Word Identification and Paraphrasing System [24.42822218256954]
学術書記のためのリソースを自動構築する最初の手法を提案する。
目的は、テキストを自動的に編集し、学術的な文章のスタイルに忠実な文章作成支援システムを構築することである。
論文 参考訳(メタデータ) (2020-03-05T22:55:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。