論文の概要: An Unsupervised Language-Independent Entity Disambiguation Method and
its Evaluation on the English and Persian Languages
- arxiv url: http://arxiv.org/abs/2102.00395v1
- Date: Sun, 31 Jan 2021 06:41:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-02 17:03:20.768736
- Title: An Unsupervised Language-Independent Entity Disambiguation Method and
its Evaluation on the English and Persian Languages
- Title(参考訳): 教師なし言語非依存エンティティ曖昧化法とその英語・ペルシア語に対する評価
- Authors: Majid Asgari-Bidhendi, Behrooz Janfada, Amir Havangi, Sayyed Ali
Hossayni, Behrouz Minaei-Bidgoli
- Abstract要約: Unsupervised Language-Independent Entity Disambiguation (ULIED)は、名前付きエンティティを曖昧にリンクするための新しいアプローチである。
異なる英語エンティティリンクデータセット上でのULIEDの評価と、利用可能な唯一のペルシアのデータセットは、ほとんどのケースにおいて、ULIEDが最先端の教師なし多言語アプローチよりも優れていることを示している。
- 参考スコア(独自算出の注目度): 3.8498574327875943
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Entity Linking is one of the essential tasks of information extraction and
natural language understanding. Entity linking mainly consists of two tasks:
recognition and disambiguation of named entities. Most studies address these
two tasks separately or focus only on one of them. Moreover, most of the
state-of-the -art entity linking algorithms are either supervised, which have
poor performance in the absence of annotated corpora or language-dependent,
which are not appropriate for multi-lingual applications. In this paper, we
introduce an Unsupervised Language-Independent Entity Disambiguation (ULIED),
which utilizes a novel approach to disambiguate and link named entities.
Evaluation of ULIED on different English entity linking datasets as well as the
only available Persian dataset illustrates that ULIED in most of the cases
outperforms the state-of-the-art unsupervised multi-lingual approaches.
- Abstract(参考訳): エンティティリンクは、情報抽出と自然言語理解の重要なタスクの1つです。
エンティティリンクは主に、名前付きエンティティの認識と曖昧さの2つのタスクから構成される。
ほとんどの研究は、これらの2つのタスクを別々に扱うか、どちらか一方に集中する。
さらに、最先端エンティティリンクアルゴリズムのほとんどは教師付きであり、アノテーション付きコーパスや言語に依存しない性能は低いが、多言語アプリケーションには適さない。
本稿では、名前付きエンティティの曖昧化とリンクのための新しいアプローチである、Unsupervised Language-Independent Entity Disambiguation (ULIED)を紹介する。
データセットをリンクする異なる英語のエンティティ上でのULIEDの評価と利用可能な唯一のペルシャデータセットは、ほとんどの場合、ULIEDが最先端の教師なし多言語アプローチを上回っていることを示しています。
関連論文リスト
- mCL-NER: Cross-Lingual Named Entity Recognition via Multi-view
Contrastive Learning [54.523172171533645]
CrossNERは多言語コーパスの不足により不均一な性能から生じる課題に直面している。
言語横断的名前付きエンティティ認識(mCL-NER)のためのマルチビューコントラスト学習を提案する。
40言語にまたがるXTREMEベンチマーク実験では、従来のデータ駆動型およびモデルベースアプローチよりもmCL-NERの方が優れていることを示した。
論文 参考訳(メタデータ) (2023-08-17T16:02:29Z) - Extracting Multi-valued Relations from Language Models [36.944060044138304]
我々は, 潜在言語表現を解析し, 実体化された多目的関係知識を得る可能性について検討する。
候補オブジェクトのランク付けには,既存のプロンプト技術を評価し,ドメイン知識を取り入れた新しい手法を提案する。
選択法のうち、学習された関係性特異しきい値よりも高い確率で対象を選択すると、49.5%のF1スコアが得られる。
論文 参考訳(メタデータ) (2023-07-06T16:48:32Z) - We're Afraid Language Models Aren't Modeling Ambiguity [136.8068419824318]
あいまいさの管理は人間の言語理解の重要な部分です。
文中のあいまいさは,他の文との係り受け関係に与える影響によって特徴付けられる。
我々は,多ラベルNLIモデルが曖昧さによって誤解を招く野生の政治的主張にフラグを付けることができることを示す。
論文 参考訳(メタデータ) (2023-04-27T17:57:58Z) - IXA/Cogcomp at SemEval-2023 Task 2: Context-enriched Multilingual Named
Entity Recognition using Knowledge Bases [53.054598423181844]
3つのステップからなる新しいNERカスケードアプローチを提案する。
我々は、細粒度および新興物質を正確に分類する上で、外部知識基盤の重要性を実証的に示す。
本システムは,低リソース言語設定においても,マルチコネラ2共有タスクにおいて頑健な性能を示す。
論文 参考訳(メタデータ) (2023-04-20T20:30:34Z) - Multilingual Entity and Relation Extraction from Unified to
Language-specific Training [29.778332361215636]
エンティティと関係抽出タスクの既存のアプローチは、主に英語のコーパスに焦点を当て、他の言語を無視している。
言語干渉を軽減するために,2段階の多言語学習手法と,Multilingual Entity and Relation extract framework (mERE) と呼ばれるジョイントモデルを提案する。
本手法はモノリンガル法と多言語ベースライン法の両方に優れる。
論文 参考訳(メタデータ) (2023-01-11T12:26:53Z) - Multilingual Word Sense Disambiguation with Unified Sense Representation [55.3061179361177]
本稿では,知識と教師付き多言語単語センス曖昧化(MWSD)システムを提案する。
我々は複数の言語に統一されたセンス表現を構築し、リッチソース言語から貧しい言語へアノテーションを転送することでMWSDのアノテーション不足問題に対処する。
SemEval-13およびSemEval-15データセットの評価により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2022-10-14T01:24:03Z) - EASE: Entity-Aware Contrastive Learning of Sentence Embedding [37.7055989762122]
EASEは文とその関連エンティティ間の対照的な学習を通して文の埋め込みを学習する新しい方法である。
EASEは英語のセマンティックテキスト類似性(STS)と短いテキストクラスタリング(STC)タスクにおいて、競合的あるいはより良いパフォーマンスを示す。
論文 参考訳(メタデータ) (2022-05-09T13:22:44Z) - Improving Entity Linking through Semantic Reinforced Entity Embeddings [16.868791358905916]
そこで本稿では, コンテキスト共通性の学習を容易にするため, 実体埋め込みに微粒な意味情報を注入する手法を提案する。
エンティティの埋め込みに基づいて、エンティティリンクにおける最先端のパフォーマンスを新たに達成しました。
論文 参考訳(メタデータ) (2021-06-16T00:27:56Z) - AM2iCo: Evaluating Word Meaning in Context across Low-ResourceLanguages
with Adversarial Examples [51.048234591165155]
本稿では, AM2iCo, Adversarial and Multilingual Meaning in Contextを提案する。
言語間文脈における単語の意味の同一性を理解するために、最先端(SotA)表現モデルを忠実に評価することを目的としている。
その結果、現在のSotAプリトレーニングエンコーダは人間のパフォーマンスにかなり遅れていることが明らかとなった。
論文 参考訳(メタデータ) (2021-04-17T20:23:45Z) - ERICA: Improving Entity and Relation Understanding for Pre-trained
Language Models via Contrastive Learning [97.10875695679499]
そこで本研究では, ERICA という新たなコントラスト学習フレームワークを提案し, エンティティとその関係をテキストでより深く理解する。
実験の結果,提案する erica フレームワークは文書レベルの言語理解タスクにおいて一貫した改善を実現することがわかった。
論文 参考訳(メタデータ) (2020-12-30T03:35:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。