論文の概要: PAI at SemEval-2023 Task 2: A Universal System for Named Entity
Recognition with External Entity Information
- arxiv url: http://arxiv.org/abs/2305.06099v1
- Date: Wed, 10 May 2023 12:40:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-11 13:22:46.219374
- Title: PAI at SemEval-2023 Task 2: A Universal System for Named Entity
Recognition with External Entity Information
- Title(参考訳): PAI at SemEval-2023 Task 2: A Universal System for Named Entity Recognition with external Entity Information
- Authors: Long Ma, Kai Lu, Tianbo Che, Hailong Huang, Weiguo Gao, Xuan Li
- Abstract要約: MultiCoNER IIタスクは、低コンテキストの状況やノイズのシナリオにおいて、複雑であいまいできめ細かな名前のエンティティを検出することを目的としている。
本システムは,あるテキストの知識ベース(例えばWikipedia)からプロパティを持つエンティティを検索し,入力文でエンティティ情報を検索し,Transformerベースのモデルに入力する。
- 参考スコア(独自算出の注目度): 19.995198769980345
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The MultiCoNER II task aims to detect complex, ambiguous, and fine-grained
named entities in low-context situations and noisy scenarios like the presence
of spelling mistakes and typos for multiple languages. The task poses
significant challenges due to the scarcity of contextual information, the high
granularity of the entities(up to 33 classes), and the interference of noisy
data. To address these issues, our team {\bf PAI} proposes a universal Named
Entity Recognition (NER) system that integrates external entity information to
improve performance. Specifically, our system retrieves entities with
properties from the knowledge base (i.e. Wikipedia) for a given text, then
concatenates entity information with the input sentence and feeds it into
Transformer-based models. Finally, our system wins 2 first places, 4 second
places, and 1 third place out of 13 tracks. The code is publicly available at
\url{https://github.com/diqiuzhuanzhuan/semeval-2023}.
- Abstract(参考訳): MultiCoNER IIタスクは、スペルミスの存在や複数の言語に対するタイプミスといった、低コンテキストの状況やノイズの多いシナリオにおいて、複雑で曖昧できめ細かな名前のエンティティを検出することを目的としている。
このタスクは、コンテキスト情報の不足、エンティティ(最大33クラス)の粒度の高さ、ノイズの多いデータの干渉など、重大な課題を提起する。
これらの問題に対処するため、我々のチームは、外部エンティティ情報を統合してパフォーマンスを向上させる、ユニバーサルな名前付きエンティティ認識(NER)システムを提案する。
具体的には、与えられたテキストの知識ベース(例えばウィキペディア)からプロパティを持つエンティティを検索し、入力文とエンティティ情報を結合し、Transformerベースのモデルに入力する。
最後に、私たちのシステムは、13トラックのうち2つの第1位、第2位、第3位を勝ち取ります。
コードは \url{https://github.com/diqiuzhuanzhuan/semeval-2023} で公開されている。
関連論文リスト
- DIVKNOWQA: Assessing the Reasoning Ability of LLMs via Open-Domain
Question Answering over Knowledge Base and Text [73.68051228972024]
大きな言語モデル(LLM)は印象的な生成能力を示すが、内部知識に依存すると幻覚に悩まされる。
検索拡張LDMは、外部知識においてLLMを基盤とする潜在的な解決策として出現している。
論文 参考訳(メタデータ) (2023-10-31T04:37:57Z) - DAMO-NLP at SemEval-2023 Task 2: A Unified Retrieval-augmented System
for Multilingual Named Entity Recognition [94.90258603217008]
MultiCoNER RNum2共有タスクは、細粒度でノイズの多いシナリオにおいて、多言語の名前付きエンティティ認識(NER)に取り組むことを目的としている。
MultiCoNER RNum1の以前のトップシステムは、ナレッジベースまたはガゼッタを組み込んでいる。
細粒度多言語NERのための統一検索拡張システム(U-RaNER)を提案する。
論文 参考訳(メタデータ) (2023-05-05T16:59:26Z) - IXA/Cogcomp at SemEval-2023 Task 2: Context-enriched Multilingual Named
Entity Recognition using Knowledge Bases [53.054598423181844]
3つのステップからなる新しいNERカスケードアプローチを提案する。
我々は、細粒度および新興物質を正確に分類する上で、外部知識基盤の重要性を実証的に示す。
本システムは,低リソース言語設定においても,マルチコネラ2共有タスクにおいて頑健な性能を示す。
論文 参考訳(メタデータ) (2023-04-20T20:30:34Z) - DAMO-NLP at NLPCC-2022 Task 2: Knowledge Enhanced Robust NER for Speech
Entity Linking [32.915297772110364]
Speech Entity Linkingは、音声言語で名前付きエンティティを認識し、曖昧にすることを目的としている。
従来の方法では、未発の音声スタイルや、ASRシステムによって生成されるノイズの多い書き起こしに悩まされる。
本稿では,認知段階における適切な知識を無痛に取り入れることによる堅牢性向上に焦点を当てた知名強化エンティティ認識(KENER)を提案する。
NLPCC-2022共有タスク2のトラック2におけるトラック1とトラック2の1位を達成した。
論文 参考訳(メタデータ) (2022-09-27T06:43:56Z) - UM6P-CS at SemEval-2022 Task 11: Enhancing Multilingual and Code-Mixed
Complex Named Entity Recognition via Pseudo Labels using Multilingual
Transformer [7.270980742378389]
提案手法を多言語複合名前認識(MultiCoNER)共有タスクに導入する。
我々は,多言語変換器 XLM-RoBERTa が提供する文脈化表現を頼りに,多言語およびコード混合クエリの複雑な NER にアプローチする。
提案システムは多言語とコード混在したMultiCoNERのトラックにおいて,それぞれ6位と8位にランクされている。
論文 参考訳(メタデータ) (2022-04-28T14:07:06Z) - DAMO-NLP at SemEval-2022 Task 11: A Knowledge-based System for
Multilingual Named Entity Recognition [94.1865071914727]
MultiCoNERは、複数の言語に対する短文と低文設定で意味的に曖昧な名前のエンティティを検出することを目的としている。
我々のチームDAMO-NLPは知識に基づくシステムを提案し、ウィキペディアに基づく多言語知識ベースを構築する。
入力文が与えられた場合,本システムは知識ベースから関連コンテキストを効果的に検索する。
我々のシステムはMultiCoNER共有タスクで13トラック中10トラックを獲得した。
論文 参考訳(メタデータ) (2022-03-01T15:29:35Z) - MobIE: A German Dataset for Named Entity Recognition, Entity Linking and
Relation Extraction in the Mobility Domain [76.21775236904185]
データセットは3,232のソーシャルメディアテキストと91Kトークンによるトラフィックレポートで構成され、20.5Kアノテーション付きエンティティを含んでいる。
データセットのサブセットには,7つのモビリティ関連,n-ary関係型がアノテートされている。
私たちの知る限りでは、NER、EL、REのアノテーションを組み合わせた最初のドイツ語データセットです。
論文 参考訳(メタデータ) (2021-08-16T08:21:50Z) - KGSynNet: A Novel Entity Synonyms Discovery Framework with Knowledge
Graph [23.053995137917994]
emphKGSynNetという新しいエンティティ同義語発見フレームワークを提案する。
具体的には、大規模なドメイン固有コーパスを用いて、参照やエンティティのサブワード埋め込みを事前訓練する。
固有設計のエンフュージョンゲートを用いて、エンティティの知識情報をセマンティックな特徴に適応的に吸収する。
論文 参考訳(メタデータ) (2021-03-16T07:32:33Z) - Autoregressive Entity Retrieval [55.38027440347138]
エンティティは、知識の表現と集約の方法の中心にあります。
クエリが与えられたエンティティを検索できることは、エンティティリンクやオープンドメインの質問応答のような知識集約的なタスクに基本となる。
本稿では,自己回帰方式でトークン・バイ・トークンを左から右に生成し,エンティティを検索する最初のシステムであるGENREを提案する。
論文 参考訳(メタデータ) (2020-10-02T10:13:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。