論文の概要: Enhancing Label Consistency on Document-level Named Entity Recognition
- arxiv url: http://arxiv.org/abs/2210.12949v1
- Date: Mon, 24 Oct 2022 04:45:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-25 13:01:44.210239
- Title: Enhancing Label Consistency on Document-level Named Entity Recognition
- Title(参考訳): 文書レベルの名前付きエンティティ認識におけるラベル一貫性の強化
- Authors: Minbyul Jeong, Jaewoo Kang
- Abstract要約: 名前付きエンティティ認識(NER)は、バイオメディカル応用における文書から情報を抽出する基本的な部分である。
提案手法であるConNERは,修飾子(形容詞や前置詞など)のラベル依存性を高め,より高いラベルアグリーメントを実現する。
本手法の有効性を4つの生物医学的NERデータセットで実証した。
- 参考スコア(独自算出の注目度): 19.249781091058605
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Named entity recognition (NER) is a fundamental part of extracting
information from documents in biomedical applications. A notable advantage of
NER is its consistency in extracting biomedical entities in a document context.
Although existing document NER models show consistent predictions, they still
do not meet our expectations. We investigated whether the adjectives and
prepositions within an entity cause a low label consistency, which results in
inconsistent predictions. In this paper, we present our method, ConNER, which
enhances the label dependency of modifiers (e.g., adjectives and prepositions)
to achieve higher label agreement. ConNER refines the draft labels of the
modifiers to improve the output representations of biomedical entities. The
effectiveness of our method is demonstrated on four popular biomedical NER
datasets; in particular, its efficacy is proved on two datasets with 7.5-8.6%
absolute improvements in the F1 score. We interpret that our ConNER method is
effective on datasets that have intrinsically low label consistency. In the
qualitative analysis, we demonstrate how our approach makes the NER model
generate consistent predictions. Our code and resources are available at
https://github.com/dmis-lab/ConNER/.
- Abstract(参考訳): 名前付きエンティティ認識(NER)は、バイオメディカル応用における文書から情報を抽出する基本的な部分である。
NERの顕著な利点は、文書コンテキストで生体医学的実体を抽出する際の一貫性である。
既存の文書NERモデルは一貫性のある予測を示すが、それでも私たちの期待を満たさない。
エンティティ内の形容詞と前置詞がラベルの一貫性を低下させるかどうかを調査した。
本稿では,修飾子 (形容詞や前置詞など) のラベル依存性を高め,より高いラベル一致を実現する手法であるConNERを提案する。
ConNERは、バイオメディカルエンティティの出力表現を改善するために、修飾体のドラフトラベルを洗練する。
本手法の有効性は4つの生物医学的NERデータセットで実証され、特にF1スコアが7.5-8.6%向上した2つのデータセットで実証された。
我々は,本手法が本質的にラベル一貫性の低いデータセットに有効であることを解釈する。
定性解析では,NERモデルが一貫した予測を生成する方法を示す。
私たちのコードとリソースはhttps://github.com/dmis-lab/ConNER/で利用可能です。
関連論文リスト
- A Unified Label-Aware Contrastive Learning Framework for Few-Shot Named Entity Recognition [6.468625143772815]
ラベル認識型トークンレベルのコントラスト学習フレームワークを提案する。
提案手法は,ラベルのセマンティクスを接尾辞のプロンプトとして活用することでコンテキストを豊かにする。
コンテキストネイティブとコンテキストラベルの対比学習目標を同時に最適化する。
論文 参考訳(メタデータ) (2024-04-26T06:19:21Z) - Uncertainty Estimation on Sequential Labeling via Uncertainty Transmission [21.426225910784364]
NERタスクは、エンティティを抽出し、テキストが与えられたラベルを予測することを目的としている。
本研究は,NER予測の不確実性スコアを推定することを目的としたUE-NERに焦点を当てる。
抽出されたエンティティに対する不確実性スコアを推定するための逐次ラベル付け後ネットワーク(SLPN)を提案する。
論文 参考訳(メタデータ) (2023-11-15T06:36:29Z) - Injecting Categorical Labels and Syntactic Information into Biomedical
NER [28.91836510067532]
分類ラベルとPOS(Part-of-speech)情報をモデルに注入することで,生物医学的名前付きエンティティ認識(NER)を改善するための簡単なアプローチを提案する。
3つのベンチマークデータセットの実験では、分類ラベル情報を構文コンテキストに組み込むことは非常に有用であり、ベースラインBERTベースのモデルよりも優れていることが示されている。
論文 参考訳(メタデータ) (2023-11-06T14:03:59Z) - Named Entity Recognition via Machine Reading Comprehension: A Multi-Task
Learning Approach [50.12455129619845]
Named Entity Recognition (NER) は、テキスト内のエンティティの参照を事前に定義された型に抽出し、分類することを目的としている。
我々は,MRCベースのNERを改善するために,エンティティタイプ間のラベル依存性をマルチタスク学習フレームワークに組み込むことを提案する。
論文 参考訳(メタデータ) (2023-09-20T03:15:05Z) - A Confidence-based Partial Label Learning Model for Crowd-Annotated
Named Entity Recognition [74.79785063365289]
名前付きエンティティ認識(NER)のための既存のモデルは、主に大規模ラベル付きデータセットに基づいている。
我々は,クラウドアノテートNERに対する先行信頼度(アノテータによる提案)と後続信頼度(モデルによる学習)を統合するために,信頼に基づく部分ラベル学習(CPLL)手法を提案する。
論文 参考訳(メタデータ) (2023-05-21T15:31:23Z) - How to tackle an emerging topic? Combining strong and weak labels for
Covid news NER [90.90053968189156]
新型コロナウイルスニュースNERデータセット(COVIDNEWS-NER)について紹介する。
手書きの強ラベル付き文3000点と,弱ラベル付き文13,000点を自動生成する。
弱ラベルと強ラベルを併用したトレーニングの分析を行い,ConTROSTERのCOVIDNEWS-NERに対する効果を示す。
論文 参考訳(メタデータ) (2022-09-29T21:33:02Z) - Optimizing Bi-Encoder for Named Entity Recognition via Contrastive
Learning [80.36076044023581]
名前付きエンティティ認識(NER)のための効率的なバイエンコーダフレームワークを提案する。
我々はNERを、エンティティ参照のベクトル表現とその型との類似性を最大化する計量学習問題とみなす。
NERのこのバイエンコーダの定式化における大きな課題は、エンティティの言及から非エンゲージスを分離することにある。
論文 参考訳(メタデータ) (2022-08-30T23:19:04Z) - A Theory-Driven Self-Labeling Refinement Method for Contrastive
Representation Learning [111.05365744744437]
教師なしのコントラスト学習は、正のイメージの作物と、負のイメージの作物とをラベル付けする。
本研究は, コントラスト学習において, 不正確なラベル割り当てがセマンティック・インスタンス識別の一般化を著しく損なうことを最初に証明する。
この理論に触発されて、コントラスト学習のための新しい自己ラベル改善手法を提案する。
論文 参考訳(メタデータ) (2021-06-28T14:24:52Z) - Named Entity Recognition with Small Strongly Labeled and Large Weakly
Labeled Data [37.980010197914105]
弱監視は、名前付きエンティティ認識(NER)など、多くの自然言語処理タスクにおいて有望な結果を示している。
本稿では,弱ラベル補完,雑音認識損失関数,強ラベル付きデータに対する最終微調整という,3つの重要な要素を持つ多段階計算フレームワークNEEDLEを提案する。
NEEDLEは、弱いラベルのノイズを効果的に抑制し、既存の手法より優れていることを示す。
論文 参考訳(メタデータ) (2021-06-16T17:18:14Z) - Exploiting Global Contextual Information for Document-level Named Entity
Recognition [46.99922251839363]
我々は、GCDoc(Global Context enhanced Document-level NER)と呼ばれるモデルを提案する。
単語レベルでは、文書グラフは単語間のより広範な依存関係をモデル化するために構築される。
文レベルでは、単一文を超えてより広い文脈を適切にモデル化するために、横断文モジュールを用いる。
我々のモデルは、CoNLL 2003データセットで92.22(BERTで93.40)、Ontonotes 5.0データセットで88.32(BERTで90.49)のスコアに達した。
論文 参考訳(メタデータ) (2021-06-02T01:52:07Z) - Validating Label Consistency in NER Data Annotation [34.24378200299595]
本研究では,ラベル(in-)一貫性とNERモデル性能の関係を検討する経験的手法を提案する。
実験では,SCIERCおよびCoNLL03データセットにおけるテストデータのラベルの不整合を同定した。
論文 参考訳(メタデータ) (2021-01-21T16:19:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。