論文の概要: Injecting Categorical Labels and Syntactic Information into Biomedical
NER
- arxiv url: http://arxiv.org/abs/2311.03113v1
- Date: Mon, 6 Nov 2023 14:03:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-07 14:10:58.003795
- Title: Injecting Categorical Labels and Syntactic Information into Biomedical
NER
- Title(参考訳): バイオメディカルNERにカテゴリラベルと構文情報を注入する
- Authors: Sumam Francis, Marie-Francine Moens
- Abstract要約: 分類ラベルとPOS(Part-of-speech)情報をモデルに注入することで,生物医学的名前付きエンティティ認識(NER)を改善するための簡単なアプローチを提案する。
3つのベンチマークデータセットの実験では、分類ラベル情報を構文コンテキストに組み込むことは非常に有用であり、ベースラインBERTベースのモデルよりも優れていることが示されている。
- 参考スコア(独自算出の注目度): 28.91836510067532
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a simple approach to improve biomedical named entity recognition
(NER) by injecting categorical labels and Part-of-speech (POS) information into
the model. We use two approaches, in the first approach, we first train a
sequence-level classifier to classify the sentences into categories to obtain
the sentence-level tags (categorical labels). The sequence classifier is
modeled as an entailment problem by modifying the labels as a natural language
template. This helps to improve the accuracy of the classifier. Further, this
label information is injected into the NER model. In this paper, we demonstrate
effective ways to represent and inject these labels and POS attributes into the
NER model. In the second approach, we jointly learn the categorical labels and
NER labels. Here we also inject the POS tags into the model to increase the
syntactic context of the model. Experiments on three benchmark datasets show
that incorporating categorical label information with syntactic context is
quite useful and outperforms baseline BERT-based models.
- Abstract(参考訳): 分類ラベルとPOS(Part-of-speech)情報をモデルに注入することで,生物医学的名前付きエンティティ認識(NER)を改善するための簡単なアプローチを提案する。
最初のアプローチでは、まずシーケンスレベルの分類器を訓練して、文をカテゴリに分類し、文レベルのタグ(カテゴリラベル)を得る。
シーケンス分類器は、ラベルを自然言語テンプレートとして変更することにより、補足問題としてモデル化される。
これにより、分類器の精度が向上する。
さらに、このラベル情報をNERモデルに注入する。
本稿では,これらのラベルとPOS属性をNERモデルに効果的に表現し,注入する方法を示す。
第2のアプローチでは,分類ラベルとNERラベルを共同で学習する。
ここでは、POSタグをモデルに注入し、モデルの構文的コンテキストを増大させます。
3つのベンチマークデータセットの実験により、分類ラベル情報を構文コンテキストに組み込むことは非常に有用であり、ベースラインBERTベースのモデルよりも優れていることが示された。
関連論文リスト
- Posterior Label Smoothing for Node Classification [2.737276507021477]
本稿では,トランスダクティブノード分類タスクに対して,単純かつ効果的なラベル平滑化を提案する。
本研究では, ソフトラベルを設計し, 周辺ラベル分布を通じて対象ノードの局所的コンテキストをカプセル化する。
以下の分析結果から,大域的なラベル統計を後続計算に組み込むことが,ラベル平滑化の成功の鍵であることが判明した。
論文 参考訳(メタデータ) (2024-06-01T11:59:49Z) - Description-Enhanced Label Embedding Contrastive Learning for Text
Classification [65.01077813330559]
モデル学習プロセスにおける自己監督型学習(SSL)と新しい自己監督型関係関係(R2)分類タスクの設計
テキスト分類とR2分類を最適化対象として扱うテキスト分類のための関係学習ネットワーク(R2-Net)の関係について検討する。
ラベルセマンティックラーニングのためのマルチアスペクト記述を得るためのWordNetからの外部知識。
論文 参考訳(メタデータ) (2023-06-15T02:19:34Z) - Bridging the Gap between Model Explanations in Partially Annotated
Multi-label Classification [85.76130799062379]
偽陰性ラベルがモデルの説明にどのように影響するかを考察する。
本稿では,部分ラベルで学習したモデルの属性スコアを向上し,その説明をフルラベルで学習したモデルと類似させる。
論文 参考訳(メタデータ) (2023-04-04T14:00:59Z) - Ground Truth Inference for Weakly Supervised Entity Matching [76.6732856489872]
弱監督タスクのための単純だが強力なラベル付けモデルを提案する。
次に、エンティティマッチングのタスクに特化してラベルモデルを調整します。
その結果,従来の手法よりもF1スコアが9%高い結果が得られた。
論文 参考訳(メタデータ) (2022-11-13T17:57:07Z) - Enhancing Label Consistency on Document-level Named Entity Recognition [19.249781091058605]
名前付きエンティティ認識(NER)は、バイオメディカル応用における文書から情報を抽出する基本的な部分である。
提案手法であるConNERは,修飾子(形容詞や前置詞など)のラベル依存性を高め,より高いラベルアグリーメントを実現する。
本手法の有効性を4つの生物医学的NERデータセットで実証した。
論文 参考訳(メタデータ) (2022-10-24T04:45:17Z) - Optimizing Bi-Encoder for Named Entity Recognition via Contrastive
Learning [80.36076044023581]
名前付きエンティティ認識(NER)のための効率的なバイエンコーダフレームワークを提案する。
我々はNERを、エンティティ参照のベクトル表現とその型との類似性を最大化する計量学習問題とみなす。
NERのこのバイエンコーダの定式化における大きな課題は、エンティティの言及から非エンゲージスを分離することにある。
論文 参考訳(メタデータ) (2022-08-30T23:19:04Z) - Binary Classification with Positive Labeling Sources [71.37692084951355]
WEAPOは、負のラベル付け源を使わずにトレーニングラベルを作成するための、シンプルで競争力のあるWS手法である。
We show WEAPO achieve the highest averaged performance on 10 benchmark datasets。
論文 参考訳(メタデータ) (2022-08-02T19:32:08Z) - Label Semantics for Few Shot Named Entity Recognition [68.01364012546402]
名前付きエンティティ認識におけるショットラーニングの問題について検討する。
我々は,ラベル名中の意味情報を,モデルに付加的な信号を与え,よりリッチな事前情報を与える手段として活用する。
本モデルは,第1エンコーダによって計算された名前付きエンティティの表現と,第2エンコーダによって計算されたラベル表現とを一致させることを学習する。
論文 参考訳(メタデータ) (2022-03-16T23:21:05Z) - A Unified Generative Adversarial Network Training via Self-Labeling and
Self-Attention [38.31735499785227]
本稿では,任意のレベルのラベリングを統一的に処理できる新しいGANトレーニング手法を提案する。
提案手法では,手動で定義したラベルを組み込むことができる人工ラベル方式を導入する。
我々は, CIFAR-10, STL-10, SVHNに対するアプローチを評価し, 自己ラベルと自己アテンションの両方が生成データの品質を継続的に向上することを示す。
論文 参考訳(メタデータ) (2021-06-18T04:40:26Z) - Improving Pretrained Models for Zero-shot Multi-label Text
Classification through Reinforced Label Hierarchy Reasoning [18.531022315325583]
ラベル階層の探索は、ゼロショットのマルチラベルテキスト分類問題に取り組むための有望なアプローチとなっている。
トレーニング中の階層内のラベル間の相互依存性を促進するために,RLHR(Reinforced Label Hierarchy Reasoning)アプローチを提案する。
論文 参考訳(メタデータ) (2021-04-04T19:14:09Z) - Label Confusion Learning to Enhance Text Classification Models [3.0251266104313643]
ラベル混乱モデル(lcm)はラベル間の意味的重複を捉えるためにラベル混乱を学習する。
lcmは、元のホットラベルベクトルを置き換えるより優れたラベル分布を生成することができる。
5つのテキスト分類ベンチマークデータセットの実験により、広く使われているディープラーニング分類モデルに対するLCMの有効性が明らかにされた。
論文 参考訳(メタデータ) (2020-12-09T11:34:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。