論文の概要: AutoTriggER: Label-Efficient and Robust Named Entity Recognition with
Auxiliary Trigger Extraction
- arxiv url: http://arxiv.org/abs/2109.04726v3
- Date: Thu, 18 May 2023 06:04:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-19 21:08:50.449962
- Title: AutoTriggER: Label-Efficient and Robust Named Entity Recognition with
Auxiliary Trigger Extraction
- Title(参考訳): AutoTriggER:補助トリガー抽出によるラベル効率とロバスト名称のエンティティ認識
- Authors: Dong-Ho Lee, Ravi Kiran Selvam, Sheikh Muhammad Sarwar, Bill Yuchen
Lin, Fred Morstatter, Jay Pujara, Elizabeth Boschee, James Allan and Xiang
Ren
- Abstract要約: 我々は,エンティティトリガの自動生成と活用によるNER性能向上のための新しいフレームワークを提案する。
筆者らのフレームワークは,ポストホックな説明を活用して合理的な知識を生成し,埋め込み手法を用いてモデルの事前知識を強化する。
AutoTriggERは強力なラベル効率を示し、目に見えないエンティティを一般化し、RoBERTa-CRFベースラインを平均0.5F1ポイント上回る性能を持つ。
- 参考スコア(独自算出の注目度): 54.20039200180071
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep neural models for named entity recognition (NER) have shown impressive
results in overcoming label scarcity and generalizing to unseen entities by
leveraging distant supervision and auxiliary information such as explanations.
However, the costs of acquiring such additional information are generally
prohibitive. In this paper, we present a novel two-stage framework
(AutoTriggER) to improve NER performance by automatically generating and
leveraging ``entity triggers'' which are human-readable cues in the text that
help guide the model to make better decisions. Our framework leverages post-hoc
explanation to generate rationales and strengthens a model's prior knowledge
using an embedding interpolation technique. This approach allows models to
exploit triggers to infer entity boundaries and types instead of solely
memorizing the entity words themselves. Through experiments on three
well-studied NER datasets, AutoTriggER shows strong label-efficiency, is
capable of generalizing to unseen entities, and outperforms the RoBERTa-CRF
baseline by nearly 0.5 F1 points on average.
- Abstract(参考訳): 名前付きエンティティ認識(ner)のための深層ニューラルネットワークは、ラベル不足を克服し、遠方の監督と説明などの補助情報を活用することで、未知のエンティティに一般化する素晴らしい結果を示している。
しかし、こうした追加情報を取得する費用は一般的に禁止されている。
本稿では,テキスト中の人間の読みやすい手がかりである '`entity triggers'' を自動生成し,活用することにより,NERの性能を向上させるための新しい2段階フレームワーク(AutoTriggER)を提案する。
本フレームワークは, 埋め込み補間手法を用いて, モデルに先行する知識を強化する。
このアプローチにより、モデルがトリガを利用してエンティティのバウンダリと型を推論することが可能になる。
3つのよく研究されたNERデータセットの実験を通じて、AutoTriggERは強力なラベル効率を示し、目に見えないエンティティに一般化でき、RoBERTa-CRFベースラインを平均0.5F1ポイント上回っている。
関連論文リスト
- Leveraging large language models for efficient representation learning for entity resolution [2.035773073690598]
TriBERTaは、エンティティマッチングのための表現を学習する教師付きエンティティ解決システムである。
提案手法は最先端の表現を3~19%のマージンで上回る。
論文 参考訳(メタデータ) (2024-11-15T23:24:07Z) - In-Context Learning for Few-Shot Nested Named Entity Recognition [53.55310639969833]
数発のネストネストNERの設定に有効で革新的なICLフレームワークを導入する。
我々は、新しい実演選択機構であるEnDe retrieverを考案し、ICLプロンプトを改善する。
EnDe検索では,意味的類似性,境界類似性,ラベル類似性という3種類の表現学習を行うために,コントラスト学習を用いる。
論文 参考訳(メタデータ) (2024-02-02T06:57:53Z) - A Confidence-based Partial Label Learning Model for Crowd-Annotated
Named Entity Recognition [74.79785063365289]
名前付きエンティティ認識(NER)のための既存のモデルは、主に大規模ラベル付きデータセットに基づいている。
我々は,クラウドアノテートNERに対する先行信頼度(アノテータによる提案)と後続信頼度(モデルによる学習)を統合するために,信頼に基づく部分ラベル学習(CPLL)手法を提案する。
論文 参考訳(メタデータ) (2023-05-21T15:31:23Z) - Gaussian Prior Reinforcement Learning for Nested Named Entity
Recognition [52.46740830977898]
GPRLと呼ばれる新しいSeq2seqモデルを提案し、ネストしたNERタスクをエンティティ三重項列生成プロセスとして定式化する。
3つのネストされたNERデータセットの実験では、GPRLが以前のネストされたNERモデルより優れていることが示されている。
論文 参考訳(メタデータ) (2023-05-12T05:55:34Z) - Multi-task Transformer with Relation-attention and Type-attention for
Named Entity Recognition [35.44123819012004]
名前付きエンティティ認識(NER)は自然言語処理において重要な研究課題である。
本稿では,エンティティ境界検出タスクを名前付きエンティティ認識タスクに組み込むマルチタスク変換器を提案する。
論文 参考訳(メタデータ) (2023-03-20T05:11:22Z) - Distantly-Supervised Named Entity Recognition with Noise-Robust Learning
and Language Model Augmented Self-Training [66.80558875393565]
遠距離ラベル付きデータのみを用いて、名前付きエンティティ認識(NER)モデルを訓練する際の課題について検討する。
本稿では,新しい損失関数と雑音ラベル除去ステップからなるノイズロスバスト学習手法を提案する。
提案手法は,既存の遠隔教師付きNERモデルよりも優れた性能を実現する。
論文 参考訳(メタデータ) (2021-09-10T17:19:56Z) - BOND: BERT-Assisted Open-Domain Named Entity Recognition with Distant
Supervision [49.42215511723874]
我々は,NERモデルの予測性能を改善するための新しい計算フレームワーク,BONDを提案する。
具体的には,2段階の学習アルゴリズムを提案する。第1段階では,遠隔ラベルを用いて,事前学習された言語モデルをNERタスクに適用する。
第2段階では,遠隔ラベルを廃止し,モデル性能をさらに向上するための自己学習手法を提案する。
論文 参考訳(メタデータ) (2020-06-28T04:55:39Z) - Named Entity Recognition without Labelled Data: A Weak Supervision
Approach [23.05371427663683]
本稿では,ラベル付きデータがない場合のNERモデルの学習方法を提案する。
このアプローチは、ターゲットドメインからテキストを自動的にアノテートするために、幅広いラベリング関数に依存している。
シーケンスラベリングモデルは、最終的にこの統一アノテーションに基づいて訓練することができる。
論文 参考訳(メタデータ) (2020-04-30T12:29:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。