論文の概要: Self-Adaptive Named Entity Recognition by Retrieving Unstructured
Knowledge
- arxiv url: http://arxiv.org/abs/2210.07523v1
- Date: Fri, 14 Oct 2022 05:10:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-17 16:24:56.941435
- Title: Self-Adaptive Named Entity Recognition by Retrieving Unstructured
Knowledge
- Title(参考訳): 非構造化知識の検索による自己適応型名前付きエンティティ認識
- Authors: Kosuke Nishida, Naoki Yoshinaga, Kyosuke Nishida
- Abstract要約: そこで本研究では,非構造化テキストから外部知識を抽出し,学習されていないエンティティの使い方を学習する自己適応型NERを提案する。
NERの有用な知識を検索するために、不確実なエンティティをクエリとして利用し、非構造化知識を検索する効果的な2段階モデルを設計する。
我々のモデルは、強いNERBERTベースラインを平均2.45ポイント上回る。
- 参考スコア(独自算出の注目度): 18.22663662693528
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Although named entity recognition (NER) helps us to extract various
domain-specific entities from text (e.g., artists in the music domain), it is
costly to create a large amount of training data or a structured knowledge base
to perform accurate NER in the target domain. Here, we propose self-adaptive
NER, where the model retrieves the external knowledge from unstructured text to
learn the usage of entities that has not been learned well. To retrieve useful
knowledge for NER, we design an effective two-stage model that retrieves
unstructured knowledge using uncertain entities as queries. Our model first
predicts the entities in the input and then finds the entities of which the
prediction is not confident. Then, our model retrieves knowledge by using these
uncertain entities as queries and concatenates the retrieved text to the
original input to revise the prediction. Experiments on CrossNER datasets
demonstrated that our model outperforms the strong NERBERT baseline by 2.45
points on average.
- Abstract(参考訳): 名前付きエンティティ認識(NER)はテキスト(例えば音楽領域のアーティスト)から様々なドメイン固有のエンティティを抽出するのに役立つが、ターゲットドメインで正確なNERを実行するための大量のトレーニングデータや構造化知識ベースを作成するのに費用がかかる。
そこで本研究では,非構造化テキストから外部知識を抽出し,未学習のエンティティの使い方を学習する自己適応型NERを提案する。
NERの有用な知識を検索するために、不確実なエンティティをクエリとして利用し、非構造化知識を検索する効果的な2段階モデルを設計する。
我々のモデルはまず入力中のエンティティを予測し、次にその予測が信頼できないエンティティを見つける。
そして、これらの不確定なエンティティをクエリとして使用して知識を検索し、検索したテキストを元の入力に結合して予測を改訂する。
CrossNERデータセットの実験では、我々のモデルは強いNERBERTベースラインを平均2.45ポイント上回った。
関連論文リスト
- Learning Robust Named Entity Recognizers From Noisy Data With Retrieval Augmentation [67.89838237013078]
名前付きエンティティ認識(NER)モデルは、しばしばノイズの多い入力に悩まされる。
ノイズの多いテキストとそのNERラベルのみを利用できる、より現実的な設定を提案する。
我々は、推論中にテキストを取得することなく、堅牢なNERを改善するマルチビュートレーニングフレームワークを採用している。
論文 参考訳(メタデータ) (2024-07-26T07:30:41Z) - ProgGen: Generating Named Entity Recognition Datasets Step-by-step with Self-Reflexive Large Language Models [25.68491572293656]
大規模言語モデルは、名前付きエンティティ認識のような構造化された知識抽出タスクにおいて不足する。
本稿では,より優れたNERデータセットを生成するため,LCMを質素なNER能力で活用するための革新的で費用効率のよい戦略について検討する。
論文 参考訳(メタデータ) (2024-03-17T06:12:43Z) - Knowledge Graphs and Pre-trained Language Models enhanced Representation Learning for Conversational Recommender Systems [58.561904356651276]
本稿では,対話型推薦システムのためのエンティティの意味理解を改善するために,知識強化型エンティティ表現学習(KERL)フレームワークを紹介する。
KERLは知識グラフと事前訓練された言語モデルを使用して、エンティティの意味的理解を改善する。
KERLはレコメンデーションとレスポンス生成の両方のタスクで最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-12-18T06:41:23Z) - Dynamic Named Entity Recognition [5.9401550252715865]
動的名前付きエンティティ認識(DNER)という新しいタスクを紹介します。
DNERは、コンテキストを利用してエンティティを抽出するアルゴリズムの能力を評価するためのフレームワークを提供する。
本稿では,本課題に関連する課題と研究軸を反映したベースラインモデルと実験結果について述べる。
論文 参考訳(メタデータ) (2023-02-16T15:50:02Z) - T-NER: An All-Round Python Library for Transformer-based Named Entity
Recognition [9.928025283928282]
T-NERは、NER LMファインタニング用のPythonライブラリである。
9つのパブリックなNERデータセットを統一されたフォーマットにコンパイルすることで、ライブラリの可能性を示す。
将来の研究を容易にするため、Hugging Faceモデルハブを通じてLMチェックポイントをすべてリリースしています。
論文 参考訳(メタデータ) (2022-09-09T15:00:38Z) - Nested Named Entity Recognition as Holistic Structure Parsing [92.8397338250383]
本研究は,文中の全入れ子NEを全体構造としてモデル化し,全体構造解析アルゴリズムを提案する。
実験により、我々のモデルは、最先端にアプローチしたり、あるいは達成したりするような、広く使われているベンチマークで有望な結果が得られることが示された。
論文 参考訳(メタデータ) (2022-04-17T12:48:20Z) - MINER: Improving Out-of-Vocabulary Named Entity Recognition from an
Information Theoretic Perspective [57.19660234992812]
NERモデルは標準のNERベンチマークで有望な性能を達成した。
近年の研究では、従来のアプローチはエンティティ参照情報に過度に依存し、OoV(out-of-vocabulary)エンティティ認識の性能が劣っていることが示されている。
我々は、情報理論の観点からこの問題を改善するための新しいNER学習フレームワークであるMINERを提案する。
論文 参考訳(メタデータ) (2022-04-09T05:18:20Z) - Knowledge Enhanced Fine-Tuning for Better Handling Unseen Entities in
Dialogue Generation [33.806361531386685]
1)マスキングされた単語を解釈し,その文脈からマスキングされたエンティティの意味を推測する,2)コンテキストに基づいてエンティティのハイパーネムを予測する,ハイパーネム生成という2つの補助的訓練目標を導入する。
2つの対話コーパスの実験結果から,本手法の有効性を,利用可能な知識と利用できない設定の両方で検証した。
論文 参考訳(メタデータ) (2021-09-12T11:13:19Z) - AutoTriggER: Label-Efficient and Robust Named Entity Recognition with
Auxiliary Trigger Extraction [54.20039200180071]
我々は,エンティティトリガの自動生成と活用によるNER性能向上のための新しいフレームワークを提案する。
筆者らのフレームワークは,ポストホックな説明を活用して合理的な知識を生成し,埋め込み手法を用いてモデルの事前知識を強化する。
AutoTriggERは強力なラベル効率を示し、目に見えないエンティティを一般化し、RoBERTa-CRFベースラインを平均0.5F1ポイント上回る性能を持つ。
論文 参考訳(メタデータ) (2021-09-10T08:11:56Z) - Interpretable and Low-Resource Entity Matching via Decoupling Feature
Learning from Decision Making [22.755892575582788]
Entity Matchingは、同じ現実世界のオブジェクトを表すエンティティレコードを認識することを目的としている。
異種情報融合(HIF)とキー属性ツリー(KAT)誘導からなる新しいEMフレームワークを提案する。
提案手法は効率が高く,ほとんどの場合SOTA EMモデルより優れている。
論文 参考訳(メタデータ) (2021-06-08T08:27:31Z) - Interpretability Analysis for Named Entity Recognition to Understand
System Predictions and How They Can Improve [49.878051587667244]
名前付きエンティティ認識のためのLSTM-CRFアーキテクチャの性能について検討する。
文脈表現はシステムの性能に寄与するが、ハイパフォーマンスを駆動する主な要因は、名前トークン自体を学習することにある。
我々は、コンテキストのみからエンティティタイプを推測する可能性を評価するために、人間アノテーションを登録し、コンテキストのみのシステムによるエラーの大部分に対してエンティティタイプを推論することはできないが、改善の余地はいくつかある。
論文 参考訳(メタデータ) (2020-04-09T14:37:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。