論文の概要: Distantly-Supervised Joint Entity and Relation Extraction with
Noise-Robust Learning
- arxiv url: http://arxiv.org/abs/2310.04994v1
- Date: Sun, 8 Oct 2023 03:42:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-12 13:48:52.273720
- Title: Distantly-Supervised Joint Entity and Relation Extraction with
Noise-Robust Learning
- Title(参考訳): 遠隔教師付きジョイントエンティティとノイズロバスト学習による関係抽出
- Authors: Yufei Li, Xiao Yu, Yanghong Guo, Yanchi Liu, Haifeng Chen, Cong Liu
- Abstract要約: 結合エンティティと関係抽出は、一つのモデルを用いてエンティティペアとその関係を識別するプロセスである。
本稿では,テキストコーパス内のエンティティの言及と,それに対応するエンティティや関係型を知識ベースで整列させることによって生成する,遠隔ラベル付きデータに基づいてこれらのモデルをトレーニングする問題に焦点をあてる。
1)事前学習したGPT-2を同時エンティティと関係検出のためのシーケンスタギングスキームに組み込み,2)有意関係パターンと実体の両方との不整合性を罰する新たな損失関数を含むノイズロバスト学習フレームワークを導入する,という新しいノイズロバストアプローチを提案する。
- 参考スコア(独自算出の注目度): 38.39011891497543
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Joint entity and relation extraction is a process that identifies entity
pairs and their relations using a single model. We focus on the problem of
training these models on distantly-labeled data, which is generated by aligning
entity mentions in a text corpus with their corresponding entity and relation
types in a knowledge base. One key challenge here is the presence of noisy
labels, which arises from both entity and relation annotations, and
significantly impair the effectiveness of supervised learning applications.
However, existing research primarily addresses only one type of noise, thereby
limiting the effectiveness of noise reduction. To fill this gap, we introduce a
new noise-robust approach, that 1)~incorporates a pre-trained GPT-2 into a
sequence tagging scheme for simultaneous entity and relation detection, and
2)~employs a noise-robust learning framework which includes a new loss function
that penalizes inconsistency with both significant relation patterns and
entity-relation dependencies, as well as a self-adaptive learning step that
iteratively selects and trains on high-quality instances. Experiments on two
datasets show that our method outperforms the existing state-of-the-art methods
in both joint extraction performance and noise reduction effect.
- Abstract(参考訳): 結合エンティティと関係抽出は、一つのモデルを用いてエンティティペアとその関係を識別するプロセスである。
テキストコーパス内のエンティティ参照と対応するエンティティと、知識ベースにおける関係型を整合させることによって生成される、遠方ラベル付きデータにこれらのモデルをトレーニングする問題に焦点を当てる。
ここでの1つの重要な課題は、エンティティと関係アノテーションの両方から生じるノイズの多いラベルの存在であり、教師付き学習アプリケーションの有効性を著しく損なう。
しかし、既存の研究は主に1種類のノイズのみに対処し、ノイズ低減の有効性を制限している。
このギャップを埋めるために、(1)事前学習したGPT-2を同時エンティティと関係検出のためのシーケンスタギングスキームに組み込むこと、(2)重要な関係パターンとエンティティ-リレーショナル依存関係の両方に一貫性を付与する新しい損失関数を含むノイズ-ロバスト学習フレームワークを導入すること、および、高品質なインスタンスを反復的に選択し訓練する自己適応学習ステップを導入することを提案する。
2つのデータセットに対する実験により,本手法は,関節抽出性能と雑音低減効果の両方において,既存の最先端手法よりも優れていた。
関連論文リスト
- Improving a Named Entity Recognizer Trained on Noisy Data with a Few
Clean Instances [55.37242480995541]
クリーンなインスタンスの小さなセットから,ノイズの多いNERデータを誘導することで,ノイズを発生させる手法を提案する。
メインのNERモデルとともに、判別器モデルをトレーニングし、その出力を使用してサンプルの重み付けを校正します。
クラウドソーシングと遠隔監視データセットの結果から,提案手法は少ないガイダンスセットで継続的に性能を向上させることができることが示された。
論文 参考訳(メタデータ) (2023-10-25T17:23:37Z) - Jointprop: Joint Semi-supervised Learning for Entity and Relation
Extraction with Heterogeneous Graph-based Propagation [13.418617500641401]
共同半教師付きエンティティと関係抽出のための不均一グラフに基づく伝搬フレームワークであるJointpropを提案する。
我々は、エンティティと関係候補から統一されたスパンベースのヘテロジニアスグラフを構築し、信頼度スコアに基づいてクラスラベルを伝搬する。
我々はNERおよびREタスクにおける最先端の半教師付きアプローチよりも優れた性能を示す。
論文 参考訳(メタデータ) (2023-05-25T09:07:04Z) - OneRel:Joint Entity and Relation Extraction with One Module in One Step [42.576188878294886]
統合エンティティと関係抽出は自然言語処理と知識グラフ構築において不可欠な課題である。
そこで我々は, 結合抽出を細粒度三重分類問題として用いた, OneRel という新しい結合実体と関係抽出モデルを提案する。
論文 参考訳(メタデータ) (2022-03-10T15:09:59Z) - SAIS: Supervising and Augmenting Intermediate Steps for Document-Level
Relation Extraction [51.27558374091491]
本稿では,関係抽出のための中間ステップ(SAIS)を監督し,拡張することにより,関連コンテキストやエンティティタイプをキャプチャするモデルを明示的に教えることを提案する。
そこで本提案手法は,より効果的な管理を行うため,より優れた品質の関係を抽出するだけでなく,それに対応する証拠をより正確に抽出する。
論文 参考訳(メタデータ) (2021-09-24T17:37:35Z) - Distantly-Supervised Named Entity Recognition with Noise-Robust Learning
and Language Model Augmented Self-Training [66.80558875393565]
遠距離ラベル付きデータのみを用いて、名前付きエンティティ認識(NER)モデルを訓練する際の課題について検討する。
本稿では,新しい損失関数と雑音ラベル除去ステップからなるノイズロスバスト学習手法を提案する。
提案手法は,既存の遠隔教師付きNERモデルよりも優れた性能を実現する。
論文 参考訳(メタデータ) (2021-09-10T17:19:56Z) - Element Intervention for Open Relation Extraction [27.408443348900057]
OpenREは、同じ基盤となる関係を参照する関係インスタンスをクラスタ化することを目的としている。
現在のOpenREモデルは、一般的に遠隔監視から生成されたデータセットに基づいてトレーニングされている。
本稿では,OpenREの手順を因果的観点から再考する。
論文 参考訳(メタデータ) (2021-06-17T14:37:13Z) - Cross-Supervised Joint-Event-Extraction with Heterogeneous Information
Networks [61.950353376870154]
Joint-event- Extractは、トリガとエンティティのタグからなるタグセットを備えたシーケンスからシーケンスまでのラベリングタスクである。
トリガやエンティティの抽出を交互に監督するクロススーパーバイザードメカニズム(CSM)を提案する。
我々の手法は、エンティティとトリガー抽出の両方において最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2020-10-13T11:51:17Z) - Clustering-based Unsupervised Generative Relation Extraction [3.342376225738321]
クラスタリングに基づく教師なし生成関係抽出フレームワーク(CURE)を提案する。
我々は「エンコーダ・デコーダ」アーキテクチャを用いて自己教師付き学習を行い、エンコーダが関係情報を抽出できるようにする。
我々のモデルは、ニューヨーク・タイムズ(NYT)と国連並列コーパス(UNPC)の標準データセットにおいて、最先端モデルよりも優れている。
論文 参考訳(メタデータ) (2020-09-26T20:36:40Z) - Relabel the Noise: Joint Extraction of Entities and Relations via
Cooperative Multiagents [52.55119217982361]
協調型マルチエージェント群を用いて,雑音の多いインスタンスを処理するための共同抽出手法を提案する。
ノイズの多いインスタンスをきめ細かな方法で処理するために、協調グループの各エージェントは、自身の視点で連続的な信頼スコアを算出してインスタンスを評価する。
信頼度コンセンサスモジュールは、すべてのエージェントの知恵を収集し、信頼度ラベル付きラベルでノイズの多いトレーニングセットを再分割するように設計されている。
論文 参考訳(メタデータ) (2020-04-21T12:03:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。