論文の概要: Distantly-Supervised Joint Extraction with Noise-Robust Learning
- arxiv url: http://arxiv.org/abs/2310.04994v2
- Date: Sat, 25 May 2024 18:20:12 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-29 11:49:02.002614
- Title: Distantly-Supervised Joint Extraction with Noise-Robust Learning
- Title(参考訳): ノイズ・ロバスト学習による遠隔教師付き関節抽出
- Authors: Yufei Li, Xiao Yu, Yanghong Guo, Yanchi Liu, Haifeng Chen, Cong Liu,
- Abstract要約: 我々は、知識ベース(KB)を用いてエンティティの言及を対応するエンティティと関係タグに整合させることによりラベルを生成する遠隔ラベル付きデータにおける共同抽出の問題に焦点をあてる。
既存のアプローチは、ノイズの1つの源のみを考慮するか、外部知識を使って決定を行うかのどちらかであり、トレーニングデータにおいて重要な情報を十分に活用することはできない。
本稿では,軽量トランスフォーマーバックボーンを結合タグ付けのためのシーケンスラベリング方式に組み込んだ一般化可能なフレームワークDENRLを提案する。
- 参考スコア(独自算出の注目度): 36.23022433465051
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Joint entity and relation extraction is a process that identifies entity pairs and their relations using a single model. We focus on the problem of joint extraction in distantly-labeled data, whose labels are generated by aligning entity mentions with the corresponding entity and relation tags using a knowledge base (KB). One key challenge is the presence of noisy labels arising from both incorrect entity and relation annotations, which significantly impairs the quality of supervised learning. Existing approaches, either considering only one source of noise or making decisions using external knowledge, cannot well-utilize significant information in the training data. We propose DENRL, a generalizable framework that 1) incorporates a lightweight transformer backbone into a sequence labeling scheme for joint tagging, and 2) employs a noise-robust framework that regularizes the tagging model with significant relation patterns and entity-relation dependencies, then iteratively self-adapts to instances with less noise from both sources. Surprisingly, experiments on two benchmark datasets show that DENRL, using merely its own parametric distribution and simple data-driven heuristics, outperforms large language model-based baselines by a large margin with better interpretability.
- Abstract(参考訳): 結合エンティティと関係抽出は、一つのモデルを用いてエンティティペアとその関係を識別するプロセスである。
我々は,知識ベース(KB)を用いて,エンティティの言及を対応するエンティティと関係タグに整合させることによりラベルを生成する遠隔ラベル付きデータにおいて,共同抽出の問題に焦点をあてる。
重要な課題の1つは、誤ったエンティティと関係アノテーションの両方から生じるノイズラベルの存在であり、教師付き学習の質を著しく損なう。
既存のアプローチは、ノイズの1つの源のみを考慮するか、外部知識を使って決定を行うかのいずれかで、トレーニングデータにおいて重要な情報を十分に活用することはできない。
一般化可能なフレームワークであるDENRLを提案する。
1)軽量変圧器のバックボーンをジョイントタグ付けのためのシーケンスラベリング方式に組み込んで,
2.2では、大きな関係パターンとエンティティ-リレーショナル依存関係を持つタグ付けモデルを正規化して、両方のソースからのノイズが少ないインスタンスに反復的に自己適応するノイズロバストフレームワークを採用しています。
驚くべきことに、2つのベンチマークデータセットの実験では、DENRLは、単に独自のパラメトリック分布と単純なデータ駆動ヒューリスティックを使用して、大きな言語モデルベースのベースラインを大きなマージンで上回り、解釈可能性も向上している。
関連論文リスト
- Improving a Named Entity Recognizer Trained on Noisy Data with a Few
Clean Instances [55.37242480995541]
クリーンなインスタンスの小さなセットから,ノイズの多いNERデータを誘導することで,ノイズを発生させる手法を提案する。
メインのNERモデルとともに、判別器モデルをトレーニングし、その出力を使用してサンプルの重み付けを校正します。
クラウドソーシングと遠隔監視データセットの結果から,提案手法は少ないガイダンスセットで継続的に性能を向上させることができることが示された。
論文 参考訳(メタデータ) (2023-10-25T17:23:37Z) - Jointprop: Joint Semi-supervised Learning for Entity and Relation
Extraction with Heterogeneous Graph-based Propagation [13.418617500641401]
共同半教師付きエンティティと関係抽出のための不均一グラフに基づく伝搬フレームワークであるJointpropを提案する。
我々は、エンティティと関係候補から統一されたスパンベースのヘテロジニアスグラフを構築し、信頼度スコアに基づいてクラスラベルを伝搬する。
我々はNERおよびREタスクにおける最先端の半教師付きアプローチよりも優れた性能を示す。
論文 参考訳(メタデータ) (2023-05-25T09:07:04Z) - OneRel:Joint Entity and Relation Extraction with One Module in One Step [42.576188878294886]
統合エンティティと関係抽出は自然言語処理と知識グラフ構築において不可欠な課題である。
そこで我々は, 結合抽出を細粒度三重分類問題として用いた, OneRel という新しい結合実体と関係抽出モデルを提案する。
論文 参考訳(メタデータ) (2022-03-10T15:09:59Z) - SAIS: Supervising and Augmenting Intermediate Steps for Document-Level
Relation Extraction [51.27558374091491]
本稿では,関係抽出のための中間ステップ(SAIS)を監督し,拡張することにより,関連コンテキストやエンティティタイプをキャプチャするモデルを明示的に教えることを提案する。
そこで本提案手法は,より効果的な管理を行うため,より優れた品質の関係を抽出するだけでなく,それに対応する証拠をより正確に抽出する。
論文 参考訳(メタデータ) (2021-09-24T17:37:35Z) - Distantly-Supervised Named Entity Recognition with Noise-Robust Learning
and Language Model Augmented Self-Training [66.80558875393565]
遠距離ラベル付きデータのみを用いて、名前付きエンティティ認識(NER)モデルを訓練する際の課題について検討する。
本稿では,新しい損失関数と雑音ラベル除去ステップからなるノイズロスバスト学習手法を提案する。
提案手法は,既存の遠隔教師付きNERモデルよりも優れた性能を実現する。
論文 参考訳(メタデータ) (2021-09-10T17:19:56Z) - Element Intervention for Open Relation Extraction [27.408443348900057]
OpenREは、同じ基盤となる関係を参照する関係インスタンスをクラスタ化することを目的としている。
現在のOpenREモデルは、一般的に遠隔監視から生成されたデータセットに基づいてトレーニングされている。
本稿では,OpenREの手順を因果的観点から再考する。
論文 参考訳(メタデータ) (2021-06-17T14:37:13Z) - Cross-Supervised Joint-Event-Extraction with Heterogeneous Information
Networks [61.950353376870154]
Joint-event- Extractは、トリガとエンティティのタグからなるタグセットを備えたシーケンスからシーケンスまでのラベリングタスクである。
トリガやエンティティの抽出を交互に監督するクロススーパーバイザードメカニズム(CSM)を提案する。
我々の手法は、エンティティとトリガー抽出の両方において最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2020-10-13T11:51:17Z) - Clustering-based Unsupervised Generative Relation Extraction [3.342376225738321]
クラスタリングに基づく教師なし生成関係抽出フレームワーク(CURE)を提案する。
我々は「エンコーダ・デコーダ」アーキテクチャを用いて自己教師付き学習を行い、エンコーダが関係情報を抽出できるようにする。
我々のモデルは、ニューヨーク・タイムズ(NYT)と国連並列コーパス(UNPC)の標準データセットにおいて、最先端モデルよりも優れている。
論文 参考訳(メタデータ) (2020-09-26T20:36:40Z) - Relabel the Noise: Joint Extraction of Entities and Relations via
Cooperative Multiagents [52.55119217982361]
協調型マルチエージェント群を用いて,雑音の多いインスタンスを処理するための共同抽出手法を提案する。
ノイズの多いインスタンスをきめ細かな方法で処理するために、協調グループの各エージェントは、自身の視点で連続的な信頼スコアを算出してインスタンスを評価する。
信頼度コンセンサスモジュールは、すべてのエージェントの知恵を収集し、信頼度ラベル付きラベルでノイズの多いトレーニングセットを再分割するように設計されている。
論文 参考訳(メタデータ) (2020-04-21T12:03:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。