論文の概要: Distantly-Supervised Joint Entity and Relation Extraction with
Noise-Robust Learning
- arxiv url: http://arxiv.org/abs/2310.04994v1
- Date: Sun, 8 Oct 2023 03:42:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-12 13:48:52.273720
- Title: Distantly-Supervised Joint Entity and Relation Extraction with
Noise-Robust Learning
- Title(参考訳): 遠隔教師付きジョイントエンティティとノイズロバスト学習による関係抽出
- Authors: Yufei Li, Xiao Yu, Yanghong Guo, Yanchi Liu, Haifeng Chen, Cong Liu
- Abstract要約: 結合エンティティと関係抽出は、一つのモデルを用いてエンティティペアとその関係を識別するプロセスである。
本稿では,テキストコーパス内のエンティティの言及と,それに対応するエンティティや関係型を知識ベースで整列させることによって生成する,遠隔ラベル付きデータに基づいてこれらのモデルをトレーニングする問題に焦点をあてる。
1)事前学習したGPT-2を同時エンティティと関係検出のためのシーケンスタギングスキームに組み込み,2)有意関係パターンと実体の両方との不整合性を罰する新たな損失関数を含むノイズロバスト学習フレームワークを導入する,という新しいノイズロバストアプローチを提案する。
- 参考スコア(独自算出の注目度): 38.39011891497543
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Joint entity and relation extraction is a process that identifies entity
pairs and their relations using a single model. We focus on the problem of
training these models on distantly-labeled data, which is generated by aligning
entity mentions in a text corpus with their corresponding entity and relation
types in a knowledge base. One key challenge here is the presence of noisy
labels, which arises from both entity and relation annotations, and
significantly impair the effectiveness of supervised learning applications.
However, existing research primarily addresses only one type of noise, thereby
limiting the effectiveness of noise reduction. To fill this gap, we introduce a
new noise-robust approach, that 1)~incorporates a pre-trained GPT-2 into a
sequence tagging scheme for simultaneous entity and relation detection, and
2)~employs a noise-robust learning framework which includes a new loss function
that penalizes inconsistency with both significant relation patterns and
entity-relation dependencies, as well as a self-adaptive learning step that
iteratively selects and trains on high-quality instances. Experiments on two
datasets show that our method outperforms the existing state-of-the-art methods
in both joint extraction performance and noise reduction effect.
- Abstract(参考訳): 結合エンティティと関係抽出は、一つのモデルを用いてエンティティペアとその関係を識別するプロセスである。
テキストコーパス内のエンティティ参照と対応するエンティティと、知識ベースにおける関係型を整合させることによって生成される、遠方ラベル付きデータにこれらのモデルをトレーニングする問題に焦点を当てる。
ここでの1つの重要な課題は、エンティティと関係アノテーションの両方から生じるノイズの多いラベルの存在であり、教師付き学習アプリケーションの有効性を著しく損なう。
しかし、既存の研究は主に1種類のノイズのみに対処し、ノイズ低減の有効性を制限している。
このギャップを埋めるために、(1)事前学習したGPT-2を同時エンティティと関係検出のためのシーケンスタギングスキームに組み込むこと、(2)重要な関係パターンとエンティティ-リレーショナル依存関係の両方に一貫性を付与する新しい損失関数を含むノイズ-ロバスト学習フレームワークを導入すること、および、高品質なインスタンスを反復的に選択し訓練する自己適応学習ステップを導入することを提案する。
2つのデータセットに対する実験により,本手法は,関節抽出性能と雑音低減効果の両方において,既存の最先端手法よりも優れていた。
関連論文リスト
- The Battleship Approach to the Low Resource Entity Matching Problem [0.0]
本稿では,エンティティマッチング問題に対する新しいアクティブな学習手法を提案する。
我々は、エンティティマッチングのユニークな特性を利用する選択メカニズムに焦点を当てる。
実験により,提案アルゴリズムは,最先端のアクティブ・ラーニング・ソリューションより低リソース・エンティティ・マッチングに優れることを示した。
論文 参考訳(メタデータ) (2023-11-27T10:18:17Z) - Fine tuning Pre trained Models for Robustness Under Noisy Labels [34.68018860186995]
トレーニングデータセットにノイズの多いラベルが存在することは、機械学習モデルのパフォーマンスに大きな影響を及ぼす可能性がある。
我々は、事前学習されたモデルの事前知識を頑健かつ効率的に伝達するTURNと呼ばれる新しいアルゴリズムを導入する。
論文 参考訳(メタデータ) (2023-10-24T20:28:59Z) - FECANet: Boosting Few-Shot Semantic Segmentation with Feature-Enhanced
Context-Aware Network [48.912196729711624]
Few-shot セマンティックセグメンテーション(Few-shot semantic segmentation)は、新しいクラスの各ピクセルを、わずかに注釈付きサポートイメージで検索するタスクである。
本稿では,クラス間の類似性に起因するマッチングノイズを抑制するために,機能拡張コンテキスト認識ネットワーク(FECANet)を提案する。
さらに,前景と背景の余分な対応関係を符号化する新たな相関再構成モジュールを提案する。
論文 参考訳(メタデータ) (2023-01-19T16:31:13Z) - Improving the Robustness of Summarization Models by Detecting and
Removing Input Noise [50.27105057899601]
本研究では,様々な種類の入力ノイズから,様々なデータセットやモデルサイズに対する性能損失を定量化する大規模な実験的検討を行った。
本稿では,モデル推論中の入力中のそのようなノイズを検出し,除去するための軽量な手法を提案する。
論文 参考訳(メタデータ) (2022-12-20T00:33:11Z) - Noise-Tolerant Learning for Audio-Visual Action Recognition [31.641972732424463]
ビデオデータセットは通常、粗い注釈付きまたはインターネットから収集される。
本稿では,雑音ラベルと雑音対応の両方に対して,反干渉モデルパラメータを求めるための耐雑音性学習フレームワークを提案する。
本手法は,動作認識モデルのロバスト性を大幅に向上し,ベースラインをクリアマージンで越える。
論文 参考訳(メタデータ) (2022-05-16T12:14:03Z) - Improving Distantly-Supervised Named Entity Recognition with
Self-Collaborative Denoising Learning [9.747173655999427]
SCDL(Self-Collaborative Denoising Learning)という,堅牢な学習パラダイムを提案する。
SCDLは、2つの教師学生ネットワークを相互に便宜的に訓練し、ノイズの多いラベル精製を反復的に行う。
5つの実世界のデータセットに対する大規模な実験結果から、SCDLは最先端のDS-NER復調法よりも優れていることが示された。
論文 参考訳(メタデータ) (2021-10-09T01:45:03Z) - Distantly-Supervised Named Entity Recognition with Noise-Robust Learning
and Language Model Augmented Self-Training [66.80558875393565]
遠距離ラベル付きデータのみを用いて、名前付きエンティティ認識(NER)モデルを訓練する際の課題について検討する。
本稿では,新しい損失関数と雑音ラベル除去ステップからなるノイズロスバスト学習手法を提案する。
提案手法は,既存の遠隔教師付きNERモデルよりも優れた性能を実現する。
論文 参考訳(メタデータ) (2021-09-10T17:19:56Z) - Cross-Supervised Joint-Event-Extraction with Heterogeneous Information
Networks [61.950353376870154]
Joint-event- Extractは、トリガとエンティティのタグからなるタグセットを備えたシーケンスからシーケンスまでのラベリングタスクである。
トリガやエンティティの抽出を交互に監督するクロススーパーバイザードメカニズム(CSM)を提案する。
我々の手法は、エンティティとトリガー抽出の両方において最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2020-10-13T11:51:17Z) - Relabel the Noise: Joint Extraction of Entities and Relations via
Cooperative Multiagents [52.55119217982361]
協調型マルチエージェント群を用いて,雑音の多いインスタンスを処理するための共同抽出手法を提案する。
ノイズの多いインスタンスをきめ細かな方法で処理するために、協調グループの各エージェントは、自身の視点で連続的な信頼スコアを算出してインスタンスを評価する。
信頼度コンセンサスモジュールは、すべてのエージェントの知恵を収集し、信頼度ラベル付きラベルでノイズの多いトレーニングセットを再分割するように設計されている。
論文 参考訳(メタデータ) (2020-04-21T12:03:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。