論文の概要: Improve Event Extraction via Self-Training with Gradient Guidance
- arxiv url: http://arxiv.org/abs/2205.12490v1
- Date: Wed, 25 May 2022 04:40:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-28 16:13:04.819751
- Title: Improve Event Extraction via Self-Training with Gradient Guidance
- Title(参考訳): 勾配誘導による自己学習によるイベント抽出の改善
- Authors: Zhiyang Xu, Lifu Huang
- Abstract要約: 本稿では,イベント抽出のための勾配誘導(STGG)フレームワークを提案する。
1)既存のイベントアノテーションに基づいてトレーニングされたベースイベント抽出モデルと,次に大規模未ラベルコーパスに適用して新しいイベント参照を予測するベースイベント抽出モデルと,(2)予測されたイベントトリガと引数,および抽象的意味表現グラフのパスを抽出するスコアリングモデルから構成される。
我々の実験分析によると、STGGはどんな基本イベント抽出モデルにも適用可能な汎用フレームワークであり、高品質なAMRグラフアノテーションが利用できない場合でも、広範囲なラベルのないデータを活用することで性能を向上させることができる。
- 参考スコア(独自算出の注目度): 9.972323083618562
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Data scarcity and imbalance have been the main factors that hinder the
progress of event extraction (EE). In this work, we propose a self-training
with gradient guidance (STGG) framework which consists of (1) a base event
extraction model which is firstly trained on existing event annotations and
then applied to large-scale unlabeled corpora to predict new event mentions,
and (2) a scoring model that takes in each predicted event trigger and argument
as well as their path in the Abstract Meaning Representation (AMR) graph to
estimate a probability score indicating the correctness of the event
prediction. The new event predictions along with their correctness scores are
then used as pseudo labeled examples to improve the base event extraction model
while the magnitude and direction of its gradients are guided by the
correctness scores. Experimental results on three benchmark datasets, including
ACE05-E, ACE05-E+ and ERE-EN, demonstrate the effectiveness of the STGG
framework on event extraction task with up to 1.9 F-score improvement over the
base event extraction models. Our experimental analysis further shows that STGG
is a general framework as it can be applied to any base event extraction models
and improve their performance by leveraging broad unlabeled data, even when the
high-quality AMR graph annotations are not available.
- Abstract(参考訳): データ不足と不均衡は、イベント抽出(EE)の進行を妨げる主要な要因である。
In this work, we propose a self-training with gradient guidance (STGG) framework which consists of (1) a base event extraction model which is firstly trained on existing event annotations and then applied to large-scale unlabeled corpora to predict new event mentions, and (2) a scoring model that takes in each predicted event trigger and argument as well as their path in the Abstract Meaning Representation (AMR) graph to estimate a probability score indicating the correctness of the event prediction.
次に、新しい事象予測とその補正度スコアを擬似ラベル付き例として、その勾配の大きさと方向を補正度で導出しながら、基本事象抽出モデルを改善する。
ACE05-E、ACE05-E+、ERE-ENを含む3つのベンチマークデータセットの実験結果は、ベースイベント抽出モデルよりも最大1.9Fスコア改善されたイベント抽出タスクにおけるSTGGフレームワークの有効性を示す。
実験分析により,高品質なamrグラフアノテーションが利用できない場合でも,stggは任意の基本イベント抽出モデルに適用でき,広範なラベルなしデータを活用することで性能を向上させる汎用フレームワークであることが示された。
関連論文リスト
- Weak Reward Model Transforms Generative Models into Robust Causal Event Extraction Systems [17.10762463903638]
我々は人的評価を近似するために評価モデルを訓練し、高い合意を得る。
そこで本研究では,アノテートデータの一部を用いて評価モデルを訓練する弱強監督手法を提案する。
論文 参考訳(メタデータ) (2024-06-26T10:48:14Z) - Self-Training with Pseudo-Label Scorer for Aspect Sentiment Quad Prediction [54.23208041792073]
Aspect Sentiment Quad Prediction (ASQP) は、与えられたレビューに対して全てのクワッド(アスペクト項、アスペクトカテゴリー、意見項、感情極性)を予測することを目的としている。
ASQPタスクにおける重要な課題はラベル付きデータの不足であり、既存のメソッドのパフォーマンスを制限している。
そこで我々は,擬似ラベルスコアラーを用いた自己学習フレームワークを提案し,レビューと擬似ラベルの一致をスコアラーが評価する。
論文 参考訳(メタデータ) (2024-06-26T05:30:21Z) - TRIAGE: Characterizing and auditing training data for improved
regression [80.11415390605215]
TRIAGEは回帰タスクに適した新しいデータキャラクタリゼーションフレームワークで、広範囲の回帰器と互換性がある。
TRIAGEは、共形予測分布を利用して、モデルに依存しないスコアリング方法、TRIAGEスコアを提供する。
TRIAGEの特徴は一貫性があり、複数の回帰設定においてデータの彫刻/フィルタリングによるパフォーマンス向上に有効であることを示す。
論文 参考訳(メタデータ) (2023-10-29T10:31:59Z) - Exploring the Limits of Historical Information for Temporal Knowledge
Graph Extrapolation [59.417443739208146]
本稿では,歴史的コントラスト学習の新しい学習枠組みに基づくイベント予測モデルを提案する。
CENETは、最も潜在的なエンティティを識別するために、歴史的および非歴史的依存関係の両方を学ぶ。
提案したモデルを5つのベンチマークグラフで評価する。
論文 参考訳(メタデータ) (2023-08-29T03:26:38Z) - Leveraging Instance Features for Label Aggregation in Programmatic Weak
Supervision [75.1860418333995]
Programmatic Weak Supervision (PWS) は、トレーニングラベルを効率的に合成するための広く普及したパラダイムとして登場した。
PWSのコアコンポーネントはラベルモデルであり、複数のノイズ管理ソースの出力をラベル関数として集約することで、真のラベルを推論する。
既存の統計ラベルモデルは一般的にLFの出力のみに依存し、基礎となる生成過程をモデル化する際のインスタンスの特徴を無視している。
論文 参考訳(メタデータ) (2022-10-06T07:28:53Z) - CEP3: Community Event Prediction with Neural Point Process on Graph [59.434777403325604]
グラフニューラルネットワークとマーク付き時間点プロセス(MTPP)を組み合わせた新しいモデルを提案する。
実験では,モデルの精度と訓練効率の両面から,モデルの優れた性能を実証した。
論文 参考訳(メタデータ) (2022-05-21T15:30:25Z) - ERGO: Event Relational Graph Transformer for Document-level Event
Causality Identification [24.894074201193927]
イベントレベルのイベント因果同定(DECI)は、文書内のイベントペア間の因果関係を特定することを目的としている。
DeCIのための新しいグラフトランスフォーマー(ERGO)フレームワークを提案する。
論文 参考訳(メタデータ) (2022-04-15T12:12:16Z) - Behind the Scenes: An Exploration of Trigger Biases Problem in Few-Shot
Event Classification [24.598938900747186]
FSEC(Few-Shot Event Classification)は、アノテーション付きデータに制限のある新しいイベントタイプに一般化可能な、イベント予測モデルの開発を目標としている。
既存のFSECモデルは、トリガーワードとターゲットイベントタイプの間の統計的均一性を示すトリガーバイアスに悩まされている。
FSECモデルにおけるコンテキストバイパス問題に対処するために、敵の訓練とトリガー再構成技術を導入する。
論文 参考訳(メタデータ) (2021-08-29T13:46:42Z) - WSSOD: A New Pipeline for Weakly- and Semi-Supervised Object Detection [75.80075054706079]
弱機能および半教師付きオブジェクト検出フレームワーク(WSSOD)を提案する。
エージェント検出器は、まず関節データセット上でトレーニングされ、弱注釈画像上で擬似境界ボックスを予測するために使用される。
提案フレームワークはPASCAL-VOC と MSCOCO のベンチマークで顕著な性能を示し,完全教師付き環境で得られたものと同等の性能を達成している。
論文 参考訳(メタデータ) (2021-05-21T11:58:50Z) - Back to Prior Knowledge: Joint Event Causality Extraction via
Convolutional Semantic Infusion [5.566928318239452]
複合イベントと因果関係抽出は,情報検索とデータマイニングにおいて極めて重要な課題である。
共同抽出フレームワーク内で長さの異なる n-gram の頻繁な窓に対する畳み込み知識注入を提案する。
我々のモデルは強力なBERT+CSNNベースラインをはるかに上回る。
論文 参考訳(メタデータ) (2021-02-19T13:31:46Z) - Few-Shot Event Detection with Prototypical Amortized Conditional Random
Field [8.782210889586837]
イベント検出は、いくつかのサンプルで新しいイベントタイプを認識する必要がある場合、苦労する傾向がある。
本稿では,タスクを2部タグ付け方式で複数ショットタグ付け問題に変換する統一結合モデルを提案する。
ベンチマークデータセットFewEventで実験を行い、実験結果から、タグ付けに基づく手法は既存のパイプラインやジョイントラーニング手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2020-12-04T01:11:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。