論文の概要: Improve Event Extraction via Self-Training with Gradient Guidance
- arxiv url: http://arxiv.org/abs/2205.12490v2
- Date: Wed, 2 Aug 2023 06:21:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-03 15:17:26.927586
- Title: Improve Event Extraction via Self-Training with Gradient Guidance
- Title(参考訳): 勾配誘導による自己学習によるイベント抽出の改善
- Authors: Zhiyang Xu, Jay-Yoon Lee, Lifu Huang
- Abstract要約: 本稿では、イベント抽出の進行を妨げる主な要因を克服するために、フィードバックによる自己評価(STF)フレームワークを提案する。
STFは,(1)既存のイベントアノテーションに基づいてトレーニングされたベースイベント抽出モデルと,(2)新しいイベント参照を擬似トレーニングサンプルとして予測するための大規模未ラベルコーパスと,(2)新しいイベントトリガ,引数,引数ロール,およびAMRグラフ内のそれらのパスを用いて互換性スコアを推定する新たなスコアリングモデルから構成される。
ACE05-E、ACE05-E+、EREを含む3つのベンチマークデータセットの実験結果
- 参考スコア(独自算出の注目度): 10.618929821822892
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Data scarcity has been the main factor that hinders the progress of event
extraction. To overcome this issue, we propose a Self-Training with Feedback
(STF) framework that leverages the large-scale unlabeled data and acquires
feedback for each new event prediction from the unlabeled data by comparing it
to the Abstract Meaning Representation (AMR) graph of the same sentence.
Specifically, STF consists of (1) a base event extraction model trained on
existing event annotations and then applied to large-scale unlabeled corpora to
predict new event mentions as pseudo training samples, and (2) a novel scoring
model that takes in each new predicted event trigger, an argument, its argument
role, as well as their paths in the AMR graph to estimate a compatibility score
indicating the correctness of the pseudo label. The compatibility scores
further act as feedback to encourage or discourage the model learning on the
pseudo labels during self-training. Experimental results on three benchmark
datasets, including ACE05-E, ACE05-E+, and ERE, demonstrate the effectiveness
of the STF framework on event extraction, especially event argument extraction,
with significant performance gain over the base event extraction models and
strong baselines. Our experimental analysis further shows that STF is a generic
framework as it can be applied to improve most, if not all, event extraction
models by leveraging large-scale unlabeled data, even when high-quality AMR
graph annotations are not available.
- Abstract(参考訳): データ不足は、イベント抽出の進行を妨げる主要な要因である。
この問題を克服するために,大規模な未ラベルデータを利用した自己学習型フィードバック(STF)フレームワークを提案し,同じ文の抽象的意味表現(AMR)グラフと比較することにより,ラベルのないデータから新たなイベント予測に対するフィードバックを得る。
具体的には、(1)既存のイベントアノテーションに基づいてトレーニングされたベースイベント抽出モデルと、(2)新しいイベント参照を擬似トレーニングサンプルとして予測するための大規模未ラベルコーパスと、(2)新しい予測イベントトリガ、引数、その引数ロール、および、AMRグラフにおけるそれらのパスを用いて、擬似ラベルの正しさを示す互換性スコアを推定する新しいスコアモデルから構成される。
互換性スコアはさらにフィードバックとして働き、セルフトレーニング中に擬似ラベルでモデル学習を奨励または奨励する。
ace05-e, ace05-e+, ereの3つのベンチマークデータセットにおける実験結果は、stfフレームワークがイベント抽出、特にイベント引数抽出に有効であることを示し、ベースとなるイベント抽出モデルと強力なベースラインよりも高いパフォーマンス向上を示している。
大規模非ラベルデータを活用することで,高品質なamrグラフアノテーションが利用できない場合にも,イベント抽出モデルの大部分を改善できるため,stfは汎用的なフレームワークであることが示された。
関連論文リスト
- Weak Reward Model Transforms Generative Models into Robust Causal Event Extraction Systems [17.10762463903638]
我々は人的評価を近似するために評価モデルを訓練し、高い合意を得る。
そこで本研究では,アノテートデータの一部を用いて評価モデルを訓練する弱強監督手法を提案する。
論文 参考訳(メタデータ) (2024-06-26T10:48:14Z) - Self-Training with Pseudo-Label Scorer for Aspect Sentiment Quad Prediction [54.23208041792073]
Aspect Sentiment Quad Prediction (ASQP) は、与えられたレビューに対して全てのクワッド(アスペクト項、アスペクトカテゴリー、意見項、感情極性)を予測することを目的としている。
ASQPタスクにおける重要な課題はラベル付きデータの不足であり、既存のメソッドのパフォーマンスを制限している。
そこで我々は,擬似ラベルスコアラーを用いた自己学習フレームワークを提案し,レビューと擬似ラベルの一致をスコアラーが評価する。
論文 参考訳(メタデータ) (2024-06-26T05:30:21Z) - TRIAGE: Characterizing and auditing training data for improved
regression [80.11415390605215]
TRIAGEは回帰タスクに適した新しいデータキャラクタリゼーションフレームワークで、広範囲の回帰器と互換性がある。
TRIAGEは、共形予測分布を利用して、モデルに依存しないスコアリング方法、TRIAGEスコアを提供する。
TRIAGEの特徴は一貫性があり、複数の回帰設定においてデータの彫刻/フィルタリングによるパフォーマンス向上に有効であることを示す。
論文 参考訳(メタデータ) (2023-10-29T10:31:59Z) - Exploring the Limits of Historical Information for Temporal Knowledge
Graph Extrapolation [59.417443739208146]
本稿では,歴史的コントラスト学習の新しい学習枠組みに基づくイベント予測モデルを提案する。
CENETは、最も潜在的なエンティティを識別するために、歴史的および非歴史的依存関係の両方を学ぶ。
提案したモデルを5つのベンチマークグラフで評価する。
論文 参考訳(メタデータ) (2023-08-29T03:26:38Z) - Leveraging Instance Features for Label Aggregation in Programmatic Weak
Supervision [75.1860418333995]
Programmatic Weak Supervision (PWS) は、トレーニングラベルを効率的に合成するための広く普及したパラダイムとして登場した。
PWSのコアコンポーネントはラベルモデルであり、複数のノイズ管理ソースの出力をラベル関数として集約することで、真のラベルを推論する。
既存の統計ラベルモデルは一般的にLFの出力のみに依存し、基礎となる生成過程をモデル化する際のインスタンスの特徴を無視している。
論文 参考訳(メタデータ) (2022-10-06T07:28:53Z) - CEP3: Community Event Prediction with Neural Point Process on Graph [59.434777403325604]
グラフニューラルネットワークとマーク付き時間点プロセス(MTPP)を組み合わせた新しいモデルを提案する。
実験では,モデルの精度と訓練効率の両面から,モデルの優れた性能を実証した。
論文 参考訳(メタデータ) (2022-05-21T15:30:25Z) - ERGO: Event Relational Graph Transformer for Document-level Event
Causality Identification [24.894074201193927]
イベントレベルのイベント因果同定(DECI)は、文書内のイベントペア間の因果関係を特定することを目的としている。
DeCIのための新しいグラフトランスフォーマー(ERGO)フレームワークを提案する。
論文 参考訳(メタデータ) (2022-04-15T12:12:16Z) - Behind the Scenes: An Exploration of Trigger Biases Problem in Few-Shot
Event Classification [24.598938900747186]
FSEC(Few-Shot Event Classification)は、アノテーション付きデータに制限のある新しいイベントタイプに一般化可能な、イベント予測モデルの開発を目標としている。
既存のFSECモデルは、トリガーワードとターゲットイベントタイプの間の統計的均一性を示すトリガーバイアスに悩まされている。
FSECモデルにおけるコンテキストバイパス問題に対処するために、敵の訓練とトリガー再構成技術を導入する。
論文 参考訳(メタデータ) (2021-08-29T13:46:42Z) - WSSOD: A New Pipeline for Weakly- and Semi-Supervised Object Detection [75.80075054706079]
弱機能および半教師付きオブジェクト検出フレームワーク(WSSOD)を提案する。
エージェント検出器は、まず関節データセット上でトレーニングされ、弱注釈画像上で擬似境界ボックスを予測するために使用される。
提案フレームワークはPASCAL-VOC と MSCOCO のベンチマークで顕著な性能を示し,完全教師付き環境で得られたものと同等の性能を達成している。
論文 参考訳(メタデータ) (2021-05-21T11:58:50Z) - Back to Prior Knowledge: Joint Event Causality Extraction via
Convolutional Semantic Infusion [5.566928318239452]
複合イベントと因果関係抽出は,情報検索とデータマイニングにおいて極めて重要な課題である。
共同抽出フレームワーク内で長さの異なる n-gram の頻繁な窓に対する畳み込み知識注入を提案する。
我々のモデルは強力なBERT+CSNNベースラインをはるかに上回る。
論文 参考訳(メタデータ) (2021-02-19T13:31:46Z) - Few-Shot Event Detection with Prototypical Amortized Conditional Random
Field [8.782210889586837]
イベント検出は、いくつかのサンプルで新しいイベントタイプを認識する必要がある場合、苦労する傾向がある。
本稿では,タスクを2部タグ付け方式で複数ショットタグ付け問題に変換する統一結合モデルを提案する。
ベンチマークデータセットFewEventで実験を行い、実験結果から、タグ付けに基づく手法は既存のパイプラインやジョイントラーニング手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2020-12-04T01:11:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。