論文の概要: Event Extraction for Portuguese: A QA-driven Approach using ACE-2005
- arxiv url: http://arxiv.org/abs/2408.16932v1
- Date: Thu, 29 Aug 2024 22:14:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-02 16:49:05.184267
- Title: Event Extraction for Portuguese: A QA-driven Approach using ACE-2005
- Title(参考訳): ポルトガル語のイベント抽出:ACE-2005を用いたQA駆動アプローチ
- Authors: Luís Filipe Cunha, Ricardo Campos, Alípio Jorge,
- Abstract要約: 本稿では,ポルトガルの文書中の事象を識別・分類するために,分離されたBERTベースの2つのモデルを微調整した枠組みを提案する。
ポルトガル語におけるイベントアノテートコーパスの欠如を踏まえ,ACE-2005データセットの原版をポルトガル語に翻訳し,ポルトガル語イベント抽出のための新しいコーパスを作成した。
提案手法では,64.4のF1マークをトリガー分類用,46.7の引数分類用とすることで,ポルトガル語におけるこれらのタスクに対する新たな最先端参照を実現する。
- 参考スコア(独自算出の注目度): 2.1861408994125253
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Event extraction is an Information Retrieval task that commonly consists of identifying the central word for the event (trigger) and the event's arguments. This task has been extensively studied for English but lags behind for Portuguese, partly due to the lack of task-specific annotated corpora. This paper proposes a framework in which two separated BERT-based models were fine-tuned to identify and classify events in Portuguese documents. We decompose this task into two sub-tasks. Firstly, we use a token classification model to detect event triggers. To extract event arguments, we train a Question Answering model that queries the triggers about their corresponding event argument roles. Given the lack of event annotated corpora in Portuguese, we translated the original version of the ACE-2005 dataset (a reference in the field) into Portuguese, producing a new corpus for Portuguese event extraction. To accomplish this, we developed an automatic translation pipeline. Our framework obtains F1 marks of 64.4 for trigger classification and 46.7 for argument classification setting, thus a new state-of-the-art reference for these tasks in Portuguese.
- Abstract(参考訳): イベント抽出は、一般的にイベントの中心単語(トリガー)とイベントの引数を識別する情報検索タスクである。
この課題は英語では広く研究されてきたが、ポルトガル語では遅れが遅れている。
本稿では,ポルトガルの文書中の事象を識別・分類するために,分離されたBERTベースの2つのモデルを微調整した枠組みを提案する。
このタスクを2つのサブタスクに分解する。
まず、トークン分類モデルを用いてイベントトリガを検出する。
イベント引数を抽出するために、イベント引数の役割についてトリガを問い合わせる質問回答モデルを訓練する。
ポルトガル語におけるイベントアノテートコーパスの欠如を踏まえ,ACE-2005データセットの原版(フィールドでの参照)をポルトガル語に翻訳し,ポルトガル語イベント抽出のための新しいコーパスを作成した。
そこで我々は,自動翻訳パイプラインを開発した。
提案手法では,64.4のF1マークをトリガー分類用,46.7の引数分類用とすることで,ポルトガル語におけるこれらのタスクに対する新たな最先端参照を実現する。
関連論文リスト
- Event Extraction as Question Generation and Answering [72.04433206754489]
イベント抽出に関する最近の研究は、質問回答(QA)としてタスクを再編成した。
そこで我々は,QGA-EEを提案する。QGモデルにより,定型テンプレートを使わずに,リッチな文脈情報を含む質問を生成することができる。
実験の結果、QGA-EEはACE05の英語データセットで以前のシングルタスクベースのモデルよりも優れていた。
論文 参考訳(メタデータ) (2023-07-10T01:46:15Z) - Joint Event Extraction via Structural Semantic Matching [12.248124072173935]
イベント抽出(EE)は、情報抽出において不可欠なタスクの1つである。
本稿では,イベントタイプの意味的特徴を符号化し,対象テキストと構造的マッチングを行う。
論文 参考訳(メタデータ) (2023-06-06T07:42:39Z) - PESE: Event Structure Extraction using Pointer Network based
Encoder-Decoder Architecture [0.0]
イベント抽出(EE)は、テキストからイベントとイベント関連の議論情報を見つけ、構造化形式で表現することを目的としている。
本稿では、各イベントレコードをトリガーフレーズ、トリガータイプ、引数フレーズ、および対応するロール情報を含むユニークな形式で表現する。
提案するポインタネットワークを用いたエンコーダデコーダモデルでは,イベント参加者間のインタラクションを利用して各ステップでイベントを生成する。
論文 参考訳(メタデータ) (2022-11-22T10:36:56Z) - Open-Vocabulary Argument Role Prediction for Event Extraction [70.93524366880521]
本稿では,この本質的だが未探索な課題,すなわち開語彙的引数ロール予測を定義する。
このタスクの目標は、所定のイベントタイプに対する引数ロールのセットを推論することである。
本稿では,この課題に対する新しい教師なしフレームワークであるRolePredを提案する。
論文 参考訳(メタデータ) (2022-11-03T04:13:37Z) - Unifying Event Detection and Captioning as Sequence Generation via
Pre-Training [53.613265415703815]
本稿では,イベント検出とキャプションのタスク間関連性を高めるための,事前学習と微調整の統合フレームワークを提案する。
我々のモデルは最先端の手法よりも優れており、大規模ビデオテキストデータによる事前学習ではさらに向上できる。
論文 参考訳(メタデータ) (2022-07-18T14:18:13Z) - Learning Constraints and Descriptive Segmentation for Subevent Detection [74.48201657623218]
本稿では,サブイベント検出とEventSeg予測の依存関係をキャプチャする制約を学習し,強制するアプローチを提案する。
我々は制約学習にRectifier Networksを採用し、学習した制約をニューラルネットワークの損失関数の正規化項に変換する。
論文 参考訳(メタデータ) (2021-09-13T20:50:37Z) - Event Argument Extraction using Causal Knowledge Structures [9.56216681584111]
イベント引数抽出とは、特定のイベントのために構造化されていないテキストから構造化情報を抽出するタスクを指します。
既存の作業のほとんどは、このタスクを文レベルでモデル化し、コンテキストをローカルスコープに制限する。
複雑なイベント引数の抽出を支援するために,ドキュメントレベルのイベント情報を注入する外部知識支援アプローチを提案する。
論文 参考訳(メタデータ) (2021-05-02T13:59:07Z) - Event Detection as Question Answering with Entity Information [5.761450181435801]
本稿では,複数回答の可能性とエンティティのサポートを考慮した質問応答(QA)問題として,イベント検出(ED)タスクのパラダイムを提案する。
イベントトリガーの抽出は、コンテキストから回答の範囲を識別するタスクに変換されると同時に、周囲のエンティティにもフォーカスされる。
ACE2005コーパスの実験は、提案されたパラダイムがEDタスクの実行可能なソリューションであり、最先端のモデルよりも大幅に優れていることを示した。
論文 参考訳(メタデータ) (2021-04-14T16:53:11Z) - Unsupervised Label-aware Event Trigger and Argument Classification [73.86358632937372]
まず,利用可能なツール(srlなど)でイベントを識別し,それを事前に定義されたイベントタイプに自動マップする,教師なしイベント抽出パイプラインを提案する。
事前訓練された言語モデルを利用して、イベントトリガと引数の両方の事前定義された型を文脈的に表現します。
我々は、トリガーの83%と引数の54%を正しい型にマッピングし、以前のゼロショットアプローチのパフォーマンスをほぼ倍にしました。
論文 参考訳(メタデータ) (2020-12-30T17:47:24Z) - Event Presence Prediction Helps Trigger Detection Across Languages [13.06818350795583]
本稿では,Transformerをベースとしたアーキテクチャが,シーケンスラベリングタスクとしてイベント抽出を効果的にモデル化できることを示す。
本稿では,BERTに基づくイベント抽出モデルの性能を大幅に向上させる,文レベルとトークンレベルのトレーニング目標の組み合わせを提案する。
論文 参考訳(メタデータ) (2020-09-15T15:52:21Z) - Detecting Ongoing Events Using Contextual Word and Sentence Embeddings [110.83289076967895]
本稿では,OED(Ongoing Event Detection)タスクを紹介する。
目的は、歴史、未来、仮説、あるいは新しいものでも現在のものでもない他の形式や出来事に対してのみ、進行中のイベントの言及を検出することである。
構造化されていないテキストから進行中のイベントに関する構造化情報を抽出する必要があるアプリケーションは、OEDシステムを利用することができる。
論文 参考訳(メタデータ) (2020-07-02T20:44:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。