論文の概要: Enhancing Cross-Document Event Coreference Resolution by Discourse Structure and Semantic Information
- arxiv url: http://arxiv.org/abs/2406.15990v1
- Date: Sun, 23 Jun 2024 02:54:48 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-25 19:33:31.749143
- Title: Enhancing Cross-Document Event Coreference Resolution by Discourse Structure and Semantic Information
- Title(参考訳): 談話構造と意味情報によるクロスドキュメントイベント参照解決の強化
- Authors: Qiang Gao, Bobo Li, Zixiang Meng, Yunlong Li, Jun Zhou, Fei Li, Chong Teng, Donghong Ji,
- Abstract要約: クロスドキュメントのイベントコア参照解決モデルは、参照の類似性を直接計算するか、イベント引数を抽出することで参照表現を強化することができる。
本稿では,文書の構造的・意味的情報をモデル化するために,文書レベルのレトリック構造理論(RST)木とクロスドキュメントのレキシカル・チェーンの構築を提案する。
このギャップを埋めるために、大規模な中国のクロスドキュメントイベントコアデータセットを開発した。
- 参考スコア(独自算出の注目度): 33.21818213257603
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Existing cross-document event coreference resolution models, which either compute mention similarity directly or enhance mention representation by extracting event arguments (such as location, time, agent, and patient), lacking the ability to utilize document-level information. As a result, they struggle to capture long-distance dependencies. This shortcoming leads to their underwhelming performance in determining coreference for the events where their argument information relies on long-distance dependencies. In light of these limitations, we propose the construction of document-level Rhetorical Structure Theory (RST) trees and cross-document Lexical Chains to model the structural and semantic information of documents. Subsequently, cross-document heterogeneous graphs are constructed and GAT is utilized to learn the representations of events. Finally, a pair scorer calculates the similarity between each pair of events and co-referred events can be recognized using standard clustering algorithm. Additionally, as the existing cross-document event coreference datasets are limited to English, we have developed a large-scale Chinese cross-document event coreference dataset to fill this gap, which comprises 53,066 event mentions and 4,476 clusters. After applying our model on the English and Chinese datasets respectively, it outperforms all baselines by large margins.
- Abstract(参考訳): 既存の文書間のイベントコア参照解決モデルでは、類似性を直接計算するか、イベント引数(場所、時間、エージェント、患者など)を抽出することで参照表現を強化する。
その結果、長距離依存関係の取得に苦労する。
この欠点は、引数情報が長距離依存に依存しているイベントのコア参照を決定する上で、そのパフォーマンスを過小評価することになります。
これらの制約を考慮して,文書の構造的・意味的情報をモデル化するために,文書レベルのレトリック構造理論(RST)木とクロスドキュメントのレキシカルチェインの構築を提案する。
その後、クロスドキュメントな異種グラフを構築し、GATを用いて事象の表現を学習する。
最後に、ペアスコアラは、標準クラスタリングアルゴリズムを用いて、各ペアのイベントと共参照イベントとの類似性を計算する。
さらに、既存のクロスドキュメントイベントコアデータセットは英語に限定されているため、53,066のイベント参照と4,476のクラスタからなる、このギャップを埋めるために、大規模な中国のクロスドキュメントイベントコアデータセットを開発した。
我々のモデルをそれぞれ英語と中国語のデータセットに適用した後、すべてのベースラインを大きなマージンで上回ります。
関連論文リスト
- TacoERE: Cluster-aware Compression for Event Relation Extraction [47.89154684352463]
イベント関係抽出は自然言語処理における決定的かつ基本的な課題である。
イベント関係抽出(TacoERE)を改善するクラスタ対応圧縮法を提案する。
論文 参考訳(メタデータ) (2024-05-11T03:06:08Z) - REXEL: An End-to-end Model for Document-Level Relation Extraction and Entity Linking [11.374031643273941]
REXELは文書レベルcIE(DocIE)の共同作業のための高効率かつ高精度なモデルである
同様の環境では、競合する既存のアプローチよりも平均11倍高速です。
速度と精度の組み合わせにより、REXELはWebスケールで構造化された情報を抽出する正確なコスト効率のシステムとなる。
論文 参考訳(メタデータ) (2024-04-19T11:04:27Z) - Peek Across: Improving Multi-Document Modeling via Cross-Document
Question-Answering [49.85790367128085]
我々は,事前学習対象に答える新しいクロスドキュメント質問から,汎用的なマルチドキュメントモデルを事前学習する。
この新規なマルチドキュメントQA定式化は、クロステキスト情報関係をよりよく回復させるようモデルに指示する。
分類タスクや要約タスクに焦点を当てた従来のマルチドキュメントモデルとは異なり、事前学習対象の定式化により、短いテキスト生成と長いテキスト生成の両方を含むタスクを実行できる。
論文 参考訳(メタデータ) (2023-05-24T17:48:40Z) - Semantic Structure Enhanced Event Causality Identification [57.26259734944247]
事象因果同定(ECI)は、非構造化テキスト中の事象間の因果関係を特定することを目的としている。
既存の方法は、イベント中心構造とイベント関連構造という、ECIタスクに不可欠な2種類の意味構造を過小評価する。
論文 参考訳(メタデータ) (2023-05-22T07:42:35Z) - Document-level Relation Extraction with Cross-sentence Reasoning Graph [14.106582119686635]
関係抽出(RE)は、最近、文レベルから文書レベルに移行した。
GRaph情報集約・クロスセンス推論ネットワーク(GRACR)を用いた新しい文書レベルのREモデルを提案する。
実験結果から,GRACRは文書レベルのREの2つの公開データセットにおいて優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2023-03-07T14:14:12Z) - Long Document Summarization with Top-down and Bottom-up Inference [113.29319668246407]
本稿では、2つの側面の要約モデルを改善するための原則的推論フレームワークを提案する。
我々のフレームワークは、トップレベルが長距離依存性をキャプチャするドキュメントの階層的な潜在構造を前提としています。
本稿では,様々な要約データセットに対して提案手法の有効性を示す。
論文 参考訳(メタデータ) (2022-03-15T01:24:51Z) - Focus on what matters: Applying Discourse Coherence Theory to Cross
Document Coreference [22.497877069528087]
ドキュメント間でのイベントとエンティティのコア参照の解決は、候補参照の数を大幅に増加させ、完全な$n2$ペアワイズ比較を行うことを難しくする。
既存のアプローチでは、ドキュメントクラスタ内でのコア参照のみを考慮することで単純化されているが、クラスタ間のコア参照を処理できない。
我々は、談話コヒーレンス理論の洞察に基づいて、潜在的コア推論は、読者の談話焦点によって制約される。
本手法は,ECB+,ガン・バイオレンス,フットボール・コアス,クロスドメイン・クロスドキュメント・コアス・コーパスにおけるイベントとエンティティの両面での最先端の成果を達成する。
論文 参考訳(メタデータ) (2021-10-11T15:41:47Z) - Exploiting Global Contextual Information for Document-level Named Entity
Recognition [46.99922251839363]
我々は、GCDoc(Global Context enhanced Document-level NER)と呼ばれるモデルを提案する。
単語レベルでは、文書グラフは単語間のより広範な依存関係をモデル化するために構築される。
文レベルでは、単一文を超えてより広い文脈を適切にモデル化するために、横断文モジュールを用いる。
我々のモデルは、CoNLL 2003データセットで92.22(BERTで93.40)、Ontonotes 5.0データセットで88.32(BERTで90.49)のスコアに達した。
論文 参考訳(メタデータ) (2021-06-02T01:52:07Z) - Sequential Cross-Document Coreference Resolution [14.099694053823765]
クロスドキュメントのコリファレンス解決は、マルチドキュメント分析タスクへの関心が高まる上で重要である。
コアファレンス分解能の効率的なシーケンシャル予測パラダイムを文書間設定に拡張する新しいモデルを提案する。
私たちのモデルは、参照をクラスタ表現にインクリメンタルに合成し、参照とすでに構築されたクラスタ間のリンクを予測する。
論文 参考訳(メタデータ) (2021-04-17T00:46:57Z) - WEC: Deriving a Large-scale Cross-document Event Coreference dataset
from Wikipedia [14.324743524196874]
本稿では,ウィキペディアからのクロスドキュメントイベントコアスのための大規模データセット収集のための効率的な手法であるウィキペディアイベントコアス(WEC)を提案する。
この手法を英語ウィキペディアに適用し,大規模wec-engデータセットを抽出する。
我々は,ドキュメント内コリファレンス解決のために最先端モデルのコンポーネントをクロスドキュメント設定に適応させるアルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-04-11T14:54:35Z) - Pairwise Representation Learning for Event Coreference [73.10563168692667]
イベント参照ペアのためのペアワイズ表現学習(Pairwise Representation Learning, PairwiseRL)手法を開発した。
私たちの表現は、イベントとその引数のエンコーディングを容易にするために、テキストスニペットのより微細で構造化された表現をサポートします。
PairwiseRLは、その単純さにもかかわらず、クロスドキュメントとイントラドキュメントのイベントコアベンチマークベンチマークの両方において、従来の最先端のイベントコアシステムよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-10-24T06:55:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。