論文の概要: Cross-document Event Identity via Dense Annotation
- arxiv url: http://arxiv.org/abs/2109.06417v1
- Date: Tue, 14 Sep 2021 03:57:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-15 15:42:49.962665
- Title: Cross-document Event Identity via Dense Annotation
- Title(参考訳): Dense Annotationによるクロスドキュメントイベント識別
- Authors: Adithya Pratapa, Zhengzhong Liu, Kimihiro Hasegawa, Linwei Li, Yukari
Yamakawa, Shikun Zhang, Teruko Mitamura
- Abstract要約: 我々は、異なる文書からテキストイベントの同一性を研究する。
本稿では,クロスドキュメント・イベント・コアのための高密度アノテーション手法を提案する。
クロスドキュメントイベントコアのためのオープンアクセスデータセットを提案する。
- 参考スコア(独自算出の注目度): 9.163142877146512
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we study the identity of textual events from different
documents. While the complex nature of event identity is previously studied
(Hovy et al., 2013), the case of events across documents is unclear. Prior work
on cross-document event coreference has two main drawbacks. First, they
restrict the annotations to a limited set of event types. Second, they
insufficiently tackle the concept of event identity. Such annotation setup
reduces the pool of event mentions and prevents one from considering the
possibility of quasi-identity relations. We propose a dense annotation approach
for cross-document event coreference, comprising a rich source of event
mentions and a dense annotation effort between related document pairs. To this
end, we design a new annotation workflow with careful quality control and an
easy-to-use annotation interface. In addition to the links, we further collect
overlapping event contexts, including time, location, and participants, to shed
some light on the relation between identity decisions and context. We present
an open-access dataset for cross-document event coreference, CDEC-WN, collected
from English Wikinews and open-source our annotation toolkit to encourage
further research on cross-document tasks.
- Abstract(参考訳): 本稿では,異なる文書からのテキストイベントの同一性について検討する。
イベントアイデンティティの複雑な性質は以前に研究されている(Hovy et al., 2013)が、文書間のイベントの場合は不明である。
ドキュメント横断イベントの以前の作業 coreference には2つの大きな欠点がある。
まず、アノテーションを限定されたイベントタイプに制限する。
第二に、イベントアイデンティティの概念には不十分である。
このようなアノテーションの設定は、イベント参照のプールを減らし、擬似同一性関係の可能性を考慮するのを防ぐ。
本稿では,イベント参照の豊富なソースと関連する文書ペア間の密接なアノテーション労力からなる,クロスドキュメントイベントコリファレンスのための密接なアノテーションアプローチを提案する。
この目的のために,注意深い品質管理と使い易いアノテーションインターフェースを備えた新しいアノテーションワークフローを設計する。
リンクに加えて、時間、場所、参加者など、重複するイベントコンテキストも収集し、アイデンティティ決定とコンテキストの関係に光を当てます。
ウィキニューズから収集したクロスドキュメントイベントコアのためのオープンアクセスデータセットCDEC-WNと,クロスドキュメントタスクのさらなる研究を促進するためのアノテーションツールキットをオープンソース化する。
関連論文リスト
- Unified Multi-Modal Interleaved Document Representation for Information Retrieval [57.65409208879344]
我々は、異なるモダリティでインターリーブされた文書を均等に埋め込み、より包括的でニュアンスのある文書表現を生成する。
具体的には、テキスト、画像、テーブルの処理と統合を統一されたフォーマットと表現に統合する、近年のビジョン言語モデルの能力を活用して、これを実現する。
論文 参考訳(メタデータ) (2024-10-03T17:49:09Z) - Generative Retrieval Meets Multi-Graded Relevance [104.75244721442756]
GRADed Generative Retrieval (GR$2$)というフレームワークを紹介します。
GR$2$は2つの重要なコンポーネントに焦点を当てている。
マルチグレードとバイナリの関連性を持つデータセットの実験は,GR$2$の有効性を示した。
論文 参考訳(メタデータ) (2024-09-27T02:55:53Z) - Harvesting Events from Multiple Sources: Towards a Cross-Document Event Extraction Paradigm [33.737981167605575]
本稿では,複数の文書からイベント情報を統合し,イベントに関する総合的な視点を提供するために,クロスドキュメントイベント抽出(CDEE)の課題を提案する。
我々は,20,059の文書と37,688の言及レベルのイベントを含む,クロスドキュメントイベント抽出データセット(CLES)を構築した。
当社のCDEEパイプラインは,エンドツーエンドのクロスドキュメントイベント抽出において,約72%のF1を実現しています。
論文 参考訳(メタデータ) (2024-06-23T06:01:11Z) - Enhancing Cross-Document Event Coreference Resolution by Discourse Structure and Semantic Information [33.21818213257603]
クロスドキュメントのイベントコア参照解決モデルは、参照の類似性を直接計算するか、イベント引数を抽出することで参照表現を強化することができる。
本稿では,文書の構造的・意味的情報をモデル化するために,文書レベルのレトリック構造理論(RST)木とクロスドキュメントのレキシカル・チェーンの構築を提案する。
このギャップを埋めるために、大規模な中国のクロスドキュメントイベントコアデータセットを開発した。
論文 参考訳(メタデータ) (2024-06-23T02:54:48Z) - Event GDR: Event-Centric Generative Document Retrieval [37.53593254200252]
イベント中心の生成文書検索モデルであるEvent GDRを提案する。
我々は、文書の包括性と内的内容の相関を保証するために、文書のモデル化にイベントと関係を用いる。
識別子構築では、イベントを適切に定義されたイベント分類にマッピングし、明示的な意味構造を持つ識別子を構築する。
論文 参考訳(メタデータ) (2024-05-11T02:55:11Z) - FAMuS: Frames Across Multiple Sources [74.03795560933612]
FAMuSはウィキペディアの節集の新たなコーパスで、あるイベントにエンフレポートし、同じイベントのための基礎となるジャンルディバース(非ウィキペディア)のemphsource記事と組み合わせている。
FAMuSによって実現された2つの重要な事象理解タスクについて報告する。
論文 参考訳(メタデータ) (2023-11-09T18:57:39Z) - Cross-document Event Coreference Search: Task, Dataset and Modeling [26.36068336169796]
我々は、タスクのために、魅力的な、より適用可能な補完的な設定 - クロスドキュメントの参照検索を提案する。
このタスクの研究を支援するために、Wikipediaから派生した対応するデータセットを作成します。
本稿では,強力なコア参照スコアリング方式をDPRアーキテクチャに統合し,性能を向上する新しいモデルを提案する。
論文 参考訳(メタデータ) (2022-10-23T08:21:25Z) - Dynamic Global Memory for Document-level Argument Extraction [63.314514124716936]
文書レベルのイベント引数抽出のための,新しいグローバルなニューラルジェネレーションベースのフレームワークを提案する。
文書メモリストアを使用してコンテキストイベント情報を記録し、それを暗黙的に明示的に活用することで、後のイベントの引数の復号に役立ちます。
実験結果から,我々のフレームワークは従来の手法よりも大幅に優れていたことが判明した。
論文 参考訳(メタデータ) (2022-09-18T23:45:25Z) - EA$^2$E: Improving Consistency with Event Awareness for Document-Level
Argument Extraction [52.43978926985928]
本稿では、トレーニングと推論のための拡張コンテキストを備えたイベント・アウェア・引数抽出(EA$2$E)モデルを紹介する。
WIKIEVENTSとACE2005データセットの実験結果から,EA$2$Eの有効性が示された。
論文 参考訳(メタデータ) (2022-05-30T04:33:51Z) - Pairwise Representation Learning for Event Coreference [73.10563168692667]
イベント参照ペアのためのペアワイズ表現学習(Pairwise Representation Learning, PairwiseRL)手法を開発した。
私たちの表現は、イベントとその引数のエンコーディングを容易にするために、テキストスニペットのより微細で構造化された表現をサポートします。
PairwiseRLは、その単純さにもかかわらず、クロスドキュメントとイントラドキュメントのイベントコアベンチマークベンチマークの両方において、従来の最先端のイベントコアシステムよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-10-24T06:55:52Z) - Seeing the Forest and the Trees: Detection and Cross-Document
Coreference Resolution of Militarized Interstate Disputes [3.8073142980733]
テキスト中の特定の政治事象を識別し、共有イベントに基づいて関連テキストを相互にリンクする手法を評価するためのデータセットを提供する。
データセットであるHeadlines of Warは、Militarized Interstate Disputesデータセットに基づいて構築され、問題ステータスとコア参照インジケータでラベル付けされた見出しペアによって分類された見出しを提供する。
このマルチタスク畳み込みニューラルネットワークは,見出しのテキストや出版日時からイベントやイベントのコアを認識できることが示されている。
論文 参考訳(メタデータ) (2020-05-06T17:20:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。