論文の概要: Cross-document Event Coreference Search: Task, Dataset and Modeling
- arxiv url: http://arxiv.org/abs/2210.12654v1
- Date: Sun, 23 Oct 2022 08:21:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-25 16:26:40.547059
- Title: Cross-document Event Coreference Search: Task, Dataset and Modeling
- Title(参考訳): クロスドキュメントイベント参照検索:タスク、データセット、モデリング
- Authors: Alon Eirew, Avi Caciularu, Ido Dagan
- Abstract要約: 我々は、タスクのために、魅力的な、より適用可能な補完的な設定 - クロスドキュメントの参照検索を提案する。
このタスクの研究を支援するために、Wikipediaから派生した対応するデータセットを作成します。
本稿では,強力なコア参照スコアリング方式をDPRアーキテクチャに統合し,性能を向上する新しいモデルを提案する。
- 参考スコア(独自算出の注目度): 26.36068336169796
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The task of Cross-document Coreference Resolution has been traditionally
formulated as requiring to identify all coreference links across a given set of
documents. We propose an appealing, and often more applicable, complementary
set up for the task - Cross-document Coreference Search, focusing in this paper
on event coreference. Concretely, given a mention in context of an event of
interest, considered as a query, the task is to find all coreferring mentions
for the query event in a large document collection. To support research on this
task, we create a corresponding dataset, which is derived from Wikipedia while
leveraging annotations in the available Wikipedia Event Coreference dataset
(WEC-Eng). Observing that the coreference search setup is largely analogous to
the setting of Open Domain Question Answering, we adapt the prominent Deep
Passage Retrieval (DPR) model to our setting, as an appealing baseline.
Finally, we present a novel model that integrates a powerful coreference
scoring scheme into the DPR architecture, yielding improved performance.
- Abstract(参考訳): クロスドキュメント参照解決のタスクは、伝統的に、与えられた文書の集合にわたるすべてのコア参照リンクを識別する必要があるとして定式化されてきた。
本稿では,イベントコレファレンスに焦点をあてたクロスドキュメントコレファレンス探索(cross-document coreference search)というタスクのための,より魅力的で,しばしば適用可能な補完的なセットアップを提案する。
具体的には、クエリとして考慮された関心のあるイベントのコンテキストにおいて、タスクは、大きなドキュメントコレクション内のクエリイベントのすべてのコア参照参照を見つけることである。
このタスクの研究を支援するために、Wikipediaから派生した対応するデータセットを作成し、利用可能なWikipedia Event Coreferenceデータセット(WEC-Eng)のアノテーションを活用する。
共リファレンス検索のセットアップは,オープンドメイン質問応答の設定とほぼ類似していることを観察し,著明なディープパス検索(dpr)モデルを魅力的なベースラインとして適用する。
最後に,強力なコア参照スコアリング方式をDPRアーキテクチャに統合し,性能を向上する新しいモデルを提案する。
関連論文リスト
- Generative Retrieval Meets Multi-Graded Relevance [104.75244721442756]
GRADed Generative Retrieval (GR$2$)というフレームワークを紹介します。
GR$2$は2つの重要なコンポーネントに焦点を当てている。
マルチグレードとバイナリの関連性を持つデータセットの実験は,GR$2$の有効性を示した。
論文 参考訳(メタデータ) (2024-09-27T02:55:53Z) - Enhancing Cross-Document Event Coreference Resolution by Discourse Structure and Semantic Information [33.21818213257603]
クロスドキュメントのイベントコア参照解決モデルは、参照の類似性を直接計算するか、イベント引数を抽出することで参照表現を強化することができる。
本稿では,文書の構造的・意味的情報をモデル化するために,文書レベルのレトリック構造理論(RST)木とクロスドキュメントのレキシカル・チェーンの構築を提案する。
このギャップを埋めるために、大規模な中国のクロスドキュメントイベントコアデータセットを開発した。
論文 参考訳(メタデータ) (2024-06-23T02:54:48Z) - Event GDR: Event-Centric Generative Document Retrieval [37.53593254200252]
イベント中心の生成文書検索モデルであるEvent GDRを提案する。
我々は、文書の包括性と内的内容の相関を保証するために、文書のモデル化にイベントと関係を用いる。
識別子構築では、イベントを適切に定義されたイベント分類にマッピングし、明示的な意味構造を持つ識別子を構築する。
論文 参考訳(メタデータ) (2024-05-11T02:55:11Z) - On Task-personalized Multimodal Few-shot Learning for Visually-rich
Document Entity Retrieval [59.25292920967197]
VDER(Few-shot document entity search)は、NLPアプリケーションにおいて重要なトピックである。
FewVEXは、エンティティレベルの少数ショットVDERの分野における将来の研究を促進するための、新しいデータセットである。
本稿では,タスクパーソナライズを効果的に実現することを中心に,タスク認識型メタラーニングベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-11-01T17:51:43Z) - Peek Across: Improving Multi-Document Modeling via Cross-Document
Question-Answering [49.85790367128085]
我々は,事前学習対象に答える新しいクロスドキュメント質問から,汎用的なマルチドキュメントモデルを事前学習する。
この新規なマルチドキュメントQA定式化は、クロステキスト情報関係をよりよく回復させるようモデルに指示する。
分類タスクや要約タスクに焦点を当てた従来のマルチドキュメントモデルとは異なり、事前学習対象の定式化により、短いテキスト生成と長いテキスト生成の両方を含むタスクを実行できる。
論文 参考訳(メタデータ) (2023-05-24T17:48:40Z) - CAPSTONE: Curriculum Sampling for Dense Retrieval with Document
Expansion [68.19934563919192]
本稿では,学習中に擬似クエリを利用して,生成したクエリと実際のクエリとの関係を徐々に向上させるカリキュラムサンプリング戦略を提案する。
ドメイン内およびドメイン外両方のデータセットに対する実験結果から,本手法が従来の高密度検索モデルより優れていることが示された。
論文 参考訳(メタデータ) (2022-12-18T15:57:46Z) - Augmenting Document Representations for Dense Retrieval with
Interpolation and Perturbation [49.940525611640346]
ドキュメント拡張(Document Augmentation for dense Retrieval)フレームワークは、ドキュメントの表現をDense Augmentationとperturbationsで強化する。
2つのベンチマークデータセットによる検索タスクにおけるDARの性能評価を行い、ラベル付き文書とラベルなし文書の密集検索において、提案したDARが関連するベースラインを大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2022-03-15T09:07:38Z) - Improving Candidate Retrieval with Entity Profile Generation for
Wikidata Entity Linking [76.00737707718795]
本稿では,エンティティ・プロファイリングに基づく新しい候補探索パラダイムを提案する。
我々は、このプロファイルを使用してインデックス付き検索エンジンに問い合わせ、候補エンティティを検索する。
本手法は,ウィキペディアのアンカーテキスト辞書を用いた従来の手法を補完するものである。
論文 参考訳(メタデータ) (2022-02-27T17:38:53Z) - Cross-document Event Identity via Dense Annotation [9.163142877146512]
我々は、異なる文書からテキストイベントの同一性を研究する。
本稿では,クロスドキュメント・イベント・コアのための高密度アノテーション手法を提案する。
クロスドキュメントイベントコアのためのオープンアクセスデータセットを提案する。
論文 参考訳(メタデータ) (2021-09-14T03:57:58Z) - WEC: Deriving a Large-scale Cross-document Event Coreference dataset
from Wikipedia [14.324743524196874]
本稿では,ウィキペディアからのクロスドキュメントイベントコアスのための大規模データセット収集のための効率的な手法であるウィキペディアイベントコアス(WEC)を提案する。
この手法を英語ウィキペディアに適用し,大規模wec-engデータセットを抽出する。
我々は,ドキュメント内コリファレンス解決のために最先端モデルのコンポーネントをクロスドキュメント設定に適応させるアルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-04-11T14:54:35Z) - CSFCube -- A Test Collection of Computer Science Research Articles for
Faceted Query by Example [43.01717754418893]
例によるフェーステッドクエリのタスクを紹介します。
ユーザは、入力クエリドキュメントに加えて、より細かいアスペクトを指定することもできる。
我々は,クエリ科学論文に類似した科学的論文を検索できるモデルを構想する。
論文 参考訳(メタデータ) (2021-03-24T01:02:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。