論文の概要: Generating Harder Cross-document Event Coreference Resolution Datasets using Metaphoric Paraphrasing
- arxiv url: http://arxiv.org/abs/2407.11988v1
- Date: Wed, 5 Jun 2024 17:26:45 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-22 11:30:12.227321
- Title: Generating Harder Cross-document Event Coreference Resolution Datasets using Metaphoric Paraphrasing
- Title(参考訳): メタフォリックパラフレーズを用いたよりハードなクロスドキュメントイベント参照解決データセットの生成
- Authors: Shafiuddin Rehan Ahmed, Zhiyong Eric Wang, George Arthur Baker, Kevin Stowe, James H. Martin,
- Abstract要約: 我々は、クロスドキュメントイベント会議解決(CDEC)のためのイベントコアバンクプラス(ECB+)の語彙的にリッチな変種であるECB+METAを紹介する。
我々は、ECB+の文書における文の比喩的変換のツールとしてChatGPTを使用し、変換された文の元のイベントトリガーを半自動的にタグ付けする。
我々は、ECB+METAとの闘いをうまくこなす既存の手法を示す結果を示し、より困難なデータセットに関するCDEC研究の道を開く。
- 参考スコア(独自算出の注目度): 4.194472405540157
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The most popular Cross-Document Event Coreference Resolution (CDEC) datasets fail to convey the true difficulty of the task, due to the lack of lexical diversity between coreferring event triggers (words or phrases that refer to an event). Furthermore, there is a dearth of event datasets for figurative language, limiting a crucial avenue of research in event comprehension. We address these two issues by introducing ECB+META, a lexically rich variant of Event Coref Bank Plus (ECB+) for CDEC on symbolic and metaphoric language. We use ChatGPT as a tool for the metaphoric transformation of sentences in the documents of ECB+, then tag the original event triggers in the transformed sentences in a semi-automated manner. In this way, we avoid the re-annotation of expensive coreference links. We present results that show existing methods that work well on ECB+ struggle with ECB+META, thereby paving the way for CDEC research on a much more challenging dataset. Code/data: https://github.com/ahmeshaf/llms_coref
- Abstract(参考訳): 最も一般的なクロスドキュメントイベント参照解決(CDEC)データセットは、コア参照イベントトリガ(イベントを参照する単語やフレーズ)間の語彙的多様性が欠如しているため、タスクの真の難しさを伝えることができない。
さらに、図形言語のためのイベントデータセットのデジェストがあり、イベント理解における重要な研究の道のりを制限している。
象徴的で比喩的な言語でCDECにイベントコアフバンクプラス(ECB+)の語彙的に豊かな変種であるECB+METAを導入することで、これらの2つの問題に対処する。
我々は、ECB+の文書における文の比喩的変換のツールとしてChatGPTを使用し、変換された文の元のイベントトリガーを半自動的にタグ付けする。
このようにして、高価なコア参照リンクの再注釈を避ける。
我々は、ECB+METAとの闘いをうまくこなす既存の手法を示す結果を示し、より困難なデータセットに関するCDEC研究の道を開く。
コード/データ:https://github.com/ahmeshaf/llms_coref
関連論文リスト
- Enhancing Cross-Document Event Coreference Resolution by Discourse Structure and Semantic Information [33.21818213257603]
クロスドキュメントのイベントコア参照解決モデルは、参照の類似性を直接計算するか、イベント引数を抽出することで参照表現を強化することができる。
本稿では,文書の構造的・意味的情報をモデル化するために,文書レベルのレトリック構造理論(RST)木とクロスドキュメントのレキシカル・チェーンの構築を提案する。
このギャップを埋めるために、大規模な中国のクロスドキュメントイベントコアデータセットを開発した。
論文 参考訳(メタデータ) (2024-06-23T02:54:48Z) - Cross-lingual Contextualized Phrase Retrieval [63.80154430930898]
そこで本研究では,言語間関係の単語検索を多義的に行うタスクの定式化を提案する。
我々は、コントラスト学習を用いて、言語間コンテクスト対応句検索(CCPR)を訓練する。
フレーズ検索タスクでは、CCPRはベースラインをかなり上回り、少なくとも13ポイント高いトップ1の精度を達成する。
論文 参考訳(メタデータ) (2024-03-25T14:46:51Z) - Complex Reasoning over Logical Queries on Commonsense Knowledge Graphs [61.796960984541464]
論理クエリをサンプリングして作成した新しいデータセットであるCOM2(COMplex COMmonsense)を提示する。
我々は、手書きのルールと大きな言語モデルを用いて、複数の選択とテキスト生成の質問に言語化します。
COM2でトレーニングされた言語モデルでは、複雑な推論能力が大幅に改善されている。
論文 参考訳(メタデータ) (2024-03-12T08:13:52Z) - Towards Event Extraction from Speech with Contextual Clues [61.164413398231254]
本稿では,音声イベント抽出(SpeechEE)タスクを導入し,3つの合成トレーニングセットと1つの人為的テストセットを構築した。
テキストからのイベント抽出と比較して、SpeechEEは、主に連続的で単語境界を持たない複雑な音声信号のために、より大きな課題を提起する。
我々の手法はすべてのデータセットに大幅な改善をもたらし、最大10.7%のF1ゲインを達成する。
論文 参考訳(メタデータ) (2024-01-27T11:07:19Z) - MAVEN-Arg: Completing the Puzzle of All-in-One Event Understanding Dataset with Event Argument Annotation [104.6065882758648]
MAVEN-Argは、イベント検出、イベント引数抽出、イベント関係抽出をサポートする最初のオールインワンデータセットである。
EAEベンチマークでは、(1)162のイベントタイプと612の引数ロールをカバーする包括的なスキーマ、(2)98,591のイベントと290,613の引数を含む大規模なデータスケール、(3)EAEのすべてのタスク変種をサポートする包括的なアノテーションの3つの利点がある。
論文 参考訳(メタデータ) (2023-11-15T16:52:14Z) - CorefPrompt: Prompt-based Event Coreference Resolution by Measuring
Event Type and Argument Compatibilities [16.888201607072318]
イベントコア参照解決(ECR)は、同じ現実世界のイベントを参照するイベント参照を、クラスタにグループ化することを目的としている。
本稿では,ECRをクローゼスタイル(マスケプド言語モデル)タスクに変換するためのプロンプトベースのアプローチであるCorefPromptを提案する。
これにより、完全に共有されたコンテキストで、単一のテンプレート内で同時イベントモデリングとコア参照の識別が可能になる。
論文 参考訳(メタデータ) (2023-10-23T02:47:27Z) - mCL-NER: Cross-Lingual Named Entity Recognition via Multi-view
Contrastive Learning [54.523172171533645]
CrossNERは多言語コーパスの不足により不均一な性能から生じる課題に直面している。
言語横断的名前付きエンティティ認識(mCL-NER)のためのマルチビューコントラスト学習を提案する。
40言語にまたがるXTREMEベンチマーク実験では、従来のデータ駆動型およびモデルベースアプローチよりもmCL-NERの方が優れていることを示した。
論文 参考訳(メタデータ) (2023-08-17T16:02:29Z) - $2 * n$ is better than $n^2$: Decomposing Event Coreference Resolution
into Two Tractable Problems [3.777476692151661]
イベント参照解決(ECR)は、ドキュメント内またはドキュメント間で同じイベントの参照をリンクするタスクである。
2つの人気のあるECRデータセットで、アートの状況に匹敵する結果が得られることを示す。
また、コアフェレントまたは非コアフェレントを正確に分類するために、"ハード"な参照ペアも分析します。
論文 参考訳(メタデータ) (2023-05-09T05:33:32Z) - Entry Separation using a Mixed Visual and Textual Language Model:
Application to 19th century French Trade Directories [18.323615434182553]
重要な課題は、ターゲットデータベースの基本的なテキスト領域を構成するものを正確に分割することである。
19世紀のフランス貿易ディレクトリーに効率性を示す新しい実用的アプローチを提案する。
NER目的に使用される言語モデルのトークンストリームに、特別なビジュアルトークン、例えばインデントやブレークといったコーディングを注入することで、テキストと視覚の両方の知識を同時に活用することができる。
論文 参考訳(メタデータ) (2023-02-17T15:30:44Z) - Dynamic Global Memory for Document-level Argument Extraction [63.314514124716936]
文書レベルのイベント引数抽出のための,新しいグローバルなニューラルジェネレーションベースのフレームワークを提案する。
文書メモリストアを使用してコンテキストイベント情報を記録し、それを暗黙的に明示的に活用することで、後のイベントの引数の復号に役立ちます。
実験結果から,我々のフレームワークは従来の手法よりも大幅に優れていたことが判明した。
論文 参考訳(メタデータ) (2022-09-18T23:45:25Z) - Qualitative and Quantitative Analysis of Diversity in Cross-document
Coreference Resolution Datasets [9.379650501033465]
CDCR(Cross-document coreference resolution)データセットには、ID関係を持つコア参照チェーンを形成するイベントやエンティティについて、手動で注釈付けされたイベント中心の言及が含まれている。
ECB+は最先端のCDCRデータセットであり、イベントとその説明的属性の解決に焦点を当てている。
NewsWCL50は、イベントとエンティティのコア参照チェーンを、単語選択の強いばらつきで注釈付けするデータセットである。
論文 参考訳(メタデータ) (2021-09-11T10:33:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。