論文の概要: MAILEX: Email Event and Argument Extraction
- arxiv url: http://arxiv.org/abs/2305.13469v1
- Date: Mon, 22 May 2023 20:28:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-24 20:51:24.481927
- Title: MAILEX: Email Event and Argument Extraction
- Title(参考訳): MAILEX: メールイベントと引数抽出
- Authors: Saurabh Srivastava, Gaurav Singh, Shou Matsumoto, Ali Raz, Paulo
Costa, Joshua Poore, Ziyu Yao
- Abstract要約: 会話型メールスレッドからイベント抽出を行うための,最初のデータセットであるデータセットを提案する。
我々の研究は、将来このドメイン固有のイベント抽出タスクについてさらなる調査を行うことを示唆している。
- 参考スコア(独自算出の注目度): 4.671694308553691
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work, we present the first dataset, \dataset, for performing event
extraction from conversational email threads. To this end, we first proposed a
new taxonomy covering 10 event types and 76 arguments in the email domain. Our
final dataset includes $\sim$4K emails annotated with $\sim$9K event instances.
To understand the task challenges, we conducted a series of experiments
comparing two commonly-seen lines of approaches for event extraction, i.e.,
sequence labeling and generative end-to-end extraction (including few-shot
GPT-3.5). Our results showed that the task of email event extraction is far
from being addressed, due to challenges lying in, e.g., extracting
non-continuous, shared trigger spans, extracting non-named entity arguments,
and modeling the email conversational history. Our work thus suggests more
investigations in this domain-specific event extraction task in the
future.\footnote{The source code and dataset can be obtained from
\url{https://github.com/salokr/Email-Event-Extraction}.
- Abstract(参考訳): 本稿では,会話型メールスレッドからイベント抽出を行うための最初のデータセットである \dataset を提案する。
そこで我々はまず,メール領域における10のイベントタイプと76の引数をカバーする新しい分類法を提案した。
最終的なデータセットには、$\sim$4KのEメールに$\sim$9Kのイベントインスタンスをアノテートします。
課題を理解するために,イベント抽出の2つの一般的な手法,すなわちシーケンスラベリングと生成的エンドツーエンド抽出(少数ショットgpt-3.5を含む)を比較した実験を行った。
その結果,メールイベント抽出の課題は,非連続的かつ共有的なトリガスパンの抽出,名前のないエンティティ引数の抽出,メール会話履歴のモデル化など,解決には程遠いことが判明した。
そこで本研究では,この領域固有のイベント抽出タスクについて,今後のさらなる研究を示唆する。
ソースコードとデータセットは \url{https://github.com/salokr/Email-Event-Extraction} から取得できる。
関連論文リスト
- Towards Event Extraction from Speech with Contextual Clues [61.164413398231254]
本稿では,音声イベント抽出(SpeechEE)タスクを導入し,3つの合成トレーニングセットと1つの人為的テストセットを構築した。
テキストからのイベント抽出と比較して、SpeechEEは、主に連続的で単語境界を持たない複雑な音声信号のために、より大きな課題を提起する。
我々の手法はすべてのデータセットに大幅な改善をもたらし、最大10.7%のF1ゲインを達成する。
論文 参考訳(メタデータ) (2024-01-27T11:07:19Z) - MAVEN-Arg: Completing the Puzzle of All-in-One Event Understanding Dataset with Event Argument Annotation [104.6065882758648]
MAVEN-Argは、イベント検出、イベント引数抽出、イベント関係抽出をサポートする最初のオールインワンデータセットである。
EAEベンチマークでは、(1)162のイベントタイプと612の引数ロールをカバーする包括的なスキーマ、(2)98,591のイベントと290,613の引数を含む大規模なデータスケール、(3)EAEのすべてのタスク変種をサポートする包括的なアノテーションの3つの利点がある。
論文 参考訳(メタデータ) (2023-11-15T16:52:14Z) - LED: A Dataset for Life Event Extraction from Dialogs [57.390999707053915]
ライフログは、パーソナライズされたレコメンデーションやメモリアシストなど、幅広い用途で注目を集めている。
Life Event Dialogは、会話データに詳細なライフイベントアノテーションを含むデータセットである。
本稿では,対話型ライフイベント抽出課題に対処するための3つの情報抽出(IE)フレームワークについて検討する。
論文 参考訳(メタデータ) (2023-04-17T14:46:59Z) - EmailSum: Abstractive Email Thread Summarization [105.46012304024312]
我々は,メールスレッド要約(EmailSum)データセットを抽象化的に開発する。
このデータセットには、人間による注釈付きショート(30ワード)と、2549のメールスレッドからなるロング(100ワード)のサマリーが含まれている。
本研究は,現在の抽象的要約モデルの課題を明らかにするものである。
論文 参考訳(メタデータ) (2021-07-30T15:13:14Z) - Document-Level Event Argument Extraction by Conditional Generation [75.73327502536938]
イベント抽出は、長い間IEコミュニティで文レベルのタスクとして扱われてきた。
タスクを条件生成型イベントテンプレートとして定式化することで,ドキュメントレベルのニューラルイベント引数抽出モデルを提案する。
また、新しいドキュメントレベルのイベント抽出ベンチマークデータセットWikiEventsもコンパイルします。
論文 参考訳(メタデータ) (2021-04-13T03:36:38Z) - Learning with Weak Supervision for Email Intent Detection [56.71599262462638]
本稿では,メールの意図を検出するために,ユーザアクションを弱い監視源として活用することを提案する。
メール意図識別のためのエンドツーエンドの堅牢なディープニューラルネットワークモデルを開発した。
論文 参考訳(メタデータ) (2020-05-26T23:41:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。