論文の概要: EXCEEDS: Extracting Complex Events as Connecting the Dots to Graphs in Scientific Domain
- arxiv url: http://arxiv.org/abs/2406.14075v1
- Date: Thu, 20 Jun 2024 07:50:37 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-21 14:50:31.198452
- Title: EXCEEDS: Extracting Complex Events as Connecting the Dots to Graphs in Scientific Domain
- Title(参考訳): EXCEEDS:科学領域におけるドットとグラフを結びつける複雑なイベントの抽出
- Authors: Yi-Fan Lu, Xian-Ling Mao, Bo Wang, Xiao Liu, Heyan Huang,
- Abstract要約: 我々は、科学領域に適したスキーマを備えた大規模マルチイベント文書レベルデータセットであるSciEventsを構築した。
そこで我々は,グリッドマトリックスに高密度ナゲットを格納することで,新しいエンドツーエンドの科学的イベント抽出フレームワークEXCEEDSを提案する。
実験により,SciEvents上でのEXCEEDSの最先端性能が実証された。
- 参考スコア(独自算出の注目度): 57.56639626657212
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: It is crucial to utilize events to understand a specific domain. There are lots of research on event extraction in many domains such as news, finance and biology domain. However, scientific domain still lacks event extraction research, including comprehensive datasets and corresponding methods. Compared to other domains, scientific domain presents two characteristics: denser nuggets and more complex events. To solve the above problem, considering these two characteristics, we first construct SciEvents, a large-scale multi-event document-level dataset with a schema tailored for scientific domain. It has 2,508 documents and 24,381 events under refined annotation and quality control. Then, we propose EXCEEDS, a novel end-to-end scientific event extraction framework by storing dense nuggets in a grid matrix and simplifying complex event extraction into a dot construction and connection task. Experimental results demonstrate state-of-the-art performances of EXCEEDS on SciEvents. Additionally, we release SciEvents and EXCEEDS on GitHub.
- Abstract(参考訳): 特定のドメインを理解するためにイベントを活用することが重要です。
ニュース、金融、生物学などの多くの分野において、イベント抽出に関する多くの研究がある。
しかし、科学領域には、包括的なデータセットやそれに対応する方法を含むイベント抽出研究がまだ欠けている。
他の領域と比較して、科学的領域はより密度の高いナゲットとより複雑な事象の2つの特徴を示す。
この2つの特徴を考慮し、まず、科学領域に適したスキーマを備えた大規模マルチイベント文書レベルデータセットであるSciEventsを構築する。
2,508件の文書と24,381件のイベントがある。
そこで我々は,グリッドマトリックスに高密度なナゲットを格納し,複雑なイベント抽出をドット構成および接続タスクに単純化することにより,新しいエンドツーエンドの科学的イベント抽出フレームワークEXCEEDSを提案する。
実験により,SciEvents上でのEXCEEDSの最先端性能が実証された。
さらに、GitHubでSciEventsとEXCEEDSをリリースしています。
関連論文リスト
- Grounding Partially-Defined Events in Multimodal Data [61.0063273919745]
部分定義イベントに対するマルチモーダル定式化を導入し、これらのイベントの抽出を3段階スパン検索タスクとしてキャストする。
このタスクのベンチマークであるMultiVENT-Gを提案し,22.8Kのラベル付きイベント中心エンティティを含む,14.5時間の高密度アノテーション付き現在のイベントビデオと1,168のテキストドキュメントからなる。
結果は、イベント理解の抽象的な課題を示し、イベント中心のビデオ言語システムにおける約束を実証する。
論文 参考訳(メタデータ) (2024-10-07T17:59:48Z) - CMNEE: A Large-Scale Document-Level Event Extraction Dataset based on Open-Source Chinese Military News [4.8309547228489125]
大規模で文書レベルのオープンソースである中国の軍事ニュースイベント抽出データセットであるCMNEEを提案する。
17,000の文書と29,223のイベントが含まれており、すべて軍事領域の事前定義されたスキーマに基づいて手動で注釈付けされている。
我々は,複数の最先端イベント抽出モデルを体系的評価で再現する。
論文 参考訳(メタデータ) (2024-04-18T15:02:35Z) - Towards Event Extraction from Speech with Contextual Clues [61.164413398231254]
本稿では,音声イベント抽出(SpeechEE)タスクを導入し,3つの合成トレーニングセットと1つの人為的テストセットを構築した。
テキストからのイベント抽出と比較して、SpeechEEは、主に連続的で単語境界を持たない複雑な音声信号のために、より大きな課題を提起する。
我々の手法はすべてのデータセットに大幅な改善をもたらし、最大10.7%のF1ゲインを達成する。
論文 参考訳(メタデータ) (2024-01-27T11:07:19Z) - MAVEN-Arg: Completing the Puzzle of All-in-One Event Understanding Dataset with Event Argument Annotation [104.6065882758648]
MAVEN-Argは、イベント検出、イベント引数抽出、イベント関係抽出をサポートする最初のオールインワンデータセットである。
EAEベンチマークでは、(1)162のイベントタイプと612の引数ロールをカバーする包括的なスキーマ、(2)98,591のイベントと290,613の引数を含む大規模なデータスケール、(3)EAEのすべてのタスク変種をサポートする包括的なアノテーションの3つの利点がある。
論文 参考訳(メタデータ) (2023-11-15T16:52:14Z) - MuLMS: A Multi-Layer Annotated Text Corpus for Information Extraction in
the Materials Science Domain [0.7947524927438001]
材料科学の7つのサブドメインにまたがる50のオープンアクセス記事のデータセットであるMulMSを提示する。
すべてのタスクに対して競合するニューラルモデルを提示し、既存の関連リソースによるマルチタスクトレーニングがメリットをもたらすことを示す。
論文 参考訳(メタデータ) (2023-10-24T07:23:46Z) - GET: Group Event Transformer for Event-Based Vision [82.312736707534]
イベントカメラは、注目を集めている新しいニューロモルフィックセンサーの一種である。
我々は、グループイベントトランスフォーマー(GET)と呼ばれる、イベントベースのビジョンのための新しいグループベースのビジョントランスフォーマーバックボーンを提案する。
GETは特徴抽出プロセスを通して空間的インフォメーションから時間的極性情報を分離する。
論文 参考訳(メタデータ) (2023-10-04T08:02:33Z) - Rich Event Modeling for Script Event Prediction [60.67635412135682]
スクリプトイベント予測のためのリッチイベント予測(REP)フレームワークを提案する。
REPは、テキストからそのような情報を抽出するイベント抽出器を含む。
予測器の中核となるコンポーネントは、任意の数の引数を柔軟に扱う変換器ベースのイベントエンコーダである。
論文 参考訳(メタデータ) (2022-12-16T05:17:59Z) - Title2Event: Benchmarking Open Event Extraction with a Large-scale
Chinese Title Dataset [19.634367718707857]
イベントタイプを制限せずにオープンイベント抽出をベンチマークする大規模文レベルデータセットであるTitle2Eventを提示する。
Title2Eventには42,000以上のニュースタイトルがあり、34のトピックが中国のWebページから集められている。
私たちの知る限りでは、これは現在、オープンイベント抽出のための中国最大の手動注釈付きデータセットである。
論文 参考訳(メタデータ) (2022-11-02T04:39:36Z) - EventGraph: Event Extraction as Semantic Graph Parsing [5.21480688623047]
イベント抽出には、イベントトリガとそれに対応するイベント引数の両方の検出と抽出が含まれる。
イベントをグラフとしてエンコードするイベント抽出のための共同フレームワークであるEventGraphを提案する。
私たちのコードとモデルはオープンソースとしてリリースされています。
論文 参考訳(メタデータ) (2022-10-16T22:11:46Z) - COfEE: A Comprehensive Ontology for Event Extraction from text, with an
online annotation tool [3.8995911009078816]
イベント抽出(EE)は、特定のインシデントとそのアクターに関する情報をテキストから導き出そうとする。
EEは知識ベースの構築、情報検索、要約、オンライン監視システムなど、多くの領域で有用である。
COfEEは、環境問題、サイバースペース、犯罪活動、自然災害に関連する新しいカテゴリを含む2つの階層レベル(イベントタイプとイベントサブタイプ)から構成されている。
論文 参考訳(メタデータ) (2021-07-21T19:43:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。