Fugu-MT 論文翻訳(概要): A Multimodal Text- and Graph-Based Approach for Open-Domain Event Extraction from Documents

論文の概要: A Multimodal Text- and Graph-Based Approach for Open-Domain Event Extraction from Documents

arxiv url: http://arxiv.org/abs/2604.21885v1
Date: Thu, 23 Apr 2026 17:33:44 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-24 14:40:06.79007
Title: A Multimodal Text- and Graph-Based Approach for Open-Domain Event Extraction from Documents
Title（参考訳）: 文書からのオープンドメインイベント抽出のためのマルチモーダルテキストとグラフに基づくアプローチ
Authors: Praval Sharma,
Abstract要約: オープンドメインイベント抽出のための新しいアプローチであるMODEEを提案する。グラフベースの学習とLLMからのテキストベースの表現を組み合わせて、文書レベルの推論をモデル化する。大規模なデータセットに対する実証的な評価は、MODEEが最先端のオープンドメインイベント抽出アプローチより優れていることを示している。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Event extraction is essential for event understanding and analysis. It supports tasks such as document summarization and decision-making in emergency scenarios. However, existing event extraction approaches have limitations: (1) closed-domain algorithms are restricted to predefined event types and thus rarely generalize to unseen types and (2) open-domain event extraction algorithms, capable of handling unconstrained event types, have largely overlooked the potential of large language models (LLMs) despite their advanced abilities. Additionally, they do not explicitly model document-level contextual, structural, and semantic reasoning, which are crucial for effective event extraction but remain challenging for LLMs due to lost-in-the-middle phenomenon and attention dilution. To address these limitations, we propose multimodal open-domain event extraction, MODEE , a novel approach for open-domain event extraction that combines graph-based learning with text-based representation from LLMs to model document-level reasoning. Empirical evaluations on large datasets demonstrate that MODEE outperforms state-of-the-art open-domain event extraction approaches and can be generalized to closed-domain event extraction, where it outperforms existing algorithms.
Abstract（参考訳）: イベントの抽出は、イベントの理解と分析に不可欠である。緊急時の文書要約や意思決定といったタスクをサポートする。しかし、既存のイベント抽出手法には制限がある: (1) クローズドドメインのアルゴリズムは事前定義されたイベントタイプに制限され、それゆえにほとんど一般化されず、(2) 制約のないイベントタイプを扱えるオープンドメインのイベント抽出アルゴリズムは、その高度な能力にもかかわらず、大きな言語モデル(LLM)の可能性をほとんど見落としている。さらに、文書レベルの文脈的、構造的、意味的推論を明示的にモデル化することは、効果的なイベント抽出には不可欠であるが、中途半端な現象や注意の希釈により、LSMにとって困難なままである。これらの制約に対処するため,オープンドメインイベント抽出手法であるMODEEを提案する。これは,グラフベース学習とLLMからのテキストベース表現を組み合わせた,オープンドメインイベント抽出の新しいアプローチである。大規模なデータセットに対する実証的な評価は、MODEEが最先端のオープンドメインイベント抽出アプローチより優れており、クローズドドメインイベント抽出に一般化でき、既存のアルゴリズムより優れていることを示している。

関連論文リスト

EVENT5Ws: A Large Dataset for Open-Domain Event Extraction from Documents [0.15749416770494704]
EVENT5Wsは、手動で注釈付けされ、統計的に検証されたオープンドメインイベント抽出データセットである。我々は、最先端の事前訓練された大規模言語モデルを評価し、将来の研究のためのベンチマークを確立する。
論文参考訳（メタデータ） (2026-04-23T17:42:07Z)
Unveiling the Invisible: Reasoning Complex Occlusions Amodally with AURA [49.10341970643037]
アモーダルセグメンテーションは、隠蔽された領域の外観が利用できない場合でも、隠蔽された物体の完全な形状を推測することを目的としている。現在のアモーダルセグメンテーション手法では、テキスト入力によってユーザと対話する能力が欠如している。本稿では,隠蔽対象物の完全な非モーダル形状を予測することを目的とした,非モーダル推論セグメンテーション(amodal reasoning segmentation)という新しいタスクを提案する。
論文参考訳（メタデータ） (2025-03-13T10:08:18Z)
Grounding Partially-Defined Events in Multimodal Data [61.0063273919745]
部分定義イベントに対するマルチモーダル定式化を導入し、これらのイベントの抽出を3段階スパン検索タスクとしてキャストする。このタスクのベンチマークであるMultiVENT-Gを提案し,22.8Kのラベル付きイベント中心エンティティを含む,14.5時間の高密度アノテーション付き現在のイベントビデオと1,168のテキストドキュメントからなる。結果は、イベント理解の抽象的な課題を示し、イベント中心のビデオ言語システムにおける約束を実証する。
論文参考訳（メタデータ） (2024-10-07T17:59:48Z)
Beyond Single-Event Extraction: Towards Efficient Document-Level Multi-Event Argument Extraction [19.51890490853855]
複数項目の引数抽出モデルDEEIAを提案する。ドキュメント内のすべてのイベントから引数を同時に抽出することができる。提案手法は,4つの公開データセット上での最先端性能を実現する。
論文参考訳（メタデータ） (2024-05-03T07:04:35Z)
Token-Event-Role Structure-based Multi-Channel Document-Level Event Extraction [15.02043375212839]
本稿では,トークン・イベント・ロールと呼ばれる新しいデータ構造を取り入れた,文書レベルのイベント抽出のための新しいフレームワークを提案する。提案したデータ構造により,複数のイベントにおけるトークンの主要な役割を明らかにすることができ,イベント関係のより包括的な理解が容易になる。その結果,本手法はF1スコアの9.5ポイント向上した。
論文参考訳（メタデータ） (2023-06-30T15:22:57Z)
Zero-Shot On-the-Fly Event Schema Induction [61.91468909200566]
本稿では,大規模な言語モデルを用いて,高レベルなイベント定義,特定のイベント,引数,それらの関係を予測・付与するソースドキュメントを生成する手法を提案する。我々のモデルを用いて、任意のトピックに関する完全なスキーマを、手動のデータ収集、すなわちゼロショットの方法で、オンザフライで生成することができる。
論文参考訳（メタデータ） (2022-10-12T14:37:00Z)
PILED: An Identify-and-Localize Framework for Few-Shot Event Detection [79.66042333016478]
本研究では,事前学習した言語モデルから事象関連知識を引き出すために,クローゼプロンプトを用いた。型固有のパラメータの数を最小化し、新しい型に対するイベント検出タスクに迅速に適応できるようにします。
論文参考訳（メタデータ） (2022-02-15T18:01:39Z)
Query and Extract: Refining Event Extraction as Type-oriented Binary Decoding [51.57864297948228]
本稿では,自然言語クエリとしてイベントタイプと引数ロールを取り入れた新しいイベント抽出フレームワークを提案する。我々のフレームワークは、イベントタイプや引数ロールと入力テキストとのセマンティックな相関をよりよく捉えるための注意機構の恩恵を受ける。
論文参考訳（メタデータ） (2021-10-14T15:49:40Z)
Document-level Event Extraction with Efficient End-to-end Learning of Cross-event Dependencies [37.96254956540803]
本稿では,構造化予測アルゴリズムであるDeep Value Networks (DVN) を利用したエンドツーエンドモデルを提案する。提案手法はACE05上でのCRFモデルに匹敵する性能を達成し,計算効率は極めて高い。
論文参考訳（メタデータ） (2020-10-24T05:28:16Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。