論文の概要: A sequence-to-sequence approach for document-level relation extraction
- arxiv url: http://arxiv.org/abs/2204.01098v1
- Date: Sun, 3 Apr 2022 16:03:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-06 07:15:43.743076
- Title: A sequence-to-sequence approach for document-level relation extraction
- Title(参考訳): 文書レベル関係抽出のためのシーケンシャル・ツー・シーケンスアプローチ
- Authors: John Giorgi and Gary D. Bader and Bo Wang
- Abstract要約: 文書レベルの関係抽出(DocRE)は、文内および文間の情報の統合を必要とする。
Seq2relはDocREのエンドツーエンドのサブタスクを学習し、タスク固有のコンポーネントのパイプラインを置き換える。
- 参考スコア(独自算出の注目度): 4.906513405712846
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Motivated by the fact that many relations cross the sentence boundary, there
has been increasing interest in document-level relation extraction (DocRE).
DocRE requires integrating information within and across sentences, capturing
complex interactions between mentions of entities. Most existing methods are
pipeline-based, requiring entities as input. However, jointly learning to
extract entities and relations can improve performance and be more efficient
due to shared parameters and training steps. In this paper, we develop a
sequence-to-sequence approach, seq2rel, that can learn the subtasks of DocRE
(entity extraction, coreference resolution and relation extraction) end-to-end,
replacing a pipeline of task-specific components. Using a simple strategy we
call entity hinting, we compare our approach to existing pipeline-based methods
on several popular biomedical datasets, in some cases exceeding their
performance. We also report the first end-to-end results on these datasets for
future comparison. Finally, we demonstrate that, under our model, an end-to-end
approach outperforms a pipeline-based approach. Our code, data and trained
models are available at {\small{\url{https://github.com/johngiorgi/seq2rel}}}.
An online demo is available at
{\small{\url{https://share.streamlit.io/johngiorgi/seq2rel/main/demo.py}}}.
- Abstract(参考訳): 多くの関係が文境界を越えているという事実によって、文書レベルの関係抽出(DocRE)への関心が高まっている。
DocREは、エンティティの参照間の複雑な相互作用をキャプチャするために、文内および複数の情報を統合する必要がある。
既存のメソッドのほとんどはパイプラインベースで、入力としてエンティティを必要とする。
しかし、エンティティや関係を抽出する共同学習は、共有パラメータやトレーニングステップにより、パフォーマンスを改善し、より効率的になる。
本稿では,docre(entity extraction, coreference resolution and relation extraction)のサブタスクをエンドツーエンドで学習し,タスク固有のコンポーネントのパイプラインを置き換える,シーケンスからシーケンスへのアプローチであるseq2relを開発した。
エンティティヒントと呼ばれる単純な戦略を用いて、我々のアプローチをいくつかの一般的なバイオメディカルデータセット上の既存のパイプラインベースの手法と比較します。
また、これらのデータセットの最初のエンドツーエンドの結果を将来の比較のために報告する。
最後に、私たちのモデルでは、エンドツーエンドのアプローチがパイプラインベースのアプローチよりも優れています。
私たちのコード、データ、トレーニングされたモデルは、 {\small{\url{https://github.com/johngiorgi/seq2rel}}}で利用可能です。
オンラインデモは {\small{\url{https://share.streamlit.io/johngiorgi/seq2rel/main/demo.py}}}で見ることができる。
関連論文リスト
- PEneo: Unifying Line Extraction, Line Grouping, and Entity Linking for
End-to-end Document Pair Extraction [29.620120164447737]
ドキュメントペア抽出は、キーエンティティとバリューエンティティの識別と、視覚的に豊富なドキュメントからの関連性の実現を目的としている。
既存のほとんどのメソッドは、セマンティックエンティティ認識(SER)と関係抽出(RE)の2つのタスクに分割している。
本稿では,ライン抽出,ライングルーピング,エンティティリンクという3つの並列サブタスクを組み込んだ,統一パイプラインで文書ペア抽出を行うPEneoについて紹介する。
論文 参考訳(メタデータ) (2024-01-07T12:48:07Z) - Joint Entity and Relation Extraction with Span Pruning and Hypergraph
Neural Networks [58.43972540643903]
PLマーカ(最先端マーカーベースピプレリンモデル)上に構築されたEREのためのHyperGraphニューラルネットワーク(hgnn$)を提案する。
エラーの伝播を軽減するため,NERモジュールからのエンティティ識別とラベル付けの負担をモデルのジョイントモジュールに転送するために,ハイリコールプルーナー機構を用いる。
EREタスクに広く使用されている3つのベンチマークの実験は、以前の最先端のPLマーカーよりも大幅に改善されている。
論文 参考訳(メタデータ) (2023-10-26T08:36:39Z) - In-context Pretraining: Language Modeling Beyond Document Boundaries [137.53145699439898]
In-Context Pretrainingは、言語モデルが関連するドキュメントのシーケンスで事前トレーニングされる新しいアプローチである。
本稿では, 近接探索を効率的に行うための近似アルゴリズムを提案する。
より複雑なコンテキスト推論を必要とするタスクの顕著な改善が見られます。
論文 参考訳(メタデータ) (2023-10-16T17:57:12Z) - Mutually Guided Few-shot Learning for Relational Triple Extraction [10.539566491939844]
三重抽出(MG-FTE)のための相互指導型Few-shot学習フレームワーク
本手法は,関係を分類するエンティティ誘導型リレーショナルデコーダと,エンティティを抽出するプロトデコーダとから構成される。
FewRel 1.0(単一ドメイン)では12.6F1スコア、FewRel 2.0(クロスドメイン)では20.5F1スコアで、多くの最先端手法よりも優れています。
論文 参考訳(メタデータ) (2023-06-23T06:15:54Z) - HIORE: Leveraging High-order Interactions for Unified Entity Relation
Extraction [85.80317530027212]
本稿では,統合エンティティ関係抽出のための新しい手法であるHIOREを提案する。
重要な洞察は、単語ペア間の複雑な関連を活用することである。
実験の結果,HIOREは従来最高の統一モデルよりも1.11.8 F1ポイント向上した。
論文 参考訳(メタデータ) (2023-05-07T14:57:42Z) - MAVEN-ERE: A Unified Large-scale Dataset for Event Coreference,
Temporal, Causal, and Subevent Relation Extraction [78.61546292830081]
アノテーションを改良した大規模EREデータセットMAVEN-EREを構築した。
103,193個のイベント・コア・チェイン、1,216,217個の時間関係、57,992個の因果関係、15,841個の部分関係を含む。
実験の結果,MAVEN-ERE上でのEREは極めて困難であり,共同学習との相互関係を考慮すれば性能が向上することが示された。
論文 参考訳(メタデータ) (2022-11-14T13:34:49Z) - DORE: Document Ordered Relation Extraction based on Generative Framework [56.537386636819626]
本稿では,既存のDocREモデルの根本原因について検討する。
本稿では,モデルが学習しやすく,決定論的な関係行列から記号列と順序列を生成することを提案する。
4つのデータセットに対する実験結果から,提案手法は生成型DocREモデルの性能を向上させることができることが示された。
論文 参考訳(メタデータ) (2022-10-28T11:18:10Z) - Relation-Specific Attentions over Entity Mentions for Enhanced
Document-Level Relation Extraction [4.685620089585031]
本稿では,候補関係に関して,異なるエンティティの言及に対して選択的に注目するRSMANを提案する。
2つのベンチマークデータセットによる実験により、RSMANはいくつかのバックボーンモデルに大幅な改善をもたらすことが示された。
論文 参考訳(メタデータ) (2022-05-28T10:40:31Z) - A Hierarchical Entity Graph Convolutional Network for Relation
Extraction across Documents [29.183245395412705]
本稿では,関係の2つの実体が2つの異なる文書に現れる文書間関係抽出法を提案する。
このアイデアに従い、各チェーンが正確に2つのドキュメントを含む2つのホップ関係抽出のためのデータセットを作成する。
提案するデータセットは,公開されている文レベルのデータセットよりも高い関係性を示す。
論文 参考訳(メタデータ) (2021-08-21T12:33:50Z) - Learning to Match Jobs with Resumes from Sparse Interaction Data using
Multi-View Co-Teaching Network [83.64416937454801]
ジョブ列のインタラクションデータは疎結合でノイズが多く、ジョブ列のマッチングアルゴリズムのパフォーマンスに影響する。
求人情報マッチングのための疎相互作用データから,新しいマルチビュー協調学習ネットワークを提案する。
我々のモデルは求人マッチングの最先端手法より優れている。
論文 参考訳(メタデータ) (2020-09-25T03:09:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。