論文の概要: DocRED-FE: A Document-Level Fine-Grained Entity And Relation Extraction
Dataset
- arxiv url: http://arxiv.org/abs/2303.11141v2
- Date: Tue, 21 Mar 2023 09:03:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-22 11:10:28.987689
- Title: DocRED-FE: A Document-Level Fine-Grained Entity And Relation Extraction
Dataset
- Title(参考訳): DocRED-FE: ドキュメントレベルの細粒度エンティティと関係抽出データセット
- Authors: Hongbo Wang, Weimin Xiong, Yifan Song, Dawei Zhu, Yu Xia and Sujian Li
- Abstract要約: 文書レベルのきめ細かいJEREデータセットDocRED-FEを構築した。
具体的には、11の粗粒度型と119の細粒度型を含む階層的なエンティティ型スキーマを使用して、DocREDを手動で再アノテーションします。
- 参考スコア(独自算出の注目度): 22.493659268713557
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Joint entity and relation extraction (JERE) is one of the most important
tasks in information extraction. However, most existing works focus on
sentence-level coarse-grained JERE, which have limitations in real-world
scenarios. In this paper, we construct a large-scale document-level
fine-grained JERE dataset DocRED-FE, which improves DocRED with Fine-Grained
Entity Type. Specifically, we redesign a hierarchical entity type schema
including 11 coarse-grained types and 119 fine-grained types, and then
re-annotate DocRED manually according to this schema. Through comprehensive
experiments we find that: (1) DocRED-FE is challenging to existing JERE models;
(2) Our fine-grained entity types promote relation classification. We make
DocRED-FE with instruction and the code for our baselines publicly available at
https://github.com/PKU-TANGENT/DOCRED-FE.
- Abstract(参考訳): JERE(Joint entity and Relation extract)は、情報抽出において最も重要なタスクの一つである。
しかし、既存のほとんどの研究は、実世界のシナリオに制限がある文レベルの粗いJEREに焦点を当てている。
本稿では,ドキュメントレベルのきめ細かなjereデータセットであるdocred-feを構築し,きめ細かなエンティティタイプでdocredを改善した。
具体的には、11の粗粒度型と119の細粒度型を含む階層エンティティ型スキーマを再設計し、このスキーマに従って手動でdocrを再アノテーションします。
1) DocRED-FEは既存のJEREモデルでは困難である。
DocRED-FEには命令とベースラインのコードがhttps://github.com/PKU-TANGENT/DOCRED-FEで公開されています。
関連論文リスト
- On the Robustness of Document-Level Relation Extraction Models to Entity Name Variations [33.56352555780006]
本研究では,DocREモデルのエンティティ名のバリエーションに対する堅牢性について検討する。
本稿では,元となるエンティティ名をWikidataから名前に置き換えることで,エンティティにリネームされたドキュメントを生成するための原則的パイプラインを提案する。
実験結果から、3つの代表的なDocREモデルと2つのコンテキスト内モデルの両方が、エンティティ名のバリエーションに十分なロバスト性が欠如していることが判明した。
論文 参考訳(メタデータ) (2024-06-11T16:51:14Z) - DocumentNet: Bridging the Data Gap in Document Pre-Training [78.01647768018485]
本稿では,Webから大規模かつ弱いラベル付きデータを収集し,VDERモデルの学習に役立てる手法を提案する。
収集されたデータセットはDocumentNetと呼ばれ、特定のドキュメントタイプやエンティティセットに依存しない。
広く採用されているVDERタスクの実験は、DocumentNetを事前トレーニングに組み込んだ場合、大幅に改善されている。
論文 参考訳(メタデータ) (2023-06-15T08:21:15Z) - Doc2SoarGraph: Discrete Reasoning over Visually-Rich Table-Text
Documents via Semantic-Oriented Hierarchical Graphs [79.0426838808629]
視覚的にリッチなテーブルテキスト文書に答えるTAT-DQAを提案する。
具体的には、離散推論機能を強化した新しいDoc2SoarGraphフレームワークを提案する。
我々は,TAT-DQAデータセットに関する広範な実験を行い,提案したフレームワークは,テストセット上でのエクサクティマッチ(EM)とF1スコアでそれぞれ17.73%,F1スコアで16.91%の最高のベースラインモデルを上回る結果を得た。
論文 参考訳(メタデータ) (2023-05-03T07:30:32Z) - Document-level Relation Extraction with Cross-sentence Reasoning Graph [14.106582119686635]
関係抽出(RE)は、最近、文レベルから文書レベルに移行した。
GRaph情報集約・クロスセンス推論ネットワーク(GRACR)を用いた新しい文書レベルのREモデルを提案する。
実験結果から,GRACRは文書レベルのREの2つの公開データセットにおいて優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2023-03-07T14:14:12Z) - Not Just Plain Text! Fuel Document-Level Relation Extraction with
Explicit Syntax Refinement and Subsentence Modeling [3.9436257406798925]
expLicit syntAx Refinement and Subsentence mOdeliNg based framework (LARSON)を提案する。
余分な構文情報を導入することで、LARSONは任意の粒度のサブ文をモデル化し、効果的なインストラクティブを表示できる。
3つのベンチマークデータセット(DocRED、CDR、GDA)の実験結果から、LARSONは既存の手法よりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2022-11-10T05:06:37Z) - DORE: Document Ordered Relation Extraction based on Generative Framework [56.537386636819626]
本稿では,既存のDocREモデルの根本原因について検討する。
本稿では,モデルが学習しやすく,決定論的な関係行列から記号列と順序列を生成することを提案する。
4つのデータセットに対する実験結果から,提案手法は生成型DocREモデルの性能を向上させることができることが示された。
論文 参考訳(メタデータ) (2022-10-28T11:18:10Z) - Learning Diverse Document Representations with Deep Query Interactions
for Dense Retrieval [79.37614949970013]
そこで本研究では,問合せの深い文書表現を学習する高密度検索モデルを提案する。
本モデルでは,各文書に生成した擬似クエリをエンコードして,クエリインフォームド・マルチビュー文書表現を得る。
論文 参考訳(メタデータ) (2022-08-08T16:00:55Z) - Entity Type Prediction Leveraging Graph Walks and Entity Descriptions [4.147346416230273]
textitGRANDは、RDF2vecの異なるグラフウォーク戦略とテキストエンティティ記述を利用したエンティティ型付けの新しいアプローチである。
提案手法は,細粒度クラスと粗粒度クラスの両方において,KGにおけるエンティティ型付けのためのベンチマークデータセットDBpediaとFIGERのベースラインアプローチよりも優れている。
論文 参考訳(メタデータ) (2022-07-28T13:56:55Z) - Document-Level Relation Extraction with Sentences Importance Estimation
and Focusing [52.069206266557266]
文書レベルの関係抽出(DocRE)は、複数の文の文書から2つのエンティティ間の関係を決定することを目的としている。
我々はDocREのための文重要度スコアと文集中損失を設計するSIEF(Sentence Estimation and Focusing)フレームワークを提案する。
2つのドメインの実験結果から、SIEFは全体的なパフォーマンスを改善するだけでなく、DocREモデルをより堅牢にします。
論文 参考訳(メタデータ) (2022-04-27T03:20:07Z) - Eider: Evidence-enhanced Document-level Relation Extraction [56.71004595444816]
文書レベルの関係抽出(DocRE)は、文書内のエンティティペア間の意味関係を抽出することを目的としている。
本稿では,共同関係と証拠抽出,エビデンス中心関係抽出(RE),抽出結果の融合からなる3段階のエビデンス強化DocREフレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-16T09:43:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。