Fugu-MT 論文翻訳(概要): Document-Level In-Context Few-Shot Relation Extraction via Pre-Trained Language Models

論文の概要: Document-Level In-Context Few-Shot Relation Extraction via Pre-Trained Language Models

arxiv url: http://arxiv.org/abs/2310.11085v4
Date: Wed, 02 Oct 2024 11:35:45 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-05 07:10:51.044489
Title: Document-Level In-Context Few-Shot Relation Extraction via Pre-Trained Language Models
Title（参考訳）: 事前学習言語モデルによる文書レベルインコンテクストのFew-Shot関係抽出
Authors: Yilmazcan Ozyurt, Stefan Feuerriegel, Ce Zhang,
Abstract要約: 本稿では,文書レベルのインコンテクスト・イン・ショット関係抽出のための新しいフレームワークを提案する。ドキュメントレベルの関係抽出用データセットとして最大であるDocREDを用いて,本フレームワークの評価を行った。
参考スコア（独自算出の注目度）: 29.94694305204144
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Document-level relation extraction aims at inferring structured human knowledge from textual documents. State-of-the-art methods for this task use pre-trained language models (LMs) via fine-tuning, yet fine-tuning is computationally expensive and cannot adapt to new relation types or new LMs. As a remedy, we leverage the generalization capabilities of pre-trained LMs and present a novel framework for document-level in-context few-shot relation extraction. Our framework has three strengths: it eliminates the need (1) for named entity recognition and (2) for human annotations of documents, and (3) it can be updated to new LMs without re-training. We evaluate our framework using DocRED, the largest publicly available dataset for document-level relation extraction, and demonstrate that our framework achieves state-of-the-art performance. We further show that our framework actually performs much better than the original labels from the development set of DocRED. Finally, we conduct an extensive benchmark demonstrating the effectiveness of our framework, achieving state-of-the-art results across six relation extraction datasets and outperforming more than 30 baseline methods. Unlike our framework, the baseline methods have large computational overhead (e.g., from fine-tuning). To the best of our knowledge, we are the first to reformulate the document-level relation extraction task as a tailored in-context few-shot learning paradigm.
Abstract（参考訳）: 文書レベルの関係抽出は、文書から構造化された人間の知識を推定することを目的としている。このタスクの最先端の手法は、微調整によって事前訓練された言語モデル(LM)を使用するが、微調整は計算コストが高く、新しい関係型や新しいLMに適応できない。本稿では,事前学習したLMの一般化機能を活用し,文書レベルのインコンテキスト・少数ショット関係抽出のための新しいフレームワークを提案する。フレームワークには,(1)名前付きエンティティ認識,(2)文書の人為的アノテーションの必要性を排除し,(3)再学習なしに新しいLMに更新できる,という3つの長所がある。文書レベルの関係抽出のための最大公用データセットであるDocREDを用いて、我々のフレームワークを評価し、我々のフレームワークが最先端のパフォーマンスを達成することを示す。さらに、私たちのフレームワークはDocREDの開発セットのオリジナルのラベルよりもはるかに優れたパフォーマンスを示します。最後に、我々のフレームワークの有効性を実証する広範囲なベンチマークを行い、6つの関係抽出データセットにまたがって最先端の結果を達成し、30以上のベースライン手法を上回ります。我々のフレームワークとは異なり、ベースライン法は計算オーバーヘッドが大きい(例えば微調整から)。我々の知識を最大限に活用するために、文書レベルの関係抽出タスクを、コンテキスト内数ショット学習のパラダイムとしてカスタマイズしたものとして、我々は、まず、文書レベルの関係抽出タスクを再構築する。

関連論文リスト

Consistency Guided Knowledge Retrieval and Denoising in LLMs for Zero-shot Document-level Relation Triplet Extraction [43.50683283748675]
文書レベルの関係トリプルト抽出(DocRTE)は、文書から意味的関係を持つエンティティを同時に抽出することを目的とした情報システムの基本課題である。既存の手法は、かなりの量の完全なラベル付きデータに依存している。 ChatGPTやLLaMAのような最近の先進言語モデル(LLM)は、素晴らしい長文生成能力を示している。
論文参考訳（メタデータ） (2024-01-24T17:04:28Z)
Semi-automatic Data Enhancement for Document-Level Relation Extraction with Distant Supervision from Large Language Models [26.523153535336725]
ドキュメントレベルの関係抽出(DocRE)は、長いコンテキストから関係を抽出することを目的としている。本稿では,大規模言語モデル (LLM) と自然言語推論 (NLI) モジュールを統合する手法を提案する。 DocGNREと呼ばれる拡張データセットを導入することで,提案手法の有効性を実証する。
論文参考訳（メタデータ） (2023-11-13T13:10:44Z)
ReSel: N-ary Relation Extraction from Scientific Text and Tables by Learning to Retrieve and Select [53.071352033539526]
学術論文からN-ary関係を抽出する問題について考察する。提案手法であるReSelは,このタスクを2段階のプロシージャに分解する。 3つの科学的情報抽出データセットに対する実験により、ReSelは最先端のベースラインを大きく上回っていることがわかった。
論文参考訳（メタデータ） (2022-10-26T02:28:02Z)
Unified Pretraining Framework for Document Understanding [52.224359498792836]
文書理解のための統合事前学習フレームワークであるUDocを紹介する。 UDocは、ほとんどのドキュメント理解タスクをサポートするように設計されており、Transformerを拡張してマルチモーダル埋め込みを入力とする。 UDocの重要な特徴は、3つの自己管理的損失を利用して汎用的な表現を学ぶことである。
論文参考訳（メタデータ） (2022-04-22T21:47:04Z)
Modeling Multi-Granularity Hierarchical Features for Relation Extraction [26.852869800344813]
本稿では,原文のみに基づく多粒度特徴抽出手法を提案する。外部知識を必要とせずに,効果的な構造的特徴が達成可能であることを示す。
論文参考訳（メタデータ） (2022-04-09T09:44:05Z)
Value Retrieval with Arbitrary Queries for Form-like Documents [50.5532781148902]
フォーム状文書に対する任意のクエリを用いた値検索を提案する。本手法は,フォームのレイアウトやセマンティクスの理解に基づいて,任意のクエリのターゲット値を予測する。本稿では,大規模モデル事前学習における文書理解を改善するためのシンプルな文書言語モデリング (simpleDLM) 戦略を提案する。
論文参考訳（メタデータ） (2021-12-15T01:12:02Z)
Integrating Semantics and Neighborhood Information with Graph-Driven Generative Models for Document Retrieval [51.823187647843945]
本稿では,周辺情報をグラフ誘導ガウス分布でエンコードし,その2種類の情報をグラフ駆動生成モデルと統合することを提案する。この近似の下では、トレーニング対象がシングルトンまたはペアワイズ文書のみを含む用語に分解可能であることを証明し、モデルが非関連文書と同じくらい効率的にトレーニングできることを示す。
論文参考訳（メタデータ） (2021-05-27T11:29:03Z)
Entity and Evidence Guided Relation Extraction for DocRED [33.69481141963074]
この課題に対して,共同トレーニングフレームワークE2GRE(Entity and Evidence Guided Relation extract)を提案する。事前訓練された言語モデル(例えばBERT, RoBERTa)への入力としてエンティティ誘導シーケンスを導入する。これらのエンティティ誘導シーケンスは、事前訓練された言語モデル(LM)がエンティティに関連するドキュメントの領域に集中するのに役立ちます。我々は最近リリースされた関係抽出のための大規模データセットDocREDに対するE2GREアプローチを評価した。
論文参考訳（メタデータ） (2020-08-27T17:41:23Z)
Reasoning with Latent Structure Refinement for Document-Level Relation Extraction [20.308845516900426]
本稿では,潜在文書レベルグラフを自動的に誘導することにより,文間の関係推論を促進する新しいモデルを提案する。具体的には、大規模文書レベルデータセット(DocRED)上でF1スコア59.05を達成する。
論文参考訳（メタデータ） (2020-05-13T13:36:09Z)
Exploiting Structured Knowledge in Text via Graph-Guided Representation Learning [73.0598186896953]
本稿では、知識グラフからのガイダンスを用いて、生テキスト上で学習する2つの自己教師型タスクを提案する。エンティティレベルのマスキング言語モデルに基づいて、最初のコントリビューションはエンティティマスキングスキームです。既存のパラダイムとは対照的に,本手法では事前学習時にのみ,知識グラフを暗黙的に使用する。
論文参考訳（メタデータ） (2020-04-29T14:22:42Z)
Pre-training for Abstractive Document Summarization by Reinstating Source Text [105.77348528847337]
本稿では,Seq2Seqに基づく非ラベルテキストによる抽象要約モデルの事前学習を可能にする3つの事前学習目標を提案する。 2つのベンチマーク要約データセットの実験では、3つの目的がすべてベースラインでパフォーマンスを向上させることが示されている。
論文参考訳（メタデータ） (2020-04-04T05:06:26Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。