論文の概要: PRiSM: Enhancing Low-Resource Document-Level Relation Extraction with
Relation-Aware Score Calibration
- arxiv url: http://arxiv.org/abs/2309.13869v1
- Date: Mon, 25 Sep 2023 04:42:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-26 17:02:42.829981
- Title: PRiSM: Enhancing Low-Resource Document-Level Relation Extraction with
Relation-Aware Score Calibration
- Title(参考訳): prism:リレーションアウェアスコアキャリブレーションによる低リソースドキュメントレベルリレーション抽出の強化
- Authors: Minseok Choi, Hyesu Lim, Jaegul Choo
- Abstract要約: ドキュメントレベルの関係抽出(DocRE)は、ドキュメント内のすべてのエンティティペアの関係を抽出することを目的としている。
DocREの主な課題は、人間の集中的な努力を必要とするデータに注釈をつけるコストである。
本稿では,関係意味情報に基づくロジット適応学習を行うPRiSMを提案する。
- 参考スコア(独自算出の注目度): 44.074482478955126
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Document-level relation extraction (DocRE) aims to extract relations of all
entity pairs in a document. A key challenge in DocRE is the cost of annotating
such data which requires intensive human effort. Thus, we investigate the case
of DocRE in a low-resource setting, and we find that existing models trained on
low data overestimate the NA ("no relation") label, causing limited
performance. In this work, we approach the problem from a calibration
perspective and propose PRiSM, which learns to adapt logits based on relation
semantic information. We evaluate our method on three DocRE datasets and
demonstrate that integrating existing models with PRiSM improves performance by
as much as 26.38 F1 score, while the calibration error drops as much as 36
times when trained with about 3% of data. The code is publicly available at
https://github.com/brightjade/PRiSM.
- Abstract(参考訳): ドキュメントレベルの関係抽出(DocRE)は、ドキュメント内のすべてのエンティティペアの関係を抽出することを目的としている。
DocREの重要な課題は、人間の集中的な努力を必要とするデータに注釈をつけるコストである。
そこで我々は,低リソース環境でのDocREの事例を調査し,低データで訓練された既存のモデルがNA(非関係)ラベルを過大評価していることを確認した。
本研究では,コーディレーションの観点から問題にアプローチし,関係意味情報に基づくロジット適応学習を行うPRiSMを提案する。
提案手法を3つのDocREデータセット上で評価し,既存のモデルとPRiSMを統合することにより,最大26.38F1スコアが向上し,キャリブレーション誤差が約3%のトレーニングで最大36倍に低下することを示した。
コードはhttps://github.com/brightjade/PRiSMで公開されている。
関連論文リスト
- Consistent Document-Level Relation Extraction via Counterfactuals [47.75615221596254]
実世界のデータに基づいて訓練された文書レベルの関係抽出モデルが,事実バイアスに悩まされていることが示されている。
文書抽出のための文書レベルの反事実データのデータセットであるCovEReDを提案する。
本研究では,CovEReDモデルを用いて文書レベルの反事実データを生成することにより,一貫性が維持されることを示す。
論文 参考訳(メタデータ) (2024-07-09T09:21:55Z) - Efficient Document Ranking with Learnable Late Interactions [73.41976017860006]
クロスエンコーダ(CE)とデュアルエンコーダ(DE)モデルは,情報検索におけるクエリドキュメント関連性の2つの基本的なアプローチである。
関連性を予測するため、CEモデルは共同クエリドキュメントの埋め込みを使用し、DEモデルは分解クエリとドキュメントの埋め込みを維持している。
近年、DEM構造と軽量スコアラを用いて、より好ましいレイテンシ品質のトレードオフを実現するために、遅延相互作用モデルが提案されている。
論文 参考訳(メタデータ) (2024-06-25T22:50:48Z) - Consistency Guided Knowledge Retrieval and Denoising in LLMs for
Zero-shot Document-level Relation Triplet Extraction [43.50683283748675]
文書レベルの関係トリプルト抽出(DocRTE)は、文書から意味的関係を持つエンティティを同時に抽出することを目的とした情報システムの基本課題である。
既存の手法は、かなりの量の完全なラベル付きデータに依存している。
ChatGPTやLLaMAのような最近の先進言語モデル(LLM)は、素晴らしい長文生成能力を示している。
論文 参考訳(メタデータ) (2024-01-24T17:04:28Z) - Document-Level In-Context Few-Shot Relation Extraction via Pre-Trained Language Models [29.94694305204144]
本稿では,文書レベルのインコンテクスト・イン・ショット関係抽出のための新しいフレームワークを提案する。
ドキュメントレベルの関係抽出用データセットとして最大であるDocREDを用いて,本フレームワークの評価を行った。
論文 参考訳(メタデータ) (2023-10-17T09:10:27Z) - Does Recommend-Revise Produce Reliable Annotations? An Analysis on
Missing Instances in DocRED [60.39125850987604]
テキスト修正方式は, 偽陰性サンプルと, 人気エンティティや関係性に対する明らかな偏見をもたらすことを示す。
より信頼性の高いドキュメントREモデルのテストセットとして機能するように、relabeledデータセットがリリースされている。
論文 参考訳(メタデータ) (2022-04-17T11:29:01Z) - Document-Level Relation Extraction with Adaptive Focal Loss and
Knowledge Distillation [44.39395368597772]
文書レベルの関係抽出(DocRE)は文レベルの比較よりも難しい作業である。
3つの新しいコンポーネントを持つDocREのための半教師付きフレームワークを提案する。
論文 参考訳(メタデータ) (2022-03-21T11:48:40Z) - SAIS: Supervising and Augmenting Intermediate Steps for Document-Level
Relation Extraction [51.27558374091491]
本稿では,関係抽出のための中間ステップ(SAIS)を監督し,拡張することにより,関連コンテキストやエンティティタイプをキャプチャするモデルを明示的に教えることを提案する。
そこで本提案手法は,より効果的な管理を行うため,より優れた品質の関係を抽出するだけでなく,それに対応する証拠をより正確に抽出する。
論文 参考訳(メタデータ) (2021-09-24T17:37:35Z) - Integrating Semantics and Neighborhood Information with Graph-Driven
Generative Models for Document Retrieval [51.823187647843945]
本稿では,周辺情報をグラフ誘導ガウス分布でエンコードし,その2種類の情報をグラフ駆動生成モデルと統合することを提案する。
この近似の下では、トレーニング対象がシングルトンまたはペアワイズ文書のみを含む用語に分解可能であることを証明し、モデルが非関連文書と同じくらい効率的にトレーニングできることを示す。
論文 参考訳(メタデータ) (2021-05-27T11:29:03Z) - Document-Level Relation Extraction with Adaptive Thresholding and
Localized Context Pooling [34.93480801598084]
1つの文書は一般に複数のエンティティペアを含み、1つのエンティティペアは複数の可能な関係に関連付けられた文書に複数回発生する。
適応しきい値と局所化コンテキストプーリングという2つの新しい手法を提案する。
論文 参考訳(メタデータ) (2020-10-21T20:41:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。