Fugu-MT 論文翻訳(概要): Denoising Relation Extraction from Document-level Distant Supervision

論文の概要: Denoising Relation Extraction from Document-level Distant Supervision

arxiv url: http://arxiv.org/abs/2011.03888v1
Date: Sun, 8 Nov 2020 02:05:25 GMT
ステータス: 翻訳完了
システム内更新日: 2022-09-28 08:29:03.784270
Title: Denoising Relation Extraction from Document-level Distant Supervision
Title（参考訳）: 文書レベル距離スーパービジョンからの雑音関係抽出
Authors: Chaojun Xiao, Yuan Yao, Ruobing Xie, Xu Han, Zhiyuan Liu, Maosong Sun, Fen Lin, Leyu Lin
Abstract要約: 本稿では,文書レベルのDSデータを複数の事前学習タスクで認知するDocREのための新しい事前学習モデルを提案する。大規模DocREベンチマーク実験の結果,ノイズの多いDSデータから有用な情報を抽出し,有望な結果が得られることがわかった。
参考スコア（独自算出の注目度）: 92.76441007250197
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Distant supervision (DS) has been widely used to generate auto-labeled data for sentence-level relation extraction (RE), which improves RE performance. However, the existing success of DS cannot be directly transferred to the more challenging document-level relation extraction (DocRE), since the inherent noise in DS may be even multiplied in document level and significantly harm the performance of RE. To address this challenge, we propose a novel pre-trained model for DocRE, which denoises the document-level DS data via multiple pre-training tasks. Experimental results on the large-scale DocRE benchmark show that our model can capture useful information from noisy DS data and achieve promising results.
Abstract（参考訳）: 遠隔監視(DS)は文レベルの関係抽出(RE)のための自動ラベル付きデータを生成するために広く用いられている。しかし、DSの既存の成功は、文書レベルでも固有のノイズが乗じてREの性能を著しく損なう可能性があるため、より困難な文書レベルの関係抽出(DocRE)に直接転送することはできない。この課題に対処するために,文書レベルのDSデータを複数の事前学習タスクで認知するDocREのための新しい事前学習モデルを提案する。大規模DocREベンチマーク実験の結果,ノイズの多いDSデータから有用な情報を抽出し,有望な結果が得られることがわかった。

関連論文リスト

RobustFT: Robust Supervised Fine-tuning for Large Language Models under Noisy Response [23.45168175163634]
監視された微調整(SFT)は、特定のドメインやタスクに大規模言語モデル(LLM)を適用する上で重要な役割を果たす。本稿では,下流のタスクデータに対してノイズ検出とレバーベリングを行う頑健なSFTフレームワーク(RobustFT)を提案する。 5つのデータセットにわたる複数のLLMで実施された大規模な実験は、ノイズの多いシナリオにおけるRobostFTの例外的なパフォーマンスを示している。
論文参考訳（メタデータ） (2024-12-19T15:00:18Z)
GEGA: Graph Convolutional Networks and Evidence Retrieval Guided Attention for Enhanced Document-level Relation Extraction [15.246183329778656]
ドキュメントレベルの関係抽出(DocRE)は、構造化されていない文書テキストからエンティティ間の関係を抽出することを目的としている。これらの課題を克服するために,DocREの新しいモデルであるGEGAを提案する。我々は、広く使用されている3つのベンチマークデータセット、DocRED、Re-DocRED、Revisit-DocREDでGEGAモデルを評価する。
論文参考訳（メタデータ） (2024-07-31T07:15:33Z)
InstructRAG: Instructing Retrieval-Augmented Generation via Self-Synthesized Rationales [14.655518998487237]
InstructRAGを提案する。そこでは、LMが自己合成的理性を通して認知過程を明示的に学習する。インストラクションRAGは追加の監視を必要としないため、予測された回答の検証が容易になる。実験によると、InstructRAGはトレーニング不要とトレーニング可能な両方のシナリオにおいて、既存のRAGメソッドを一貫して上回っている。
論文参考訳（メタデータ） (2024-06-19T15:25:29Z)
TTM-RE: Memory-Augmented Document-Level Relation Extraction [30.142461633461394]
本稿では,トケンチューリングマシン(Token Turing Machine)と呼ばれるトレーニング可能なメモリモジュールをノイズロス関数と統合したTTM-REを提案する。文書レベルの関係抽出のためのベンチマークデータセットであるReDocREDの実験により、TTM-REが最先端のパフォーマンスを達成することが明らかになった。
論文参考訳（メタデータ） (2024-06-09T20:18:58Z)
Temporal Output Discrepancy for Loss Estimation-based Active Learning [65.93767110342502]
ラベルのないサンプルが高損失を伴っていると信じられている場合に,データアノテーションのオラクルに問い合わせる,新しいディープラーニングアプローチを提案する。本手法は,画像分類やセマンティックセグメンテーションタスクにおける最先端の能動学習手法よりも優れた性能を実現する。
論文参考訳（メタデータ） (2022-12-20T19:29:37Z)
Improving the Robustness of Summarization Models by Detecting and Removing Input Noise [50.27105057899601]
本研究では,様々な種類の入力ノイズから,様々なデータセットやモデルサイズに対する性能損失を定量化する大規模な実験的検討を行った。本稿では,モデル推論中の入力中のそのようなノイズを検出し,除去するための軽量な手法を提案する。
論文参考訳（メタデータ） (2022-12-20T00:33:11Z)
Improving Long Tailed Document-Level Relation Extraction via Easy Relation Augmentation and Contrastive Learning [66.83982926437547]
我々は,DocREが現実のシナリオにおいて,長期分布問題の緩和に不可欠であると主張する。長期分布問題に動機付けられ,DocREを改善するための簡易関係拡張法(ERA)を提案する。
論文参考訳（メタデータ） (2022-05-21T06:15:11Z)
Augmenting Document Representations for Dense Retrieval with Interpolation and Perturbation [49.940525611640346]
ドキュメント拡張(Document Augmentation for dense Retrieval)フレームワークは、ドキュメントの表現をDense Augmentationとperturbationsで強化する。 2つのベンチマークデータセットによる検索タスクにおけるDARの性能評価を行い、ラベル付き文書とラベルなし文書の密集検索において、提案したDARが関連するベースラインを大幅に上回っていることを示す。
論文参考訳（メタデータ） (2022-03-15T09:07:38Z)
SAIS: Supervising and Augmenting Intermediate Steps for Document-Level Relation Extraction [51.27558374091491]
本稿では,関係抽出のための中間ステップ(SAIS)を監督し,拡張することにより,関連コンテキストやエンティティタイプをキャプチャするモデルを明示的に教えることを提案する。そこで本提案手法は,より効果的な管理を行うため,より優れた品質の関係を抽出するだけでなく,それに対応する証拠をより正確に抽出する。
論文参考訳（メタデータ） (2021-09-24T17:37:35Z)
From Bag of Sentences to Document: Distantly Supervised Relation Extraction via Machine Reading Comprehension [22.39362905658063]
新しいDSパラダイム-文書ベースの遠隔監視を提案する。提案手法は,新しい最先端DS性能を実現する。
論文参考訳（メタデータ） (2020-12-08T10:16:27Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。