論文の概要: Uncertainty Guided Label Denoising for Document-level Distant Relation
Extraction
- arxiv url: http://arxiv.org/abs/2305.11029v2
- Date: Fri, 26 May 2023 08:23:43 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-29 19:44:38.215282
- Title: Uncertainty Guided Label Denoising for Document-level Distant Relation
Extraction
- Title(参考訳): 文書レベルの距離関係抽出のための不確かさ誘導ラベル
- Authors: Qi Sun and Kun Huang and Xiaocui Yang and Pengfei Hong and Kun Zhang
and Soujanya Poria
- Abstract要約: 文書レベルの関係抽出(DocRE)は、文書内のエンティティ間の複雑な意味関係を推論することを目的としている。
最近の研究は、DSデータのノイズを低減するために、プレデノジングモデルによって生成された擬似ラベルを活用している。
疑似ラベルを信頼できるかどうかを判定するために不確実性推定技術を導入する。
- 参考スコア(独自算出の注目度): 27.007031571500583
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Document-level relation extraction (DocRE) aims to infer complex semantic
relations among entities in a document. Distant supervision (DS) is able to
generate massive auto-labeled data, which can improve DocRE performance. Recent
works leverage pseudo labels generated by the pre-denoising model to reduce
noise in DS data. However, unreliable pseudo labels bring new noise, e.g.,
adding false pseudo labels and losing correct DS labels. Therefore, how to
select effective pseudo labels to denoise DS data is still a challenge in
document-level distant relation extraction. To tackle this issue, we introduce
uncertainty estimation technology to determine whether pseudo labels can be
trusted. In this work, we propose a Document-level distant Relation Extraction
framework with Uncertainty Guided label denoising, UGDRE. Specifically, we
propose a novel instance-level uncertainty estimation method, which measures
the reliability of the pseudo labels with overlapping relations. By further
considering the long-tail problem, we design dynamic uncertainty thresholds for
different types of relations to filter high-uncertainty pseudo labels. We
conduct experiments on two public datasets. Our framework outperforms strong
baselines by 1.91 F1 and 2.28 Ign F1 on the RE-DocRED dataset.
- Abstract(参考訳): 文書レベルの関係抽出(DocRE)は、文書内のエンティティ間の複雑な意味関係を推論することを目的としている。
遠隔監視(DS)は、DocREのパフォーマンスを改善することができる大規模な自動ラベル付きデータを生成することができる。
最近の研究は、DSデータのノイズを低減するために、プレデノジングモデルによって生成された擬似ラベルを活用している。
しかし、信頼できない偽ラベルは、例えば偽の偽ラベルを追加し、正しいDSラベルを失うなど、新しいノイズをもたらす。
したがって、DSデータを識別する効果的な擬似ラベルをどうやって選択するかは、文書レベルの遠隔関係抽出において依然として課題である。
この問題に対処するために,疑似ラベルを信頼できるかどうかを判定する不確実性推定技術を導入する。
本研究では,不確実性誘導ラベルを用いた文書レベルの遠隔関係抽出フレームワークUGDREを提案する。
具体的には,重複関係を持つ擬似ラベルの信頼性を測定する新しいインスタンスレベルの不確実性推定法を提案する。
さらに, ロングテール問題を考えることで, 高信頼擬似ラベルをフィルタするために, 異なる種類の関係に対する動的不確かさしきい値を設計する。
2つの公開データセットで実験を行う。
我々のフレームワークは、RE-DocREDデータセット上で、1.91 F1と2.28 Ign F1の強いベースラインを上回ります。
関連論文リスト
- Soft Curriculum for Learning Conditional GANs with Noisy-Labeled and
Uncurated Unlabeled Data [70.25049762295193]
本稿では,トレーニング中にノイズラベル付きおよび未処理データを受け入れる条件付き画像生成フレームワークを提案する。
本稿では,ラベルのないデータに新たなラベルを割り当てながら,逆行訓練にインスタンスワイドを割り当てるソフトカリキュラム学習を提案する。
実験により,本手法は,定量および定性性能の両面において,既存の半教師付き・ラベル付きロバストな手法より優れていることが示された。
論文 参考訳(メタデータ) (2023-07-17T08:31:59Z) - Is your noise correction noisy? PLS: Robustness to label noise with two
stage detection [16.65296285599679]
本報告では, ノイズが検出された場合に, ノイズの補正精度を向上させることを提案する。
多くの最先端コントリビューションでは、修正された擬似ラベルを推測する前にノイズサンプルを検出する2段階のアプローチが採用されている。
ノイズサンプルの擬似ラベルの正しさと強く相関する単純な測度である擬似ロスを提案する。
論文 参考訳(メタデータ) (2022-10-10T11:32:28Z) - Part-based Pseudo Label Refinement for Unsupervised Person
Re-identification [29.034390810078172]
教師なしの人物再識別(re-ID)は、ラベルなしデータから人物検索のための識別表現を学習することを目的としている。
近年の手法では擬似ラベルを用いることでこの課題が達成されているが,これらのラベルは本質的にノイズが多く,精度が低下している。
本稿では,グローバルな特徴と部分的特徴の相補関係を利用して,ラベルノイズを低減するPseudo Label Refinement (PPLR) フレームワークを提案する。
論文 参考訳(メタデータ) (2022-03-28T12:15:53Z) - Unsupervised Domain Adaptive Salient Object Detection Through
Uncertainty-Aware Pseudo-Label Learning [104.00026716576546]
そこで本研究では,手動のアノテーションを使わずに,自然に高いピクセルラベル品質を有する合成・クリーンなラベルから,サリエンスを学習することを提案する。
提案手法は,複数のベンチマークデータセット上で,既存の最先端の深層教師なしSOD法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-02-26T16:03:55Z) - Two Wrongs Don't Make a Right: Combating Confirmation Bias in Learning
with Label Noise [6.303101074386922]
Robust Label Refurbishment (Robust LR) は、擬似ラベルと信頼度推定技術を組み込んだ新しいハイブリッド手法である。
本手法はラベルノイズと確認バイアスの両方の損傷を軽減できることを示す。
例えば、Robust LRは、実世界のノイズデータセットであるWebVisionにおいて、以前の最高値よりも最大4.5%の絶対的トップ1精度の向上を実現している。
論文 参考訳(メタデータ) (2021-12-06T12:10:17Z) - An Ensemble Noise-Robust K-fold Cross-Validation Selection Method for
Noisy Labels [0.9699640804685629]
大規模なデータセットには、ディープニューラルネットワーク(DNN)によって記憶されるような、ラベルのずれたサンプルが含まれている傾向があります。
本稿では, ノイズデータからクリーンなサンプルを効果的に選択するために, アンサンブルノイズ・ロバスト K-fold Cross-Validation Selection (E-NKCVS) を提案する。
我々は,ラベルが手動で異なる雑音比で破損した様々な画像・テキスト分類タスクに対するアプローチを評価する。
論文 参考訳(メタデータ) (2021-07-06T02:14:52Z) - Tackling Instance-Dependent Label Noise via a Universal Probabilistic
Model [80.91927573604438]
本稿では,ノイズラベルをインスタンスに明示的に関連付ける,単純かつ普遍的な確率モデルを提案する。
合成および実世界のラベルノイズを用いたデータセット実験により,提案手法がロバスト性に大きな改善をもたらすことを確認した。
論文 参考訳(メタデータ) (2021-01-14T05:43:51Z) - A Second-Order Approach to Learning with Instance-Dependent Label Noise [58.555527517928596]
ラベルノイズの存在は、しばしばディープニューラルネットワークのトレーニングを誤解させる。
人間による注釈付きラベルのエラーは、タスクの難易度レベルに依存する可能性が高いことを示しています。
論文 参考訳(メタデータ) (2020-12-22T06:36:58Z) - Exploiting Sample Uncertainty for Domain Adaptive Person
Re-Identification [137.9939571408506]
各サンプルに割り当てられた擬似ラベルの信頼性を推定・活用し,ノイズラベルの影響を緩和する。
不確実性に基づく最適化は大幅な改善をもたらし、ベンチマークデータセットにおける最先端のパフォーマンスを達成します。
論文 参考訳(メタデータ) (2020-12-16T04:09:04Z) - Improving Face Recognition by Clustering Unlabeled Faces in the Wild [77.48677160252198]
極値理論に基づく新しいアイデンティティ分離法を提案する。
重なり合うラベルノイズによる問題を大幅に低減する。
制御された設定と実際の設定の両方の実験は、我々のメソッドの一貫性のある改善を示している。
論文 参考訳(メタデータ) (2020-07-14T12:26:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。