論文の概要: A Unified Positive-Unlabeled Learning Framework for Document-Level
Relation Extraction with Different Levels of Labeling
- arxiv url: http://arxiv.org/abs/2210.08709v1
- Date: Mon, 17 Oct 2022 02:54:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2022-10-18 16:10:33.706253
- Title: A Unified Positive-Unlabeled Learning Framework for Document-Level
Relation Extraction with Different Levels of Labeling
- Title(参考訳): 異なるラベリングレベルを持つ文書レベル関係抽出のための統一正無ラベル学習フレームワーク
- Authors: Ye Wang, Xinxin Liu, Wenxin Hu, Tao Zhang
- Abstract要約: 文書レベルの関係抽出(RE)は、複数の文にわたるエンティティ間の関係を特定することを目的としている。
我々は、シフトと二乗ランキング損失という、肯定的でない統一的な学習フレームワークを提案する。
提案手法は, 既往のベースラインに対して, 不完全ラベル付きで約14F1点の改善を実現する。
- 参考スコア(独自算出の注目度): 5.367772036988716
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Document-level relation extraction (RE) aims to identify relations between
entities across multiple sentences. Most previous methods focused on
document-level RE under full supervision. However, in real-world scenario, it
is expensive and difficult to completely label all relations in a document
because the number of entity pairs in document-level RE grows quadratically
with the number of entities. To solve the common incomplete labeling problem,
we propose a unified positive-unlabeled learning framework - shift and squared
ranking loss positive-unlabeled (SSR-PU) learning. We use positive-unlabeled
(PU) learning on document-level RE for the first time. Considering that labeled
data of a dataset may lead to prior shift of unlabeled data, we introduce a PU
learning under prior shift of training data. Also, using none-class score as an
adaptive threshold, we propose squared ranking loss and prove its Bayesian
consistency with multi-label ranking metrics. Extensive experiments demonstrate
that our method achieves an improvement of about 14 F1 points relative to the
previous baseline with incomplete labeling. In addition, it outperforms
previous state-of-the-art results under both fully supervised and extremely
unlabeled settings as well.
- Abstract(参考訳): 文書レベルの関係抽出(re)は、複数の文間のエンティティ間の関係を識別することを目的としている。
従来は文書レベルのREに重点を置いていた。
しかし、現実のシナリオでは、ドキュメントレベルのREにおけるエンティティペアの数は、エンティティの数と2次的に増加するため、ドキュメント内のすべての関係を完全にラベル付けるのは高価で難しい。
共通不完全ラベリング問題を解くため,我々は統一正のラベル付き学習フレームワーク,shift and squared ranking loss positive-unlabeled (ssr-pu) 学習を提案する。
文書レベルのREで初めて、肯定的未ラベル(PU)学習を使用します。
データセットのラベル付きデータがラベルなしデータの事前シフトにつながる可能性があることを考慮し、トレーニングデータの事前シフトの下でPU学習を導入する。
また,none-classスコアを適応しきい値として使用し,二乗ランキング損失を提案し,マルチラベルランキング指標とのベイズ的一貫性を証明した。
実験の結果,提案手法は,不完全ラベリングにより,前のベースラインに対して約14F1点の改善を達成できた。
さらに、従来の最先端の成果を、完全に監督された設定と極めてラベルのない設定の両方で上回っている。
関連論文リスト
- Generating Unbiased Pseudo-labels via a Theoretically Guaranteed
Chebyshev Constraint to Unify Semi-supervised Classification and Regression [57.17120203327993]
分類におけるしきい値と擬似ラベルプロセス(T2L)は、ラベルの品質を決定するために信頼性を使用する。
本質的には、レグレッションは高品質なラベルを生成するためにバイアスのない方法も必要である。
チェビシェフの不等式に基づく不偏ラベルを生成するための理論的に保証された制約を提案する。
論文 参考訳(メタデータ) (2023-11-03T08:39:35Z) - JointMatch: A Unified Approach for Diverse and Collaborative
Pseudo-Labeling to Semi-Supervised Text Classification [65.268245109828]
半教師付きテキスト分類(SSTC)は、ラベルのないデータを活用する能力によって注目を集めている。
擬似ラベルに基づく既存のアプローチは、擬似ラベルバイアスと誤り蓄積の問題に悩まされる。
我々は、最近の半教師付き学習からアイデアを統一することでこれらの課題に対処する、SSTCの総合的なアプローチであるJointMatchを提案する。
論文 参考訳(メタデータ) (2023-10-23T05:43:35Z) - Drawing the Same Bounding Box Twice? Coping Noisy Annotations in Object
Detection with Repeated Labels [6.872072177648135]
そこで本研究では,基礎的真理推定手法に適合する新しい局所化アルゴリズムを提案する。
また,本アルゴリズムは,TexBiGデータセット上でのトレーニングにおいて,優れた性能を示す。
論文 参考訳(メタデータ) (2023-09-18T13:08:44Z) - A Positive-Unlabeled Metric Learning Framework for Document-Level
Relation Extraction with Incomplete Labeling [6.545730317972688]
文書レベルの関係抽出(RE)の目的は、複数の文にまたがるエンティティ間の関係を特定することである。
正の増進と正の混合による正の未ラベルメトリック学習フレームワーク(P3M)を提案する。
P3Mは文書レベルREのF1スコアを、不完全ラベル付きで約4-10ポイント改善する。
論文 参考訳(メタデータ) (2023-06-26T16:05:59Z) - Exploring Structured Semantic Prior for Multi Label Recognition with
Incomplete Labels [60.675714333081466]
不完全なラベルを持つマルチラベル認識(MLR)は非常に難しい。
最近の研究は、視覚言語モデルであるCLIPにおける画像とラベルの対応を探り、不十分なアノテーションを補うことを目指している。
我々は,MLRにおけるラベル管理の欠如を,構造化されたセマンティクスを導出することにより,不完全なラベルで修復することを提唱する。
論文 参考訳(メタデータ) (2023-03-23T12:39:20Z) - GaussianMLR: Learning Implicit Class Significance via Calibrated
Multi-Label Ranking [0.0]
本稿では,ガウスMLRという新しい多ラベルランキング手法を提案する。
これは、正のラベルのランクを決定する暗黙のクラス重要性の値を学ぶことを目的としている。
提案手法は, 組み込まれた正のランク順の表現を正確に学習できることを示す。
論文 参考訳(メタデータ) (2023-03-07T14:09:08Z) - None Class Ranking Loss for Document-Level Relation Extraction [22.173080823450498]
文書レベルの関係抽出(RE)は、複数の文にまたがって表現されるエンティティ間の関係を抽出することを目的としている。
典型的な文書では、ほとんどのエンティティペアは事前定義された関係を表現せず、"noone"あるいは"no relation"とラベル付けされている。
論文 参考訳(メタデータ) (2022-05-01T14:24:37Z) - Disentangling Sampling and Labeling Bias for Learning in Large-Output
Spaces [64.23172847182109]
異なる負のサンプリングスキームが支配的ラベルと稀なラベルで暗黙的にトレードオフパフォーマンスを示す。
すべてのラベルのサブセットで作業することで生じるサンプリングバイアスと、ラベルの不均衡に起因するデータ固有のラベルバイアスの両方に明示的に対処する統一された手段を提供する。
論文 参考訳(メタデータ) (2021-05-12T15:40:13Z) - Pointwise Binary Classification with Pairwise Confidence Comparisons [97.79518780631457]
ペアワイズ比較(Pcomp)分類を提案し、ラベルのないデータのペアしか持たない。
我々はPcomp分類をノイズラベル学習に結びつけて、進歩的UREを開発し、一貫性の正則化を課すことにより改善する。
論文 参考訳(メタデータ) (2020-10-05T09:23:58Z) - Structured Prediction with Partial Labelling through the Infimum Loss [85.4940853372503]
弱い監督の目標は、収集コストの安いラベル付け形式のみを使用してモデルを学習できるようにすることである。
これは、各データポイントに対して、実際のものを含むラベルのセットとして、監督がキャストされる不完全なアノテーションの一種です。
本稿では、構造化された予測と、部分的なラベリングを扱うための無限損失の概念に基づく統一的なフレームワークを提供する。
論文 参考訳(メタデータ) (2020-03-02T13:59:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。