論文の概要: None Class Ranking Loss for Document-Level Relation Extraction
- arxiv url: http://arxiv.org/abs/2205.00476v1
- Date: Sun, 1 May 2022 14:24:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-03 13:20:54.526786
- Title: None Class Ranking Loss for Document-Level Relation Extraction
- Title(参考訳): 文書レベル関係抽出のためのクラスランキングロス
- Authors: Yang Zhou and Wee Sun Lee
- Abstract要約: 文書レベルの関係抽出(RE)は、複数の文にまたがって表現されるエンティティ間の関係を抽出することを目的としている。
典型的な文書では、ほとんどのエンティティペアは事前定義された関係を表現せず、"noone"あるいは"no relation"とラベル付けされている。
- 参考スコア(独自算出の注目度): 22.173080823450498
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Document-level relation extraction (RE) aims at extracting relations among
entities expressed across multiple sentences, which can be viewed as a
multi-label classification problem. In a typical document, most entity pairs do
not express any pre-defined relation and are labeled as "none" or "no
relation". For good document-level RE performance, it is crucial to distinguish
such \textit{none} class instances (entity pairs) from those of pre-defined
classes (relations). However, most existing methods only estimate the
probability of pre-defined relations independently without considering the
probability of "no relation". This ignores the context of entity pairs and the
label correlations between the none class and pre-defined classes, leading to
sub-optimal predictions. To address this problem, we propose a new multi-label
loss that encourages large \textit{margins} of label confidence scores between
each pre-defined class and the none class, which enables captured label
correlations and context-dependent thresholding for label prediction. To gain
further robustness against positive-negative imbalance and mislabeled data that
could appear in real-world RE datasets, we propose a margin regularization and
a margin shifting technique. Experimental results demonstrate that our method
significantly outperforms existing multi-label losses for document-level RE and
works well in other multi-label tasks such as emotion classification when none
class instances are available for training.
- Abstract(参考訳): 文書レベルの関係抽出(RE)は,複数の文にまたがって表現されるエンティティ間の関係を抽出することを目的とする。
典型的な文書では、ほとんどの実体対は事前定義された関係を表現せず、"none" や "no relation" とラベル付けされる。
ドキュメントレベルの優れたリパフォーマンスには、そのような \textit{none} クラスインスタンス(エンティティペア)と事前定義されたクラス(リレーション)のインスタンスを区別することが不可欠である。
しかし、既存のほとんどの手法は「非関係」の確率を考慮せずに、事前定義された関係の確率を独立に見積もるだけである。
これはエンティティペアのコンテキストを無視し、非クラスと事前定義されたクラス間のラベル相関を無視し、サブ最適化予測につながる。
この問題に対処するために,ラベルの信頼度スコアを事前に定義した各クラスとノークラスの間で大きめの‘textit{margins}’を奨励する新たなマルチラベル損失を提案する。
実世界の再データセットに現れる正負の不均衡や誤ラベルデータに対するさらなる堅牢性を得るために,マージン正規化とマージンシフト手法を提案する。
実験結果から,本手法は文書レベルREにおける既存のマルチラベル損失を著しく上回り,クラスインスタンスをトレーニングできない場合の感情分類など,他のマルチラベルタスクでも有効であることが示された。
関連論文リスト
- Multi-Label Classification for Implicit Discourse Relation Recognition [10.280148603465697]
暗黙的な談話関係認識のための多言語分類フレームワークについて検討する。
本研究では,複数ラベルの分類手法が単一ラベルの予測性能を低下させないことを示す。
論文 参考訳(メタデータ) (2024-06-06T19:37:25Z) - Generating Unbiased Pseudo-labels via a Theoretically Guaranteed
Chebyshev Constraint to Unify Semi-supervised Classification and Regression [57.17120203327993]
分類におけるしきい値と擬似ラベルプロセス(T2L)は、ラベルの品質を決定するために信頼性を使用する。
本質的には、レグレッションは高品質なラベルを生成するためにバイアスのない方法も必要である。
チェビシェフの不等式に基づく不偏ラベルを生成するための理論的に保証された制約を提案する。
論文 参考訳(メタデータ) (2023-11-03T08:39:35Z) - JointMatch: A Unified Approach for Diverse and Collaborative
Pseudo-Labeling to Semi-Supervised Text Classification [65.268245109828]
半教師付きテキスト分類(SSTC)は、ラベルのないデータを活用する能力によって注目を集めている。
擬似ラベルに基づく既存のアプローチは、擬似ラベルバイアスと誤り蓄積の問題に悩まされる。
我々は、最近の半教師付き学習からアイデアを統一することでこれらの課題に対処する、SSTCの総合的なアプローチであるJointMatchを提案する。
論文 参考訳(メタデータ) (2023-10-23T05:43:35Z) - Dist-PU: Positive-Unlabeled Learning from a Label Distribution
Perspective [89.5370481649529]
本稿では,PU学習のためのラベル分布視点を提案する。
そこで本研究では,予測型と基底型のラベル分布間のラベル分布の整合性を追求する。
提案手法の有効性を3つのベンチマークデータセットで検証した。
論文 参考訳(メタデータ) (2022-12-06T07:38:29Z) - An Effective Approach for Multi-label Classification with Missing Labels [8.470008570115146]
分類ネットワークにさらなる複雑さをもたらすことなく、アノテーションのコストを削減するための擬似ラベルベースのアプローチを提案する。
新たな損失関数を設計することにより、各インスタンスが少なくとも1つの正のラベルを含む必要があるという要求を緩和することができる。
提案手法は,正のラベルと負のラベルの不均衡を扱える一方で,既存の欠落ラベル学習手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-10-24T23:13:57Z) - A Unified Positive-Unlabeled Learning Framework for Document-Level
Relation Extraction with Different Levels of Labeling [5.367772036988716]
文書レベルの関係抽出(RE)は、複数の文にわたるエンティティ間の関係を特定することを目的としている。
我々は、シフトと二乗ランキング損失という、肯定的でない統一的な学習フレームワークを提案する。
提案手法は, 既往のベースラインに対して, 不完全ラベル付きで約14F1点の改善を実現する。
論文 参考訳(メタデータ) (2022-10-17T02:54:49Z) - Learning with Proper Partial Labels [87.65718705642819]
部分ラベル学習は、不正確なラベルを持つ弱い教師付き学習の一種である。
この適切な部分ラベル学習フレームワークには,従来の部分ラベル学習設定が数多く含まれていることを示す。
次に、分類リスクの統一的非バイアス推定器を導出する。
論文 参考訳(メタデータ) (2021-12-23T01:37:03Z) - A Theory-Driven Self-Labeling Refinement Method for Contrastive
Representation Learning [111.05365744744437]
教師なしのコントラスト学習は、正のイメージの作物と、負のイメージの作物とをラベル付けする。
本研究は, コントラスト学習において, 不正確なラベル割り当てがセマンティック・インスタンス識別の一般化を著しく損なうことを最初に証明する。
この理論に触発されて、コントラスト学習のための新しい自己ラベル改善手法を提案する。
論文 参考訳(メタデータ) (2021-06-28T14:24:52Z) - A Flexible Class of Dependence-aware Multi-Label Loss Functions [4.265467042008983]
本稿では,多ラベル分類のための新しいクラス損失関数を提案する。
これは、ハミングやサブセット0/1のような一般的に使用される損失のデメリットを克服する。
これらの損失の観点からのマルチラベルの評価は、実証的研究で示される。
論文 参考訳(メタデータ) (2020-11-02T07:42:15Z) - Pointwise Binary Classification with Pairwise Confidence Comparisons [97.79518780631457]
ペアワイズ比較(Pcomp)分類を提案し、ラベルのないデータのペアしか持たない。
我々はPcomp分類をノイズラベル学習に結びつけて、進歩的UREを開発し、一貫性の正則化を課すことにより改善する。
論文 参考訳(メタデータ) (2020-10-05T09:23:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。