論文の概要: SANTA: Separate Strategies for Inaccurate and Incomplete Annotation
Noise in Distantly-Supervised Named Entity Recognition
- arxiv url: http://arxiv.org/abs/2305.04076v1
- Date: Sat, 6 May 2023 15:48:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-09 17:48:17.594179
- Title: SANTA: Separate Strategies for Inaccurate and Incomplete Annotation
Noise in Distantly-Supervised Named Entity Recognition
- Title(参考訳): SANTA:遠隔教師付きエンティティ認識における不正確・不完全アノテーションノイズの分離戦略
- Authors: Shuzheng Si, Zefan Cai, Shuang Zeng, Guoqiang Feng, Jiaxing Lin,
Baobao Chang
- Abstract要約: 本稿では,2種類のノイズの異なる原因が,モデルアーキテクチャにおける異なる戦略の要求を引き起こすことを論じる。
メモリスムースなFocal Loss と Entity-aware KNN を用いて,これら2種類のノイズを別々に処理するためのSANTAを提案する。
- 参考スコア(独自算出の注目度): 14.89091544886064
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Distantly-Supervised Named Entity Recognition effectively alleviates the
burden of time-consuming and expensive annotation in the supervised setting.
But the context-free matching process and the limited coverage of knowledge
bases introduce inaccurate and incomplete annotation noise respectively.
Previous studies either considered only incomplete annotation noise or
indiscriminately handle two types of noise with the same strategy. In this
paper, we argue that the different causes of two types of noise bring up the
requirement of different strategies in model architecture. Therefore, we
propose the SANTA to handle these two types of noise separately with (1)
Memory-smoothed Focal Loss and Entity-aware KNN to relieve the entity ambiguity
problem caused by inaccurate annotation, and (2) Boundary Mixup to alleviate
decision boundary shifting problem caused by incomplete annotation and a
noise-tolerant loss to improve the robustness. Benefiting from our separate
tailored strategies, we confirm in the experiment that the two types of noise
are well mitigated. SANTA also achieves a new state-of-the-art on five public
datasets.
- Abstract(参考訳): Distantly-Supervised Named Entity Recognitionは、教師付き設定における時間と高価なアノテーションの負担を効果的に軽減します。
しかし、文脈自由マッチングプロセスと知識ベースの範囲の限定は、それぞれ不正確なアノテーションノイズと不完全なアノテーションノイズをもたらす。
従来の研究では、不完全なアノテーションノイズのみを考慮するか、同じ戦略で2種類のノイズを区別しない。
本稿では,2種類のノイズの異なる原因が,モデルアーキテクチャにおける異なる戦略の要件を生じさせると主張する。
そこで,この2つのノイズを,(1)不正確なアノテーションによるエンティティ曖昧性問題を軽減するために,(1)メモリスムースな焦点損失とエンティティアウェアknと,(2)不完全アノテーションと雑音耐性損失による決定境界シフト問題を軽減するための境界ミックスアップによって対処し,ロバスト性を向上させることを提案する。
個別に調整した戦略の恩恵を受け、この2つのタイプのノイズが十分に緩和されていることを実験で確認した。
また、santaは5つのパブリックデータセットで最新技術を実現している。
関連論文リスト
- Efficient PAC Learning of Halfspaces with Constant Malicious Noise Rate [14.461730902968862]
本研究では,悪質な雑音の存在下でのハーフスペースの計算効率の高いPAC学習の問題について検討する。
再重み付きヒンジ損失を最小化することにより、一定の耐雑音性が得られることを示す。
論文 参考訳(メタデータ) (2024-10-02T02:38:33Z) - Noise-BERT: A Unified Perturbation-Robust Framework with Noise Alignment
Pre-training for Noisy Slot Filling Task [14.707646721729228]
現実的な対話システムでは、ユーザからの入力情報は様々な種類の入力摂動の対象となることが多い。
本研究では,ノイズアライメント事前学習による摂動ロバスト統合フレームワークであるNoss-BERTを提案する。
本フレームワークは,2つのノイズアライメント事前学習タスクを組み込んでいる。
論文 参考訳(メタデータ) (2024-02-22T12:39:50Z) - Learning to Correct Noisy Labels for Fine-Grained Entity Typing via
Co-Prediction Prompt Tuning [9.885278527023532]
FETにおける雑音補正のためのコプレディション・プロンプト・チューニングを提案する。
ラベル付きラベルをリコールするために予測結果を統合し、区別されたマージンを用いて不正確なラベルを識別する。
広範に使われている3つのFETデータセットの実験結果から,我々のノイズ補正アプローチはトレーニングサンプルの品質を著しく向上させることが示された。
論文 参考訳(メタデータ) (2023-10-23T06:04:07Z) - ReSup: Reliable Label Noise Suppression for Facial Expression
Recognition [20.74719263734951]
本稿では、ReSupと呼ばれるより信頼性の高いノイズラベル抑圧手法を提案する。
最適な分布モデリングを実現するために、ReSupは全てのサンプルの類似度分布をモデル化する。
ノイズ決定結果の信頼性をさらに高めるため、ReSupは2つのネットワークを使ってノイズ抑制を共同で実現している。
論文 参考訳(メタデータ) (2023-05-29T06:02:06Z) - Combating Noise: Semi-supervised Learning by Region Uncertainty
Quantification [55.23467274564417]
現在の手法は、擬似ラベルによって生成されるノイズの多い領域によって容易に妨げられる。
領域の不確実性を定量化して雑音耐性半教師付き学習を提案する。
PASCAL VOCとMS COCOの併用実験により,本手法の異常な性能を実証した。
論文 参考訳(メタデータ) (2021-11-01T13:23:42Z) - Analyzing and Improving the Optimization Landscape of Noise-Contrastive
Estimation [50.85788484752612]
ノイズコントラスト推定(NCE)は、非正規化確率モデルを学習するための統計的に一貫した手法である。
ノイズ分布の選択がNCEの性能に不可欠であることが実験的に観察されている。
本研究では,不適切な雑音分布を用いた場合,NCEの性能低下の原因を正式に指摘する。
論文 参考訳(メタデータ) (2021-10-21T16:57:45Z) - Dive into Ambiguity: Latent Distribution Mining and Pairwise Uncertainty
Estimation for Facial Expression Recognition [59.52434325897716]
DMUE(DMUE)という,アノテーションのあいまいさを2つの視点から解決するソリューションを提案する。
前者に対しては,ラベル空間における潜伏分布をよりよく記述するために,補助的マルチブランチ学習フレームワークを導入する。
後者の場合、インスタンス間の意味的特徴のペアワイズ関係を完全に活用して、インスタンス空間のあいまいさの程度を推定する。
論文 参考訳(メタデータ) (2021-04-01T03:21:57Z) - Learning from Crowds by Modeling Common Confusions [33.92690297826468]
クラウドソーシングは、大量のラベル付きデータを低コストで取得する実用的な方法を提供する。
しかしアノテータのアノテーションの品質は様々である。
アノテーションノイズを共通のノイズと個々のノイズに分解する新しい視点を提供する。
論文 参考訳(メタデータ) (2020-12-24T01:13:23Z) - A Second-Order Approach to Learning with Instance-Dependent Label Noise [58.555527517928596]
ラベルノイズの存在は、しばしばディープニューラルネットワークのトレーニングを誤解させる。
人間による注釈付きラベルのエラーは、タスクの難易度レベルに依存する可能性が高いことを示しています。
論文 参考訳(メタデータ) (2020-12-22T06:36:58Z) - Non-Local Part-Aware Point Cloud Denoising [55.50360085086123]
本稿では,点群を識別する非局所部分認識ディープニューラルネットワークを提案する。
グラフアテンションモジュールでカスタマイズした非局所学習ユニット(NLU)を設計し、非局所意味論的特徴を適応的にキャプチャする。
雑音発生性能を向上させるため,ノイズ特性をノイズ入力から段階的に抽出するために,一連のNLUをカスケードする。
論文 参考訳(メタデータ) (2020-03-14T13:51:50Z) - Towards Noise-resistant Object Detection with Noisy Annotations [119.63458519946691]
ディープオブジェクト検出器の訓練には、正確なオブジェクトラベルとバウンディングボックス座標を持つ、相当量の人間の注釈画像が必要である。
ノイズの多いアノテーションはずっと簡単にアクセスできますが、学習には有害かもしれません。
ノイズにはラベルノイズとバウンディングボックスノイズが混在している。
論文 参考訳(メタデータ) (2020-03-03T01:32:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。