論文の概要: AdaK-NER: An Adaptive Top-K Approach for Named Entity Recognition with
Incomplete Annotations
- arxiv url: http://arxiv.org/abs/2109.05233v1
- Date: Sat, 11 Sep 2021 09:30:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-14 16:10:41.833570
- Title: AdaK-NER: An Adaptive Top-K Approach for Named Entity Recognition with
Incomplete Annotations
- Title(参考訳): AdaK-NER:不完全アノテーションを用いた名前付きエンティティ認識のための適応的トップKアプローチ
- Authors: Hongtao Ruan, Liying Zheng, Peixian Hu, Liang Xu, Jing Xiao
- Abstract要約: 非完全アノテートデータを用いたNERモデリングについて検討する。
そこで本研究では,アダプティブトップカッパハ(Adaptive top-Kapproach)と命名されたAdaK-NERを提案する。
- 参考スコア(独自算出の注目度): 10.623768135602573
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: State-of-the-art Named Entity Recognition(NER) models rely heavily on large
amountsof fully annotated training data. However, ac-cessible data are often
incompletely annotatedsince the annotators usually lack comprehen-sive
knowledge in the target domain. Normallythe unannotated tokens are regarded as
non-entities by default, while we underline thatthese tokens could either be
non-entities orpart of any entity. Here, we study NER mod-eling with incomplete
annotated data whereonly a fraction of the named entities are la-beled, and the
unlabeled tokens are equiva-lently multi-labeled by every possible label.Taking
multi-labeled tokens into account, thenumerous possible paths can distract the
train-ing model from the gold path (ground truthlabel sequence), and thus
hinders the learn-ing ability. In this paper, we propose AdaK-NER, named the
adaptive top-Kapproach, tohelp the model focus on a smaller feasible re-gion
where the gold path is more likely to belocated. We demonstrate the superiority
ofour approach through extensive experimentson both English and Chinese
datasets, aver-agely improving 2% in F-score on the CoNLL-2003 and over 10% on
two Chinese datasetscompared with the prior state-of-the-art works.
- Abstract(参考訳): 最新の名前付きエンティティ認識(ner)モデルは、大量のアノテートされたトレーニングデータに大きく依存しています。
しかし、アノテータは通常、対象領域における理解的な知識を欠いているため、ac-cessibleデータはしばしば不完全にアノテートされる。
通常、アノテーションのないトークンはデフォルトでは非エンティティとみなされるが、私たちはこれらのトークンは任意のエンティティの非エンティティか部分である可能性があることを強調する。
ここでは,名前付きエンティティのごく一部だけがラベリングされ,ラベル付きトークンが任意のラベルで均等にマルチラベル化されている不完全アノテートデータを用いたNERモデレートについて検討し,複数ラベル付きトークンを考慮に入れれば,鉄道模型をゴールドパス(地上の真実ラベルシーケンス)から逸脱させ,学習能力を阻害することができる。
本稿では,適応型トップカプロッハと呼ばれるadak-nerを提案する。
本研究では,CoNLL-2003におけるFスコアの2%を平均的に改善し,従来の最先端技術と比較した2つの中国語データセットに対して10%以上を達成した。
関連論文リスト
- Cross-domain Named Entity Recognition via Graph Matching [25.237288970802425]
クロスドメインのNERは、現実のシナリオにおけるデータの不足から、実用的ながら難しい問題である。
我々は,ラベル関係を確率分布としてモデル化し,ソースとターゲットの両方のラベル空間にラベルグラフを構築する。
ラベル関係をグラフとして表現することにより、グラフマッチング問題としてクロスドメインNERを定式化する。
論文 参考訳(メタデータ) (2024-08-02T02:31:54Z) - A Unified Label-Aware Contrastive Learning Framework for Few-Shot Named Entity Recognition [6.468625143772815]
ラベル認識型トークンレベルのコントラスト学習フレームワークを提案する。
提案手法は,ラベルのセマンティクスを接尾辞のプロンプトとして活用することでコンテキストを豊かにする。
コンテキストネイティブとコンテキストラベルの対比学習目標を同時に最適化する。
論文 参考訳(メタデータ) (2024-04-26T06:19:21Z) - Vision-language Assisted Attribute Learning [53.60196963381315]
大規模な属性ラベリングは通常不完全で部分的である。
既存の属性学習手法は、欠落したラベルを否定的な扱いをすることが多い。
利用可能な視覚言語知識を活用して、モデル学習の強化に欠落しているラベルを明確に明らかにする。
論文 参考訳(メタデータ) (2023-12-12T06:45:19Z) - JointMatch: A Unified Approach for Diverse and Collaborative
Pseudo-Labeling to Semi-Supervised Text Classification [65.268245109828]
半教師付きテキスト分類(SSTC)は、ラベルのないデータを活用する能力によって注目を集めている。
擬似ラベルに基づく既存のアプローチは、擬似ラベルバイアスと誤り蓄積の問題に悩まされる。
我々は、最近の半教師付き学習からアイデアを統一することでこれらの課題に対処する、SSTCの総合的なアプローチであるJointMatchを提案する。
論文 参考訳(メタデータ) (2023-10-23T05:43:35Z) - Exploring Structured Semantic Prior for Multi Label Recognition with
Incomplete Labels [60.675714333081466]
不完全なラベルを持つマルチラベル認識(MLR)は非常に難しい。
最近の研究は、視覚言語モデルであるCLIPにおける画像とラベルの対応を探り、不十分なアノテーションを補うことを目指している。
我々は,MLRにおけるラベル管理の欠如を,構造化されたセマンティクスを導出することにより,不完全なラベルで修復することを提唱する。
論文 参考訳(メタデータ) (2023-03-23T12:39:20Z) - Ground Truth Inference for Weakly Supervised Entity Matching [76.6732856489872]
弱監督タスクのための単純だが強力なラベル付けモデルを提案する。
次に、エンティティマッチングのタスクに特化してラベルモデルを調整します。
その結果,従来の手法よりもF1スコアが9%高い結果が得られた。
論文 参考訳(メタデータ) (2022-11-13T17:57:07Z) - A Unified Positive-Unlabeled Learning Framework for Document-Level
Relation Extraction with Different Levels of Labeling [5.367772036988716]
文書レベルの関係抽出(RE)は、複数の文にわたるエンティティ間の関係を特定することを目的としている。
我々は、シフトと二乗ランキング損失という、肯定的でない統一的な学習フレームワークを提案する。
提案手法は, 既往のベースラインに対して, 不完全ラベル付きで約14F1点の改善を実現する。
論文 参考訳(メタデータ) (2022-10-17T02:54:49Z) - Focusing on Potential Named Entities During Active Label Acquisition [0.0]
名前付きエンティティ認識(NER)は、構造化されていないテキスト中の名前付きエンティティの参照を識別することを目的としている。
多くのドメイン固有のNERアプリケーションは、まだかなりの量のラベル付きデータを要求する。
本稿では,長すぎるか短すぎる文をペナル化するための,データ駆動正規化手法を提案する。
論文 参考訳(メタデータ) (2021-11-06T09:04:16Z) - Learning with Noisy Labels by Targeted Relabeling [52.0329205268734]
クラウドソーシングプラットフォームは、ディープニューラルネットワークをトレーニングするためのデータセット収集によく使用される。
本稿では,少数のアノテーションを予約して,高い確率でラベル付け可能なエラーを明示的に緩和する手法を提案する。
論文 参考訳(メタデータ) (2021-10-15T20:37:29Z) - BOND: BERT-Assisted Open-Domain Named Entity Recognition with Distant
Supervision [49.42215511723874]
我々は,NERモデルの予測性能を改善するための新しい計算フレームワーク,BONDを提案する。
具体的には,2段階の学習アルゴリズムを提案する。第1段階では,遠隔ラベルを用いて,事前学習された言語モデルをNERタスクに適用する。
第2段階では,遠隔ラベルを廃止し,モデル性能をさらに向上するための自己学習手法を提案する。
論文 参考訳(メタデータ) (2020-06-28T04:55:39Z) - Named Entity Recognition without Labelled Data: A Weak Supervision
Approach [23.05371427663683]
本稿では,ラベル付きデータがない場合のNERモデルの学習方法を提案する。
このアプローチは、ターゲットドメインからテキストを自動的にアノテートするために、幅広いラベリング関数に依存している。
シーケンスラベリングモデルは、最終的にこの統一アノテーションに基づいて訓練することができる。
論文 参考訳(メタデータ) (2020-04-30T12:29:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。