論文の概要: Partially Supervised Named Entity Recognition via the Expected Entity
Ratio Loss
- arxiv url: http://arxiv.org/abs/2108.07216v1
- Date: Mon, 16 Aug 2021 16:53:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-17 15:17:58.473234
- Title: Partially Supervised Named Entity Recognition via the Expected Entity
Ratio Loss
- Title(参考訳): 期待されるエンティティ比損失による名前付きエンティティ認識
- Authors: Thomas Effland and Michael Collins
- Abstract要約: 我々は,エンティティアノテーションが欠落している状況下で,エンティティ認識者という名前の学習を研究する。
我々は、体系的に欠落したタグの存在下でモデルを学ぶために、新しい損失である期待されたエンティティ比を提案する。
提案手法は理論的に健全であり,実証的に有用であることを示す。
- 参考スコア(独自算出の注目度): 2.9176780332337486
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We study learning named entity recognizers in the presence of missing entity
annotations. We approach this setting as tagging with latent variables and
propose a novel loss, the Expected Entity Ratio, to learn models in the
presence of systematically missing tags. We show that our approach is both
theoretically sound and empirically useful. Experimentally, we find that it
meets or exceeds performance of strong and state-of-the-art baselines across a
variety of languages, annotation scenarios, and amounts of labeled data. In
particular, we find that it significantly outperforms the previous
state-of-the-art methods from Mayhew et al. (2019) and Li et al. (2021) by
+12.7 and +2.3 F1 score in a challenging setting with only 1,000 biased
annotations, averaged across 7 datasets. We also show that, when combined with
our approach, a novel sparse annotation scheme outperforms exhaustive
annotation for modest annotation budgets.
- Abstract(参考訳): エンティティアノテーションが欠落している場合、名前付きエンティティ認識器を学習する。
我々は、この設定を潜在変数のタグ付けとしてアプローチし、新しい損失である期待されたエンティティ比を提案し、体系的に欠落したタグの存在下でモデルを学ぶ。
我々のアプローチは理論的に健全かつ実証的に有用であることを示します。
実験的には、さまざまな言語、アノテーションシナリオ、ラベル付きデータの量にわたって、強力で最先端のベースラインのパフォーマンスを満たしているか、あるいは上回っていることが分かりました。
特に,Mayhewらによる従来の最先端手法を著しく上回っていることが判明した。
(2019年)、Li et al。
(2021) by +12.7 and +2.3 F1 score in a challenge set with only 1,000 biased annotations, averageed across 7 datasets。
また,我々のアプローチと組み合わせると,新しいスパースアノテーションスキームが,控えめなアノテーション予算に対して徹底的なアノテーションよりも優れていることを示す。
関連論文リスト
- Capturing Perspectives of Crowdsourced Annotators in Subjective Learning Tasks [9.110872603799839]
監督された分類は、人間によって注釈付けされたデータセットに大きく依存する。
毒性分類などの主観的なタスクでは、これらのアノテーションはラッカー間での合意が低くなることが多い。
本研究では、主観的分類タスクのためのtextbfAnnotator Awares for Texts (AART) を提案する。
論文 参考訳(メタデータ) (2023-11-16T10:18:32Z) - ACTOR: Active Learning with Annotator-specific Classification Heads to
Embrace Human Label Variation [35.10805667891489]
積極的学習は、アノテーションのコスト削減戦略として、不一致から学ぶという文脈で完全には研究されていない。
アクティブな学習環境では、不確実性推定の観点から、マルチヘッドモデルの方がシングルヘッドモデルよりもはるかに優れていることを示す。
論文 参考訳(メタデータ) (2023-10-23T14:26:43Z) - PromptCAL: Contrastive Affinity Learning via Auxiliary Prompts for
Generalized Novel Category Discovery [39.03732147384566]
Generalized Novel Category Discovery (GNCD) 設定は、既知のクラスや新しいクラスから来るラベルなしのトレーニングデータを分類することを目的としている。
本稿では,この課題に対処するために,PromptCALと呼ばれる補助視覚プロンプトを用いたコントラスト親和性学習法を提案する。
提案手法は,クラストークンと視覚的プロンプトのための既知のクラスと新しいクラスのセマンティッククラスタリングを改善するために,信頼性の高いペアワイズサンプル親和性を発見する。
論文 参考訳(メタデータ) (2022-12-11T20:06:14Z) - Entity Disambiguation with Entity Definitions [50.01142092276296]
ローカルモデルはEntity Disambiguation (ED)で最近驚くべきパフォーマンスを達成した
それまでの研究は、各候補者のテキスト表現として、ウィキペディアのタイトルのみを使うことに限られていた。
本稿では、この制限に対処し、より表現力のあるテキスト表現がそれを緩和できる範囲について検討する。
提案する6つのベンチマークのうち2つに新たな技術の現状を報告し,未知のパターンに対する一般化能力を強く改善する。
論文 参考訳(メタデータ) (2022-10-11T17:46:28Z) - Novel Class Discovery without Forgetting [72.52222295216062]
我々は NCDwF: Novel Class Discovery without Forgetting の新たな実用的問題設定を特定し,定式化する。
ラベルのないデータから新しいカテゴリのインスタンスを段階的に発見する機械学習モデルを提案する。
CIFAR-10, CIFAR-100, ImageNet-1000に基づく実験プロトコルを導入し, 知識保持と新しいクラス発見のトレードオフを測定する。
論文 参考訳(メタデータ) (2022-07-21T17:54:36Z) - Annotation Error Detection: Analyzing the Past and Present for a More
Coherent Future [63.99570204416711]
我々は、潜在的なアノテーションの誤りを検知するための18の手法を再実装し、9つの英語データセット上で評価する。
アノテーションエラー検出タスクの新しい形式化を含む一様評価設定を定義する。
私たちはデータセットと実装を,使いやすく,オープンソースのソフトウェアパッケージとしてリリースしています。
論文 参考訳(メタデータ) (2022-06-05T22:31:45Z) - Neighborhood Contrastive Learning for Novel Class Discovery [79.14767688903028]
我々は,クラスタリング性能に重要な識別表現を学習するために,Neighborhood Contrastive Learningという新しいフレームワークを構築した。
これらの2つの成分がクラスタリング性能に大きく寄与し、我々のモデルが最先端の手法よりも大きなマージンで優れていることを実験的に実証した。
論文 参考訳(メタデータ) (2021-06-20T17:34:55Z) - Annotation Curricula to Implicitly Train Non-Expert Annotators [56.67768938052715]
自発的な研究は、しばしば、アノテータがタスク、そのアノテーションスキーム、およびデータドメインに精通することを要求する。
これは最初は圧倒的であり、精神的に課税され、結果として生じるアノテーションにエラーを誘導する。
暗黙的にアノテータを訓練する新しい手法であるアノテーションキュリキュラを提案する。
論文 参考訳(メタデータ) (2021-06-04T09:48:28Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。