論文の概要: Named Entity Recognition without Labelled Data: A Weak Supervision
Approach
- arxiv url: http://arxiv.org/abs/2004.14723v1
- Date: Thu, 30 Apr 2020 12:29:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-08 02:44:35.655658
- Title: Named Entity Recognition without Labelled Data: A Weak Supervision
Approach
- Title(参考訳): ラベル付きデータのない名前付きエンティティ認識:弱い監督アプローチ
- Authors: Pierre Lison, Aliaksandr Hubin, Jeremy Barnes, and Samia Touileb
- Abstract要約: 本稿では,ラベル付きデータがない場合のNERモデルの学習方法を提案する。
このアプローチは、ターゲットドメインからテキストを自動的にアノテートするために、幅広いラベリング関数に依存している。
シーケンスラベリングモデルは、最終的にこの統一アノテーションに基づいて訓練することができる。
- 参考スコア(独自算出の注目度): 23.05371427663683
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Named Entity Recognition (NER) performance often degrades rapidly when
applied to target domains that differ from the texts observed during training.
When in-domain labelled data is available, transfer learning techniques can be
used to adapt existing NER models to the target domain. But what should one do
when there is no hand-labelled data for the target domain? This paper presents
a simple but powerful approach to learn NER models in the absence of labelled
data through weak supervision. The approach relies on a broad spectrum of
labelling functions to automatically annotate texts from the target domain.
These annotations are then merged together using a hidden Markov model which
captures the varying accuracies and confusions of the labelling functions. A
sequence labelling model can finally be trained on the basis of this unified
annotation. We evaluate the approach on two English datasets (CoNLL 2003 and
news articles from Reuters and Bloomberg) and demonstrate an improvement of
about 7 percentage points in entity-level $F_1$ scores compared to an
out-of-domain neural NER model.
- Abstract(参考訳): 名前付きエンティティ認識(ner)のパフォーマンスは、トレーニング中に観察されたテキストとは異なるターゲットドメインに適用されると急速に低下する。
ドメイン内のラベル付きデータがある場合、既存のnerモデルをターゲットドメインに適応させるために、転送学習技術が使用できる。
しかし、ターゲットドメインのハンドラベルデータがない場合、何をするべきか?
本稿では,弱い監督によってラベル付きデータがない場合,nerモデルを学ぶための単純かつ強力な手法を提案する。
このアプローチは、ターゲットドメインからテキストを自動的にアノテートするために、幅広いラベリング関数に依存する。
これらのアノテーションは、ラベル付け関数の様々な精度と混乱をキャプチャする隠れマルコフモデルを使って統合される。
シーケンスラベリングモデルは最終的にこの統一アノテーションに基づいてトレーニングすることができる。
我々は,2つの英語データセット(CoNLL 2003とReutersとBloombergのニュース記事)に対するアプローチを評価し,ドメイン外ニューラルネットワークNERモデルと比較して,エンティティレベル$F_1$スコアの約7ポイントの改善を実証した。
関連論文リスト
- Cross-domain Named Entity Recognition via Graph Matching [25.237288970802425]
クロスドメインのNERは、現実のシナリオにおけるデータの不足から、実用的ながら難しい問題である。
我々は,ラベル関係を確率分布としてモデル化し,ソースとターゲットの両方のラベル空間にラベルグラフを構築する。
ラベル関係をグラフとして表現することにより、グラフマッチング問題としてクロスドメインNERを定式化する。
論文 参考訳(メタデータ) (2024-08-02T02:31:54Z) - SpanProto: A Two-stage Span-based Prototypical Network for Few-shot
Named Entity Recognition [45.012327072558975]
名前付きエンティティ認識(NER)は、アノテーション付きデータが少ない名前付きエンティティを識別することを目的としている。
そこで本研究では,2段階のアプローチを用いて,数発のNERに対処するセミナルスパンベースプロトタイプネットワーク(SpanProto)を提案する。
スパン抽出の段階では、逐次タグを大域境界行列に変換し、モデルが明示的な境界情報に集中できるようにする。
分類に言及するために、原型学習を活用してラベル付きスパンのセマンティック表現をキャプチャし、新しいクラスエンティティへの適応性を向上する。
論文 参考訳(メタデータ) (2022-10-17T12:59:33Z) - Robust Target Training for Multi-Source Domain Adaptation [110.77704026569499]
両レベル最適化に基づく新しいMSDAのためのロバスト目標訓練法(BORT$2$)を提案する。
提案手法は,大規模なDomainNetデータセットを含む3つのMSDAベンチマークにおいて,アートパフォーマンスの状態を達成している。
論文 参考訳(メタデータ) (2022-10-04T15:20:01Z) - Attentive Prototypes for Source-free Unsupervised Domain Adaptive 3D
Object Detection [85.11649974840758]
3Dオブジェクト検出ネットワークは、トレーニングされたデータに対してバイアスを受ける傾向がある。
そこで本研究では,ライダーを用いた3次元物体検出器のソースレス・教師なし領域適応のための単一フレーム手法を提案する。
論文 参考訳(メタデータ) (2021-11-30T18:42:42Z) - Cross-Domain Adaptive Clustering for Semi-Supervised Domain Adaptation [85.6961770631173]
半監視されたドメイン適応では、残りのターゲットサンプルのターゲットドメインガイド機能内のクラスごとのいくつかのラベル付きサンプルが、その周辺に集約される。
この問題に対処するために,クロスドメイン適応クラスタリングという新しいアプローチを提案する。
論文 参考訳(メタデータ) (2021-04-19T16:07:32Z) - Inferring Latent Domains for Unsupervised Deep Domain Adaptation [54.963823285456925]
Unsupervised Domain Adaptation (UDA)は、ラベル付きデータが利用できないターゲットドメインでモデルを学習する問題を指す。
本稿では,視覚データセット中の潜在ドメインを自動的に発見することにより,udaの問題に対処する新しい深層アーキテクチャを提案する。
提案手法を公開ベンチマークで評価し,最先端のドメイン適応手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-03-25T14:33:33Z) - Unsupervised Domain Adaptation for Person Re-Identification through
Source-Guided Pseudo-Labeling [2.449909275410288]
人物再識別(re-ID)は、異なるカメラで撮影された同一人物の画像を取得することを目的としている。
Unsupervised Domain Adaptation (UDA)は、ターゲットデータの高価なアノテーションを避けるため、この課題に対する興味深い研究方向である。
ソースドメインとターゲットドメインにおける分類と三重項損失に基づく計量学習を最適化する2分岐アーキテクチャを利用するフレームワークを提案する。
論文 参考訳(メタデータ) (2020-09-20T14:54:42Z) - Joint Visual and Temporal Consistency for Unsupervised Domain Adaptive
Person Re-Identification [64.37745443119942]
本稿では,局所的なワンホット分類とグローバルなマルチクラス分類を組み合わせることで,視覚的・時間的整合性を両立させる。
3つの大規模ReIDデータセットの実験結果は、教師なしと教師なしの両方のドメイン適応型ReIDタスクにおいて提案手法の優位性を示す。
論文 参考訳(メタデータ) (2020-07-21T14:31:27Z) - Zero-Resource Cross-Domain Named Entity Recognition [68.83177074227598]
既存のドメイン名付きエンティティ認識モデルは、多くのラベルなしコーパスや、ターゲットドメイン内のラベル付きNERトレーニングデータに依存している。
外部リソースを一切使用しないドメイン間NERモデルを提案する。
論文 参考訳(メタデータ) (2020-02-14T09:04:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。