論文の概要: ANEA: Distant Supervision for Low-Resource Named Entity Recognition
- arxiv url: http://arxiv.org/abs/2102.13129v1
- Date: Thu, 25 Feb 2021 19:07:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-01 13:55:15.057837
- Title: ANEA: Distant Supervision for Low-Resource Named Entity Recognition
- Title(参考訳): ANEA:低リソース名前のエンティティ認識のための離散監督
- Authors: Michael A. Hedderich, Lukas Lange, Dietrich Klakow
- Abstract要約: ANEAは、エンティティリストに基づいて名前付きエンティティを自動的にテキストにアノテートするツールです。
パイプライン全体にわたって、リストを取得し、遠隔監視のエラーを分析する。
- 参考スコア(独自算出の注目度): 17.900366234155662
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Distant supervision allows obtaining labeled training corpora for
low-resource settings where only limited hand-annotated data exists. However,
to be used effectively, the distant supervision must be easy to obtain. In this
work, we present ANEA, a tool to automatically annotate named entities in text
based on entity lists. It spans the whole pipeline from obtaining the lists to
analyzing the errors of the distant supervision. A tuning step allows the user
to improve the automatic annotation with their linguistic insights without
having to manually label or check all tokens. In six low-resource scenarios, we
show that the F1-score can be increased by on average 18 points through
distantly supervised data obtained by ANEA.
- Abstract(参考訳): 遠隔監視により、限られた手書きデータのみが存在する低リソース設定のためのラベル付きトレーニングコーポラを取得できます。
しかし、効果的に利用するためには、遠方の監督が容易に手に入る必要がある。
本稿では、エンティティリストに基づいて、名前付きエンティティを自動的にテキストにアノテートするツールであるANEAを紹介する。
パイプライン全体にわたって、リストを取得し、遠隔監視のエラーを分析する。
チューニングステップによって、ユーザはすべてのトークンを手作業でラベル付けしたりチェックすることなく、言語的な洞察で自動アノテーションを改善することができる。
6つの低リソースシナリオにおいて、平均18ポイントでF1スコアを増大させることができることを示す。
関連論文リスト
- UNIT: Unsupervised Online Instance Segmentation through Time [69.2787246878521]
クラスに依存しないオンラインインスタンスのセグメンテーションとトラッキングの問題に対処する。
オブジェクトのオンライントラッキングを可能にする新しいトレーニングレシピを提案する。
我々のネットワークは擬似ラベルで訓練されており、手動のアノテーションは不要である。
論文 参考訳(メタデータ) (2024-09-12T09:47:45Z) - Ground Truth Inference for Weakly Supervised Entity Matching [76.6732856489872]
弱監督タスクのための単純だが強力なラベル付けモデルを提案する。
次に、エンティティマッチングのタスクに特化してラベルモデルを調整します。
その結果,従来の手法よりもF1スコアが9%高い結果が得られた。
論文 参考訳(メタデータ) (2022-11-13T17:57:07Z) - SciAnnotate: A Tool for Integrating Weak Labeling Sources for Sequence
Labeling [55.71459234749639]
SciAnnotateはSciAnnotateという名前のテキストアノテーションのためのウェブベースのツールで、科学的なアノテーションツールを指す。
我々のツールは、弱いラベルを作成するために複数のユーザフレンドリーなインターフェースを提供する。
本研究では,Bertifying Conditional Hidden Markov Modelを用いて,ツールが生成する弱いラベルを識別する手法を提案する。
論文 参考訳(メタデータ) (2022-08-07T19:18:13Z) - ULF: Unsupervised Labeling Function Correction using Cross-Validation
for Weak Supervision [5.566060402907773]
弱監督(WS)は手動データラベリングの代案として費用対効果がある。
教師なしラベル付け関数修正のための新しいアルゴリズムULFを導入する。
ULFは、この割り当てを信頼性の高いクロスバリデーションサンプルに再推定することで、クラスへのLFの割り当てを洗練します。
論文 参考訳(メタデータ) (2022-04-14T10:29:01Z) - Automatic Synthesis of Diverse Weak Supervision Sources for Behavior
Analysis [37.077883083886114]
AutoSWAPはデータ効率の高いタスクレベルのラベリング機能を自動的に合成するフレームワークである。
本稿では,AutoSWAPがラベル付け機能を自動生成する有効な方法であり,行動分析の専門的労力を大幅に削減できることを示す。
論文 参考訳(メタデータ) (2021-11-30T07:51:12Z) - AutoTriggER: Label-Efficient and Robust Named Entity Recognition with
Auxiliary Trigger Extraction [54.20039200180071]
我々は,エンティティトリガの自動生成と活用によるNER性能向上のための新しいフレームワークを提案する。
筆者らのフレームワークは,ポストホックな説明を活用して合理的な知識を生成し,埋め込み手法を用いてモデルの事前知識を強化する。
AutoTriggERは強力なラベル効率を示し、目に見えないエンティティを一般化し、RoBERTa-CRFベースラインを平均0.5F1ポイント上回る性能を持つ。
論文 参考訳(メタデータ) (2021-09-10T08:11:56Z) - skweak: Weak Supervision Made Easy for NLP [13.37847225239485]
我々は、Pythonベースのソフトウェアツールキットskweakを紹介し、NLP開発者は幅広いNLPタスクに弱い監督を適用できる。
ドメイン知識から派生したラベル付け関数を使用して、指定されたデータセットのアノテーションを自動的に取得する。
得られたラベルは生成モデルで集約され、各ラベル関数の精度(および可能性のある混乱)を推定する。
論文 参考訳(メタデータ) (2021-04-19T23:26:51Z) - BOND: BERT-Assisted Open-Domain Named Entity Recognition with Distant
Supervision [49.42215511723874]
我々は,NERモデルの予測性能を改善するための新しい計算フレームワーク,BONDを提案する。
具体的には,2段階の学習アルゴリズムを提案する。第1段階では,遠隔ラベルを用いて,事前学習された言語モデルをNERタスクに適用する。
第2段階では,遠隔ラベルを廃止し,モデル性能をさらに向上するための自己学習手法を提案する。
論文 参考訳(メタデータ) (2020-06-28T04:55:39Z) - Named Entity Recognition without Labelled Data: A Weak Supervision
Approach [23.05371427663683]
本稿では,ラベル付きデータがない場合のNERモデルの学習方法を提案する。
このアプローチは、ターゲットドメインからテキストを自動的にアノテートするために、幅広いラベリング関数に依存している。
シーケンスラベリングモデルは、最終的にこの統一アノテーションに基づいて訓練することができる。
論文 参考訳(メタデータ) (2020-04-30T12:29:55Z) - Weakly-Supervised Salient Object Detection via Scribble Annotations [54.40518383782725]
本稿では,スクリブルラベルからサリエンシを学習するための弱教師付きサリエント物体検出モデルを提案する。
そこで本研究では,予測されたサリエンシマップの構造アライメントを測定するために,新しい尺度であるサリエンシ構造尺度を提案する。
我々の手法は、既存の弱教師付き/非教師付き手法よりも優れているだけでなく、いくつかの完全教師付き最先端モデルと同等である。
論文 参考訳(メタデータ) (2020-03-17T12:59:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。