論文の概要: NER-to-MRC: Named-Entity Recognition Completely Solving as Machine
Reading Comprehension
- arxiv url: http://arxiv.org/abs/2305.03970v1
- Date: Sat, 6 May 2023 08:05:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-09 18:27:33.932107
- Title: NER-to-MRC: Named-Entity Recognition Completely Solving as Machine
Reading Comprehension
- Title(参考訳): NER-to-MRC: 機械読み取りの理解として完全に解決された名前付きエンティティ認識
- Authors: Yuxiang Zhang, Junjie Wang, Xinyu Zhu, Tetsuya Sakai, Hayato Yamana
- Abstract要約: NER は NER-to-MRC と呼ばれる機械読解問題である。
我々は NER タスクを MRC で解くのに適した形式に効率よく変換する。
我々は、WNUT-16データセットを最大11.24%改善し、外部データなしで最先端のパフォーマンスを実現した。
- 参考スコア(独自算出の注目度): 29.227500985892195
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Named-entity recognition (NER) detects texts with predefined semantic labels
and is an essential building block for natural language processing (NLP).
Notably, recent NER research focuses on utilizing massive extra data, including
pre-training corpora and incorporating search engines. However, these methods
suffer from high costs associated with data collection and pre-training, and
additional training process of the retrieved data from search engines. To
address the above challenges, we completely frame NER as a machine reading
comprehension (MRC) problem, called NER-to-MRC, by leveraging MRC with its
ability to exploit existing data efficiently. Several prior works have been
dedicated to employing MRC-based solutions for tackling the NER problem,
several challenges persist: i) the reliance on manually designed prompts; ii)
the limited MRC approaches to data reconstruction, which fails to achieve
performance on par with methods utilizing extensive additional data. Thus, our
NER-to-MRC conversion consists of two components: i) transform the NER task
into a form suitable for the model to solve with MRC in a efficient manner; ii)
apply the MRC reasoning strategy to the model. We experiment on 6 benchmark
datasets from three domains and achieve state-of-the-art performance without
external data, up to 11.24% improvement on the WNUT-16 dataset.
- Abstract(参考訳): Named-entity Recognition (NER)は、定義済みの意味ラベルを持つテキストを検出し、自然言語処理(NLP)に不可欠なビルディングブロックである。
特に最近のNER研究は、事前学習コーパスや検索エンジンの導入など、膨大なデータの利用に焦点を当てている。
しかし,これらの手法は,データ収集や事前学習に伴う高コストと,検索エンジンから取得したデータの追加トレーニングプロセスに悩まされている。
これらの課題に対処するため,我々は,既存のデータを効率的に活用する能力にMDCを活用することにより,NERを機械読解(MRC)問題(NER-to-MRC)とみなす。
MRCベースのソリューションをNER問題に対処するために、いくつかの先行研究が行われてきたが、いくつかの課題が続いている。
一 手動で設計したプロンプトへの依存
二 広範囲な追加データを利用する方法と同等の性能を達成できないデータ再構成に対する限られたMRCアプローチ。
したがって、NER-to-MRC変換は2つのコンポーネントから構成される。
i) nerタスクを効率的な方法でmrcで解決するモデルに適した形式に変換すること。
二 モデルにmrc推論戦略を適用すること。
3つのドメインからの6つのベンチマークデータセットを実験し、外部データなしで最先端のパフォーマンスを実現し、WNUT-16データセットを最大11.24%改善した。
関連論文リスト
- MindStar: Enhancing Math Reasoning in Pre-trained LLMs at Inference Time [51.5039731721706]
MindStarは、大言語モデルの純粋に推論に基づく探索手法である。
推論タスクを探索問題として定式化し、最適な推論経路を特定するための2つの探索アイデアを提案する。
Llama-2-13BやMistral-7Bのようなオープンソースモデルの推論能力を大幅に向上させ、GPT-3.5やGrok-1に匹敵する性能を実現している。
論文 参考訳(メタデータ) (2024-05-25T15:07:33Z) - SCANNER: Knowledge-Enhanced Approach for Robust Multi-modal Named Entity Recognition of Unseen Entities [10.193908215351497]
3つのNER変種を効果的に扱えるモデルであるSCANNERを提案する。
SCANNERは2段階構造であり、最初の段階でエンティティ候補を抽出し、知識を得るためにクエリとして使用する。
NERデータセットのノイズの多いアノテーションから生じる課題に対処するために,新しい自己蒸留法を提案する。
論文 参考訳(メタデータ) (2024-04-02T13:05:41Z) - LLM-DA: Data Augmentation via Large Language Models for Few-Shot Named
Entity Recognition [67.96794382040547]
$LLM-DA$は、数発のNERタスクのために、大きな言語モデル(LLM)に基づいた、新しいデータ拡張テクニックである。
提案手法では,14のコンテキスト書き換え戦略を採用し,同一タイプのエンティティ置換を設計し,ロバスト性を高めるためにノイズ注入を導入する。
論文 参考訳(メタデータ) (2024-02-22T14:19:56Z) - NERetrieve: Dataset for Next Generation Named Entity Recognition and
Retrieval [49.827932299460514]
我々は、大きな言語モデルによって提供される能力は、NER研究の終わりではなく、むしろエキサイティングな始まりであると主張する。
我々は、NERタスクの3つの変種と、それらをサポートするデータセットを示す。
500のエンティティタイプをカバーする400万段落の,大規模で銀の注釈付きコーパスを提供する。
論文 参考訳(メタデータ) (2023-10-22T12:23:00Z) - Named Entity Recognition via Machine Reading Comprehension: A Multi-Task
Learning Approach [50.12455129619845]
Named Entity Recognition (NER) は、テキスト内のエンティティの参照を事前に定義された型に抽出し、分類することを目的としている。
我々は,MRCベースのNERを改善するために,エンティティタイプ間のラベル依存性をマルチタスク学習フレームワークに組み込むことを提案する。
論文 参考訳(メタデータ) (2023-09-20T03:15:05Z) - NER-MQMRC: Formulating Named Entity Recognition as Multi Question
Machine Reading Comprehension [6.3066273316843775]
一つのテキストに対して複数の質問を同時に考えるマルチクエスト MRC タスクとして NER のポーズを提案する。
提案アーキテクチャは,NER-SQMRCフレームワークベースモデルと比較して,平均2.5倍,2.3倍の高速化を実現している。
論文 参考訳(メタデータ) (2022-05-12T06:54:03Z) - Distantly-Supervised Named Entity Recognition with Noise-Robust Learning
and Language Model Augmented Self-Training [66.80558875393565]
遠距離ラベル付きデータのみを用いて、名前付きエンティティ認識(NER)モデルを訓練する際の課題について検討する。
本稿では,新しい損失関数と雑音ラベル除去ステップからなるノイズロスバスト学習手法を提案する。
提案手法は,既存の遠隔教師付きNERモデルよりも優れた性能を実現する。
論文 参考訳(メタデータ) (2021-09-10T17:19:56Z) - An Open-Source Dataset and A Multi-Task Model for Malay Named Entity
Recognition [3.511753382329252]
マレーNERデータセット(MYNER)を28,991文(384万個以上)で構築する。
NERトレーニングを明示的かつ暗黙的に改善するために、補助的なタスクである境界検出が導入されている。
論文 参考訳(メタデータ) (2021-09-03T03:29:25Z) - Exploiting Neural Query Translation into Cross Lingual Information
Retrieval [49.167049709403166]
既存のCLIRシステムは、高度ニューラルネットワーク翻訳(NMT)ではなく、統計ベースの機械翻訳(SMT)を主に活用している
本稿では,ユーザクリックスルーデータに基づいてクエリ変換ペアを抽出する新しいデータ拡張手法を提案する。
実験結果から,提案手法は強いベースラインよりも高い検索精度が得られることがわかった。
論文 参考訳(メタデータ) (2020-10-26T15:28:19Z) - A Survey on Machine Reading Comprehension: Tasks, Evaluation Metrics and
Benchmark Datasets [5.54205518616467]
機械読み取り(Machine Reading、MRC)は、自然言語処理(NLP)の研究分野である。
MRCモデルの多くは、さまざまなベンチマークデータセットで人のパフォーマンスをすでに上回っている。
これは、既存のデータセット、評価指標、モデルを改善して、現在のMCCモデルを"リアル"な理解へと移行する必要性を示しています。
論文 参考訳(メタデータ) (2020-06-21T19:18:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。