論文の概要: DEXTER: Deep Encoding of External Knowledge for Named Entity Recognition
in Virtual Assistants
- arxiv url: http://arxiv.org/abs/2108.06633v1
- Date: Sun, 15 Aug 2021 00:14:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-17 15:31:48.022995
- Title: DEXTER: Deep Encoding of External Knowledge for Named Entity Recognition
in Virtual Assistants
- Title(参考訳): DEXTER:仮想アシスタントにおける名前付きエンティティ認識のための外部知識の深層符号化
- Authors: Deepak Muralidharan, Joel Ruben Antony Moniz, Weicheng Zhang, Stephen
Pulman, Lin Li, Megan Barnes, Jingjing Pan, Jason Williams, Alex Acero
- Abstract要約: NERが重要なコンポーネントであるインテリジェント音声アシスタントでは、ユーザや音声認識エラーのため、NERへの入力がうるさい場合がある。
これらの問題に対処するためのNERシステムについて述べる。
本手法は, セマンティック解析などの関連タスクを改善し, エラー率を最大5%向上することを示す。
- 参考スコア(独自算出の注目度): 10.500933545429202
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Named entity recognition (NER) is usually developed and tested on text from
well-written sources. However, in intelligent voice assistants, where NER is an
important component, input to NER may be noisy because of user or speech
recognition error. In applications, entity labels may change frequently, and
non-textual properties like topicality or popularity may be needed to choose
among alternatives.
We describe a NER system intended to address these problems. We test and
train this system on a proprietary user-derived dataset. We compare with a
baseline text-only NER system; the baseline enhanced with external gazetteers;
and the baseline enhanced with the search and indirect labelling techniques we
describe below. The final configuration gives around 6% reduction in NER error
rate. We also show that this technique improves related tasks, such as semantic
parsing, with an improvement of up to 5% in error rate.
- Abstract(参考訳): 名前付きエンティティ認識(NER)は通常、よく書かれたソースからのテキストで開発、テストされる。
しかし、NERが重要なコンポーネントであるインテリジェント音声アシスタントでは、ユーザや音声認識エラーのため、NERへの入力がうるさい場合がある。
アプリケーションでは、エンティティラベルは頻繁に変更され、トピック性や人気といった非テキストプロパティは、代替品を選択するために必要となる。
これらの問題に対処するためのNERシステムについて述べる。
我々は、このシステムをプロプライエタリなユーザ由来のデータセットでテストし、訓練する。
本稿では,ベースラインのテキストのみのnerシステム,外部のガゼッタで拡張されたベースライン,および下記の検索および間接ラベル技術で強化されたベースラインとの比較を行った。
最終的な構成は、NERエラー率を約6%削減する。
また,この手法はセマンティック解析などの関連タスクを改善し,エラー率を最大5%向上させることを示した。
関連論文リスト
- Named Entity Recognition via Machine Reading Comprehension: A Multi-Task
Learning Approach [50.12455129619845]
Named Entity Recognition (NER) は、テキスト内のエンティティの参照を事前に定義された型に抽出し、分類することを目的としている。
我々は,MRCベースのNERを改善するために,エンティティタイプ間のラベル依存性をマルチタスク学習フレームワークに組み込むことを提案する。
論文 参考訳(メタデータ) (2023-09-20T03:15:05Z) - Automated Testing and Improvement of Named Entity Recognition Systems [3.8293110324859505]
TINは、NERシステムの自動テストと修復のための新しい、広く適用可能なアプローチである。
2つのSOTA NERモデルと2つの商用NER API、すなわちAzure NERとAWS NERをテストするためにTINを使用します。
TINは試験中の4つのシステムに対して高いエラー低減率(26.8%-50.6%)を達成し、1,877件のNERエラーのうち1,056件の修復に成功した。
論文 参考訳(メタデータ) (2023-08-14T03:17:24Z) - IXA/Cogcomp at SemEval-2023 Task 2: Context-enriched Multilingual Named
Entity Recognition using Knowledge Bases [53.054598423181844]
3つのステップからなる新しいNERカスケードアプローチを提案する。
我々は、細粒度および新興物質を正確に分類する上で、外部知識基盤の重要性を実証的に示す。
本システムは,低リソース言語設定においても,マルチコネラ2共有タスクにおいて頑健な性能を示す。
論文 参考訳(メタデータ) (2023-04-20T20:30:34Z) - Dynamic Named Entity Recognition [5.9401550252715865]
動的名前付きエンティティ認識(DNER)という新しいタスクを紹介します。
DNERは、コンテキストを利用してエンティティを抽出するアルゴリズムの能力を評価するためのフレームワークを提供する。
本稿では,本課題に関連する課題と研究軸を反映したベースラインモデルと実験結果について述べる。
論文 参考訳(メタデータ) (2023-02-16T15:50:02Z) - Optimizing Bi-Encoder for Named Entity Recognition via Contrastive
Learning [80.36076044023581]
名前付きエンティティ認識(NER)のための効率的なバイエンコーダフレームワークを提案する。
我々はNERを、エンティティ参照のベクトル表現とその型との類似性を最大化する計量学習問題とみなす。
NERのこのバイエンコーダの定式化における大きな課題は、エンティティの言及から非エンゲージスを分離することにある。
論文 参考訳(メタデータ) (2022-08-30T23:19:04Z) - Empirical Study of Named Entity Recognition Performance Using
Distribution-aware Word Embedding [15.955385058787348]
そこで我々は,NERフレームワークにおける分散情報を利用するために,分散対応単語埋め込みを開発し,三つの異なる手法を実装した。
単語特異性が既存のNERメソッドに組み込まれれば、NERのパフォーマンスが向上する。
論文 参考訳(メタデータ) (2021-09-03T17:28:04Z) - Cross-domain Speech Recognition with Unsupervised Character-level
Distribution Matching [60.8427677151492]
2つの領域における各文字間の微粒化適応を行うための文字レベルの分布マッチング手法であるCMatchを提案する。
Libri-Adaptデータセットを用いた実験の結果,提案手法はクロスデバイスとクロス環境の両方で14.39%,16.50%の単語誤り率(WER)を低減できることがわかった。
論文 参考訳(メタデータ) (2021-04-15T14:36:54Z) - Named Entity Recognition in the Legal Domain using a Pointer Generator
Network [0.0]
我々は, 訴訟のPDFファイルからノイズテキストを抽出し, 法的NERの問題点を米国裁判所から調査した。
テキスト内のエンティティの正確な位置は不明で、エンティティはタイプミスやOCRミスを含む可能性がある。
nerタスクをテキストからテキストへのシーケンス生成タスクとして定式化し、ポインタ生成ネットワークを訓練して文書内のエンティティを生成する。
論文 参考訳(メタデータ) (2020-12-17T21:10:34Z) - Noise Robust Named Entity Understanding for Voice Assistants [14.193603900541005]
提案手法は,NERの精度を最大3.13%向上し,ELの精度を最大3.6%向上することを示す。
使用する機能は、ドメイン分類やセマンティック解析など、他の自然言語理解タスクの精度向上にも繋がる。
論文 参考訳(メタデータ) (2020-05-29T06:14:53Z) - End-to-end Named Entity Recognition from English Speech [51.22888702264816]
ASRとNERのタグ付けコンポーネントを協調的に最適化するE2Eアプローチを提案する。
また,音声からのNERを用いて語彙(OOV)をASRシステムで処理する方法についても論じる。
論文 参考訳(メタデータ) (2020-05-22T13:39:14Z) - Interpretability Analysis for Named Entity Recognition to Understand
System Predictions and How They Can Improve [49.878051587667244]
名前付きエンティティ認識のためのLSTM-CRFアーキテクチャの性能について検討する。
文脈表現はシステムの性能に寄与するが、ハイパフォーマンスを駆動する主な要因は、名前トークン自体を学習することにある。
我々は、コンテキストのみからエンティティタイプを推測する可能性を評価するために、人間アノテーションを登録し、コンテキストのみのシステムによるエラーの大部分に対してエンティティタイプを推論することはできないが、改善の余地はいくつかある。
論文 参考訳(メタデータ) (2020-04-09T14:37:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。