論文の概要: DEXTER: Deep Encoding of External Knowledge for Named Entity Recognition
in Virtual Assistants
- arxiv url: http://arxiv.org/abs/2108.06633v1
- Date: Sun, 15 Aug 2021 00:14:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-17 15:31:48.022995
- Title: DEXTER: Deep Encoding of External Knowledge for Named Entity Recognition
in Virtual Assistants
- Title(参考訳): DEXTER:仮想アシスタントにおける名前付きエンティティ認識のための外部知識の深層符号化
- Authors: Deepak Muralidharan, Joel Ruben Antony Moniz, Weicheng Zhang, Stephen
Pulman, Lin Li, Megan Barnes, Jingjing Pan, Jason Williams, Alex Acero
- Abstract要約: NERが重要なコンポーネントであるインテリジェント音声アシスタントでは、ユーザや音声認識エラーのため、NERへの入力がうるさい場合がある。
これらの問題に対処するためのNERシステムについて述べる。
本手法は, セマンティック解析などの関連タスクを改善し, エラー率を最大5%向上することを示す。
- 参考スコア(独自算出の注目度): 10.500933545429202
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Named entity recognition (NER) is usually developed and tested on text from
well-written sources. However, in intelligent voice assistants, where NER is an
important component, input to NER may be noisy because of user or speech
recognition error. In applications, entity labels may change frequently, and
non-textual properties like topicality or popularity may be needed to choose
among alternatives.
We describe a NER system intended to address these problems. We test and
train this system on a proprietary user-derived dataset. We compare with a
baseline text-only NER system; the baseline enhanced with external gazetteers;
and the baseline enhanced with the search and indirect labelling techniques we
describe below. The final configuration gives around 6% reduction in NER error
rate. We also show that this technique improves related tasks, such as semantic
parsing, with an improvement of up to 5% in error rate.
- Abstract(参考訳): 名前付きエンティティ認識(NER)は通常、よく書かれたソースからのテキストで開発、テストされる。
しかし、NERが重要なコンポーネントであるインテリジェント音声アシスタントでは、ユーザや音声認識エラーのため、NERへの入力がうるさい場合がある。
アプリケーションでは、エンティティラベルは頻繁に変更され、トピック性や人気といった非テキストプロパティは、代替品を選択するために必要となる。
これらの問題に対処するためのNERシステムについて述べる。
我々は、このシステムをプロプライエタリなユーザ由来のデータセットでテストし、訓練する。
本稿では,ベースラインのテキストのみのnerシステム,外部のガゼッタで拡張されたベースライン,および下記の検索および間接ラベル技術で強化されたベースラインとの比較を行った。
最終的な構成は、NERエラー率を約6%削減する。
また,この手法はセマンティック解析などの関連タスクを改善し,エラー率を最大5%向上させることを示した。
関連論文リスト
- WhisperNER: Unified Open Named Entity and Speech Recognition [15.535663273628147]
本稿では,共同音声の書き起こしと実体認識を可能にする新しいモデルであるWhisperNERを紹介する。
WhisperNERはオープンタイプのNERをサポートし、推論時に多様で進化するエンティティの認識を可能にする。
実験の結果,WhisperNERはドメイン外オープン型NERと教師付き微調整の両方において,自然なベースラインよりも優れていた。
論文 参考訳(メタデータ) (2024-09-12T15:00:56Z) - Learning Robust Named Entity Recognizers From Noisy Data With Retrieval Augmentation [67.89838237013078]
名前付きエンティティ認識(NER)モデルは、しばしばノイズの多い入力に悩まされる。
ノイズの多いテキストとそのNERラベルのみを利用できる、より現実的な設定を提案する。
我々は、推論中にテキストを取得することなく、堅牢なNERを改善するマルチビュートレーニングフレームワークを採用している。
論文 参考訳(メタデータ) (2024-07-26T07:30:41Z) - Named Entity Recognition via Machine Reading Comprehension: A Multi-Task
Learning Approach [50.12455129619845]
Named Entity Recognition (NER) は、テキスト内のエンティティの参照を事前に定義された型に抽出し、分類することを目的としている。
我々は,MRCベースのNERを改善するために,エンティティタイプ間のラベル依存性をマルチタスク学習フレームワークに組み込むことを提案する。
論文 参考訳(メタデータ) (2023-09-20T03:15:05Z) - Optimizing Bi-Encoder for Named Entity Recognition via Contrastive
Learning [80.36076044023581]
名前付きエンティティ認識(NER)のための効率的なバイエンコーダフレームワークを提案する。
我々はNERを、エンティティ参照のベクトル表現とその型との類似性を最大化する計量学習問題とみなす。
NERのこのバイエンコーダの定式化における大きな課題は、エンティティの言及から非エンゲージスを分離することにある。
論文 参考訳(メタデータ) (2022-08-30T23:19:04Z) - Empirical Study of Named Entity Recognition Performance Using
Distribution-aware Word Embedding [15.955385058787348]
そこで我々は,NERフレームワークにおける分散情報を利用するために,分散対応単語埋め込みを開発し,三つの異なる手法を実装した。
単語特異性が既存のNERメソッドに組み込まれれば、NERのパフォーマンスが向上する。
論文 参考訳(メタデータ) (2021-09-03T17:28:04Z) - Cross-domain Speech Recognition with Unsupervised Character-level
Distribution Matching [60.8427677151492]
2つの領域における各文字間の微粒化適応を行うための文字レベルの分布マッチング手法であるCMatchを提案する。
Libri-Adaptデータセットを用いた実験の結果,提案手法はクロスデバイスとクロス環境の両方で14.39%,16.50%の単語誤り率(WER)を低減できることがわかった。
論文 参考訳(メタデータ) (2021-04-15T14:36:54Z) - Named Entity Recognition in the Legal Domain using a Pointer Generator
Network [0.0]
我々は, 訴訟のPDFファイルからノイズテキストを抽出し, 法的NERの問題点を米国裁判所から調査した。
テキスト内のエンティティの正確な位置は不明で、エンティティはタイプミスやOCRミスを含む可能性がある。
nerタスクをテキストからテキストへのシーケンス生成タスクとして定式化し、ポインタ生成ネットワークを訓練して文書内のエンティティを生成する。
論文 参考訳(メタデータ) (2020-12-17T21:10:34Z) - Noise Robust Named Entity Understanding for Voice Assistants [14.193603900541005]
提案手法は,NERの精度を最大3.13%向上し,ELの精度を最大3.6%向上することを示す。
使用する機能は、ドメイン分類やセマンティック解析など、他の自然言語理解タスクの精度向上にも繋がる。
論文 参考訳(メタデータ) (2020-05-29T06:14:53Z) - End-to-end Named Entity Recognition from English Speech [51.22888702264816]
ASRとNERのタグ付けコンポーネントを協調的に最適化するE2Eアプローチを提案する。
また,音声からのNERを用いて語彙(OOV)をASRシステムで処理する方法についても論じる。
論文 参考訳(メタデータ) (2020-05-22T13:39:14Z) - Interpretability Analysis for Named Entity Recognition to Understand
System Predictions and How They Can Improve [49.878051587667244]
名前付きエンティティ認識のためのLSTM-CRFアーキテクチャの性能について検討する。
文脈表現はシステムの性能に寄与するが、ハイパフォーマンスを駆動する主な要因は、名前トークン自体を学習することにある。
我々は、コンテキストのみからエンティティタイプを推測する可能性を評価するために、人間アノテーションを登録し、コンテキストのみのシステムによるエラーの大部分に対してエンティティタイプを推論することはできないが、改善の余地はいくつかある。
論文 参考訳(メタデータ) (2020-04-09T14:37:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。