論文の概要: May I Ask Who's Calling? Named Entity Recognition on Call Center
Transcripts for Privacy Law Compliance
- arxiv url: http://arxiv.org/abs/2010.15598v1
- Date: Thu, 29 Oct 2020 13:53:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-01 22:52:37.206006
- Title: May I Ask Who's Calling? Named Entity Recognition on Call Center
Transcripts for Privacy Law Compliance
- Title(参考訳): 誰に電話してもよろしいですか。
プライバシ法コンプライアンスのためのコールセンター文字のエンティティ認識
- Authors: Micaela Kaplan
- Abstract要約: 我々は,新しいタイプのユーザ生成テキスト(コールセンター会話)に対して,名前付きエンティティ認識を用いて検討する。
これらの会話は、自然発話から、新規な問題と、会話自動音声認識の問題を結合する。
新しいアノテーションで独自のコーパスを使用し、カスタムコンテキスト文字列の埋め込みをトレーニングし、BiLSTM-CRFを適用します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We investigate using Named Entity Recognition on a new type of user-generated
text: a call center conversation. These conversations combine problems from
spontaneous speech with problems novel to conversational Automated Speech
Recognition, including incorrect recognition, alongside other common problems
from noisy user-generated text. Using our own corpus with new annotations,
training custom contextual string embeddings, and applying a BiLSTM-CRF, we
match state-of-the-art results on our novel task.
- Abstract(参考訳): ユーザ生成テキストの新しいタイプであるコールセンター会話における名前付きエンティティ認識を用いて検討する。
これらの会話は、自然発話から会話自動音声認識の新たな問題、不正確な認識を含む問題、および騒がしいユーザー生成テキストからの他の一般的な問題とを組み合わせる。
新しいアノテーションと独自のコーパスを使用して、カスタムコンテキスト文字列の埋め込みをトレーニングし、BiLSTM-CRFを適用して、新しいタスクで最先端の結果とマッチングする。
関連論文リスト
- Learning Robust Named Entity Recognizers From Noisy Data With Retrieval Augmentation [67.89838237013078]
名前付きエンティティ認識(NER)モデルは、しばしばノイズの多い入力に悩まされる。
ノイズの多いテキストとそのNERラベルのみを利用できる、より現実的な設定を提案する。
我々は、推論中にテキストを取得することなく、堅牢なNERを改善するマルチビュートレーニングフレームワークを採用している。
論文 参考訳(メタデータ) (2024-07-26T07:30:41Z) - Empowering Whisper as a Joint Multi-Talker and Target-Talker Speech Recognition System [73.34663391495616]
本稿では,複数話者と目標話者の音声認識タスクを併用する先駆的手法を提案する。
具体的には、Whisperを凍結し、Sidecarセパレータをエンコーダに差し込み、複数の話者に対する混合埋め込みを分離する。
AishellMix Mandarin データセット上で,マルチストーカー ASR 上で許容できるゼロショット性能を提供する。
論文 参考訳(メタデータ) (2024-07-13T09:28:24Z) - Learning From Free-Text Human Feedback -- Collect New Datasets Or Extend
Existing Ones? [57.16050211534735]
一般的な対話データセットにおける自由文フィードバックのタイプと頻度について検討する。
この結果から, エラータイプ, ユーザ応答タイプ, それらの関係性など, 調査したデータセットの構成に関する新たな知見が得られた。
論文 参考訳(メタデータ) (2023-10-24T12:01:11Z) - Personalization of CTC-based End-to-End Speech Recognition Using
Pronunciation-Driven Subword Tokenization [7.259999144975082]
本稿では,コネクショナリズムの時間的分類に基づくエンドツーエンド音声認識システムに対するパーソナライズソリューションについて述べる。
我々は,この手法を,文脈バイアスとワードピース事前正規化という2つの確立された手法と組み合わせることで,競合するハイブリッドシステムと同等の個人名の実体精度を達成できることを実証した。
論文 参考訳(メタデータ) (2023-10-16T00:06:32Z) - End-to-end Spoken Conversational Question Answering: Task, Dataset and
Model [92.18621726802726]
音声による質問応答では、システムは関連する音声書き起こしの中に連続したテキストスパンからの質問に答えるように設計されている。
本稿では,複雑な対話フローをモデル化することを目的とした音声対話型質問応答タスク(SCQA)を提案する。
本研究の目的は,音声記録に基づく対話型質問に対処するシステムを構築することであり,情報収集システムによる様々なモダリティからより多くの手がかりを提供する可能性を探ることである。
論文 参考訳(メタデータ) (2022-04-29T17:56:59Z) - Towards Theme Detection in Personal Finance Questions [0.0]
本稿では,複数のテーマの発生を抽出するコールセンターテーマ検出手法を提案する。
一つの質問における複数のテーマの発生を捉えるために、このアプローチは質問レベルではなく、文中のクラスタをエンコードする。
我々は,このタスクに対してマイクロF1を0.46で達成し,その結果,少しうるさい場合でも,クラスタに関連付けられたラベルとトポロジ的に一致した文を含むことを示す。
論文 参考訳(メタデータ) (2021-10-04T16:44:16Z) - Open-Retrieval Conversational Machine Reading [80.13988353794586]
会話機械読解では、システムは自然言語規則を解釈し、ハイレベルな質問に答え、フォローアップの明確化を問う必要がある。
既存の作業では、ルールテキストがユーザ毎の質問に対して提供されると仮定し、実際のシナリオにおいて必須の検索ステップを無視する。
本研究では,対話型機械読解のオープンリトリーバル設定を提案し,検討する。
論文 参考訳(メタデータ) (2021-02-17T08:55:01Z) - Personalized Query Rewriting in Conversational AI Agents [7.086654234990377]
本稿では,ユーザの歴史的に成功したインタラクションをメモリとして活用し,クエリ書き換え手法を提案する。
ニューラルネットワークモデルとポインタジェネレータネットワークに階層的な注意を払い、上述したユーザ記憶を用いたクエリ書き換えタスクにおいて、より優れた性能を発揮することを示す。
論文 参考訳(メタデータ) (2020-11-09T20:45:39Z) - Towards Data Distillation for End-to-end Spoken Conversational Question
Answering [65.124088336738]
音声対話型質問応答タスク(SCQA)を提案する。
SCQAは,音声発話とテキストコーパスから複雑な対話の流れをモデル化することを目的としている。
我々の主な目的は、音声とテキストの両方で会話的な質問に対処するQAシステムを構築することである。
論文 参考訳(メタデータ) (2020-10-18T05:53:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。