論文の概要: May I Ask Who's Calling? Named Entity Recognition on Call Center
Transcripts for Privacy Law Compliance
- arxiv url: http://arxiv.org/abs/2010.15598v1
- Date: Thu, 29 Oct 2020 13:53:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-01 22:52:37.206006
- Title: May I Ask Who's Calling? Named Entity Recognition on Call Center
Transcripts for Privacy Law Compliance
- Title(参考訳): 誰に電話してもよろしいですか。
プライバシ法コンプライアンスのためのコールセンター文字のエンティティ認識
- Authors: Micaela Kaplan
- Abstract要約: 我々は,新しいタイプのユーザ生成テキスト(コールセンター会話)に対して,名前付きエンティティ認識を用いて検討する。
これらの会話は、自然発話から、新規な問題と、会話自動音声認識の問題を結合する。
新しいアノテーションで独自のコーパスを使用し、カスタムコンテキスト文字列の埋め込みをトレーニングし、BiLSTM-CRFを適用します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We investigate using Named Entity Recognition on a new type of user-generated
text: a call center conversation. These conversations combine problems from
spontaneous speech with problems novel to conversational Automated Speech
Recognition, including incorrect recognition, alongside other common problems
from noisy user-generated text. Using our own corpus with new annotations,
training custom contextual string embeddings, and applying a BiLSTM-CRF, we
match state-of-the-art results on our novel task.
- Abstract(参考訳): ユーザ生成テキストの新しいタイプであるコールセンター会話における名前付きエンティティ認識を用いて検討する。
これらの会話は、自然発話から会話自動音声認識の新たな問題、不正確な認識を含む問題、および騒がしいユーザー生成テキストからの他の一般的な問題とを組み合わせる。
新しいアノテーションと独自のコーパスを使用して、カスタムコンテキスト文字列の埋め込みをトレーニングし、BiLSTM-CRFを適用して、新しいタスクで最先端の結果とマッチングする。
関連論文リスト
- Learning From Free-Text Human Feedback -- Collect New Datasets Or Extend
Existing Ones? [57.16050211534735]
一般的な対話データセットにおける自由文フィードバックのタイプと頻度について検討する。
この結果から, エラータイプ, ユーザ応答タイプ, それらの関係性など, 調査したデータセットの構成に関する新たな知見が得られた。
論文 参考訳(メタデータ) (2023-10-24T12:01:11Z) - Personalization of CTC-based End-to-End Speech Recognition Using
Pronunciation-Driven Subword Tokenization [7.259999144975082]
本稿では,コネクショナリズムの時間的分類に基づくエンドツーエンド音声認識システムに対するパーソナライズソリューションについて述べる。
我々は,この手法を,文脈バイアスとワードピース事前正規化という2つの確立された手法と組み合わせることで,競合するハイブリッドシステムと同等の個人名の実体精度を達成できることを実証した。
論文 参考訳(メタデータ) (2023-10-16T00:06:32Z) - SpeechLM: Enhanced Speech Pre-Training with Unpaired Textual Data [100.46303484627045]
本稿では,事前定義した統一表現と音声とテキストの事前学習を協調させるクロスモーダル音声言語モデル(SpeechLM)を提案する。
具体的には、音声とテキストのモダリティをブリッジするために、2つの別の離散トークン化器を導入する。
音声認識, 音声翻訳, ユニバーサル表現評価フレームワーク SUPERB など, 様々な音声言語処理タスクにおける音声LM の評価を行った。
論文 参考訳(メタデータ) (2022-09-30T09:12:10Z) - End-to-end Spoken Conversational Question Answering: Task, Dataset and
Model [92.18621726802726]
音声による質問応答では、システムは関連する音声書き起こしの中に連続したテキストスパンからの質問に答えるように設計されている。
本稿では,複雑な対話フローをモデル化することを目的とした音声対話型質問応答タスク(SCQA)を提案する。
本研究の目的は,音声記録に基づく対話型質問に対処するシステムを構築することであり,情報収集システムによる様々なモダリティからより多くの手がかりを提供する可能性を探ることである。
論文 参考訳(メタデータ) (2022-04-29T17:56:59Z) - Towards Theme Detection in Personal Finance Questions [0.0]
本稿では,複数のテーマの発生を抽出するコールセンターテーマ検出手法を提案する。
一つの質問における複数のテーマの発生を捉えるために、このアプローチは質問レベルではなく、文中のクラスタをエンコードする。
我々は,このタスクに対してマイクロF1を0.46で達成し,その結果,少しうるさい場合でも,クラスタに関連付けられたラベルとトポロジ的に一致した文を含むことを示す。
論文 参考訳(メタデータ) (2021-10-04T16:44:16Z) - Open-Retrieval Conversational Machine Reading [80.13988353794586]
会話機械読解では、システムは自然言語規則を解釈し、ハイレベルな質問に答え、フォローアップの明確化を問う必要がある。
既存の作業では、ルールテキストがユーザ毎の質問に対して提供されると仮定し、実際のシナリオにおいて必須の検索ステップを無視する。
本研究では,対話型機械読解のオープンリトリーバル設定を提案し,検討する。
論文 参考訳(メタデータ) (2021-02-17T08:55:01Z) - End to End ASR System with Automatic Punctuation Insertion [0.0]
本稿では,TED.com から入手可能な transcript を用いて TEDLium データセットの句読点書き起こしを生成する手法を提案する。
また,音声信号から単語と句を同時に出力するエンドツーエンドのASRシステムを提案する。
論文 参考訳(メタデータ) (2020-12-03T15:46:43Z) - Personalized Query Rewriting in Conversational AI Agents [7.086654234990377]
本稿では,ユーザの歴史的に成功したインタラクションをメモリとして活用し,クエリ書き換え手法を提案する。
ニューラルネットワークモデルとポインタジェネレータネットワークに階層的な注意を払い、上述したユーザ記憶を用いたクエリ書き換えタスクにおいて、より優れた性能を発揮することを示す。
論文 参考訳(メタデータ) (2020-11-09T20:45:39Z) - Towards Data Distillation for End-to-end Spoken Conversational Question
Answering [65.124088336738]
音声対話型質問応答タスク(SCQA)を提案する。
SCQAは,音声発話とテキストコーパスから複雑な対話の流れをモデル化することを目的としている。
我々の主な目的は、音声とテキストの両方で会話的な質問に対処するQAシステムを構築することである。
論文 参考訳(メタデータ) (2020-10-18T05:53:39Z) - PALM: Pre-training an Autoencoding&Autoregressive Language Model for
Context-conditioned Generation [92.7366819044397]
自己指導型事前学習は、自然言語の理解と生成のための強力な技術として登場した。
本研究は,大規模未ラベルコーパス上で自己エンコーディングと自己回帰言語モデルを共同で事前学習する新しいスキームをPALMに提示する。
広範な実験により、PALMは様々な言語生成ベンチマークにおいて、新しい最先端の結果を達成することが示されている。
論文 参考訳(メタデータ) (2020-04-14T06:25:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。