論文の概要: A combined approach to the analysis of speech conversations in a contact
center domain
- arxiv url: http://arxiv.org/abs/2203.06396v1
- Date: Sat, 12 Mar 2022 10:03:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-20 00:55:01.955393
- Title: A combined approach to the analysis of speech conversations in a contact
center domain
- Title(参考訳): コンタクトセンター領域における音声会話の分析への複合的アプローチ
- Authors: Andrea Brunello, Enrico Marzano, Angelo Montanari, Guido Sciavicco
- Abstract要約: 本稿では, インバウンドフローやアウトバウンドフローから抽出した通話記録を扱う, イタリアのコンタクトセンターにおける音声分析プロセスの実験について述べる。
まず,Kaldi フレームワークをベースとした社内音声合成ソリューションの開発について詳述する。
そこで我々は,コールトランスクリプトのセマンティックタグ付けに対する異なるアプローチの評価と比較を行った。
最後に、タグ付け問題にJ48Sと呼ばれる決定木インデューサを適用する。
- 参考スコア(独自算出の注目度): 2.575030923243061
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The ever more accurate search for deep analysis in customer data is a really
strong technological trend nowadays, quite appealing to both private and public
companies. This is particularly true in the contact center domain, where speech
analytics is an extremely powerful methodology for gaining insights from
unstructured data, coming from customer and human agent conversations. In this
work, we describe an experimentation with a speech analytics process for an
Italian contact center, that deals with call recordings extracted from inbound
or outbound flows. First, we illustrate in detail the development of an
in-house speech-to-text solution, based on Kaldi framework, and evaluate its
performance (and compare it to Google Cloud Speech API). Then, we evaluate and
compare different approaches to the semantic tagging of call transcripts,
ranging from classic regular expressions to machine learning models based on
ngrams and logistic regression, and propose a combination of them, which is
shown to provide a consistent benefit. Finally, a decision tree inducer, called
J48S, is applied to the problem of tagging. Such an algorithm is natively
capable of exploiting sequential data, such as texts, for classification
purposes. The solution is compared with the other approaches and is shown to
provide competitive classification performances, while generating highly
interpretable models and reducing the complexity of the data preparation phase.
The potential operational impact of the whole process is thoroughly examined.
- Abstract(参考訳): 顧客データの深い分析を求めるより正確な検索は、最近、非常に強力な技術トレンドであり、プライベートとパブリックの両方に非常にアピールしている。
音声分析は、顧客と人間のエージェントの会話から得られる、構造化されていないデータから洞察を得るための非常に強力な方法論である。
本研究では, インバウンドフローやアウトバウンドフローから抽出した通話記録を扱う, イタリアのコンタクトセンターにおける音声分析プロセスの実験について述べる。
まず、Kaldiフレームワークに基づく社内音声テキストソリューションの開発について詳細に説明し、その性能(およびGoogle Cloud Speech APIとの比較)を評価する。
次に,従来の正規表現から,ngramやロジスティック回帰に基づく機械学習モデルまで,コール書き起こしの意味的タグ付けに対する異なるアプローチを評価し比較し,それらの組み合わせを提案する。
最後に、タグ問題にj48sと呼ばれる決定木誘導器を適用する。
このようなアルゴリズムは、分類のためにテキストなどのシーケンシャルなデータを利用することができる。
このソリューションは、他のアプローチと比較され、高度に解釈可能なモデルを生成し、データ準備フェーズの複雑さを低減しながら、競合的な分類性能を提供する。
プロセス全体の潜在的な運用への影響を徹底的に調べます。
関連論文リスト
- Long-Span Question-Answering: Automatic Question Generation and QA-System Ranking via Side-by-Side Evaluation [65.16137964758612]
大規模言語モデルにおける長文文の活用について検討し,本書全体の読解データを作成する。
我々の目的は、長いテキストの詳細な理解を必要とする問題を分析し、理解し、推論するLLMの能力をテストすることである。
論文 参考訳(メタデータ) (2024-05-31T20:15:10Z) - Vocabulary-Defined Semantics: Latent Space Clustering for Improving In-Context Learning [32.178931149612644]
コンテキスト内学習により、言語モデルは下流のデータに適応したり、プロンプト内のデモとして少数のサンプルでタスクを組み込むことができる。
しかし、文脈内学習のパフォーマンスは、実演の質、形式、順序によって不安定である可能性がある。
語彙定義意味論(vocabulary-defined semantics)を提案する。
論文 参考訳(メタデータ) (2024-01-29T14:29:48Z) - Conversational Semantic Parsing using Dynamic Context Graphs [68.72121830563906]
汎用知識グラフ(KG)を用いた会話意味解析の課題を,数百万のエンティティと数千のリレーショナルタイプで検討する。
ユーザ発話を実行可能な論理形式にインタラクティブにマッピングできるモデルに焦点を当てる。
論文 参考訳(メタデータ) (2023-05-04T16:04:41Z) - Distant finetuning with discourse relations for stance classification [55.131676584455306]
そこで本研究では,定位分類のモデルとして,原文から銀ラベルでデータを抽出し,微調整する手法を提案する。
また,様々な段階において微調整に用いるデータのノイズレベルが減少する3段階のトレーニングフレームワークを提案する。
NLPCC 2021共有タスクArgumentative Text Understanding for AI Debaterでは,26の競合チームの中で1位にランクインした。
論文 参考訳(メタデータ) (2022-04-27T04:24:35Z) - On the Use of External Data for Spoken Named Entity Recognition [40.93448412171246]
近年の自己教師型音声表現の進歩により,ラベル付きデータに制限のある学習モデルを考えることが可能になった。
自己学習、知識蒸留、トランスファーラーニングなど、さまざまなアプローチを採用し、エンドツーエンドモデルとパイプラインアプローチの両方に適用性を検討する。
論文 参考訳(メタデータ) (2021-12-14T18:49:26Z) - Zero-shot hashtag segmentation for multilingual sentiment analysis [1.8762753243053634]
ハッシュタグセグメンテーション(ハッシュタグセグメンテーション、英: Hashtag segmentation)は、ソーシャルメディアデータセットのためのパイプラインを前処理する一般的なステップである。
ゼロショットハッシュタグセグメンテーションフレームワークを開発し、マルチリンガル感情分析パイプラインの精度向上にどのように使用できるかを示す。
論文 参考訳(メタデータ) (2021-12-06T18:13:46Z) - Low-Resource Dialogue Summarization with Domain-Agnostic Multi-Source
Pretraining [10.750492932503649]
注釈付き要約を伴う対話データの不十分さのため、大規模な要約モデルの訓練は一般的に不可能である。
本稿では,外部要約データをよりよく活用するためのマルチソース事前学習パラダイムを提案する。
提案手法は競争性能を達成し,異なる対話シナリオでよく一般化する。
論文 参考訳(メタデータ) (2021-09-09T07:47:16Z) - ConvoSumm: Conversation Summarization Benchmark and Improved Abstractive
Summarization with Argument Mining [61.82562838486632]
我々は、さまざまなオンライン会話形式のニュースコメント、ディスカッションフォーラム、コミュニティ質問応答フォーラム、電子メールスレッドに関する4つの新しいデータセットをクラウドソースする。
我々は、データセットの最先端モデルをベンチマークし、データに関連する特徴を分析します。
論文 参考訳(メタデータ) (2021-06-01T22:17:13Z) - Unsupervised Summarization for Chat Logs with Topic-Oriented Ranking and
Context-Aware Auto-Encoders [59.038157066874255]
本稿では,手動ラベル付きデータを用いずにチャット要約を行うrankaeという新しいフレームワークを提案する。
RankAEは、中心性と多様性に応じてトピックの発話を同時に選択するトピック指向のランキング戦略で構成されています。
消音自動エンコーダは、選択された発話に基づいて簡潔でコンテキスト情報に基づいた要約を生成するように設計されています。
論文 参考訳(メタデータ) (2020-12-14T07:31:17Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z) - ConCET: Entity-Aware Topic Classification for Open-Domain Conversational
Agents [9.870634472479571]
ConCET: Concurrent Entity-aware conversational Topic Classifierを紹介する。
本稿では,合成学習データを生成するための簡便で効果的な手法を提案する。
我々はAmazon Alexa Prizeの一部として収集された実際のユーザとの人間と機械の会話の大規模なデータセットでConCETを評価した。
論文 参考訳(メタデータ) (2020-05-28T06:29:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。