論文の概要: Intent Mining from past conversations for conversational agent
- arxiv url: http://arxiv.org/abs/2005.11014v4
- Date: Mon, 18 Jan 2021 13:45:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-30 08:14:03.594565
- Title: Intent Mining from past conversations for conversational agent
- Title(参考訳): 会話エージェントのための過去の会話からの意図マイニング
- Authors: Ajay Chatterjee and Shubhashis Sengupta
- Abstract要約: ボットは、ラウンド・ザ・タイムのサポートと顧客エンゲージメントを高めるために、ますますデプロイされている。
商用ボット構築フレームワークの多くは、ユーザ入力を認識するためのインテントモデルの構築とトレーニングを必要とする標準的なアプローチに従っている。
我々は、不均衡なデータクラスタリングのための新しい密度ベースクラスタリングアルゴリズムITERDB-LabelSCANを導入した。
- 参考スコア(独自算出の注目度): 1.9754522186574608
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Conversational systems are of primary interest in the AI community. Chatbots
are increasingly being deployed to provide round-the-clock support and to
increase customer engagement. Many of the commercial bot building frameworks
follow a standard approach that requires one to build and train an intent model
to recognize a user input. Intent models are trained in a supervised setting
with a collection of textual utterance and intent label pairs. Gathering a
substantial and wide coverage of training data for different intent is a
bottleneck in the bot building process. Moreover, the cost of labeling a
hundred to thousands of conversations with intent is a time consuming and
laborious job. In this paper, we present an intent discovery framework that
involves 4 primary steps: Extraction of textual utterances from a conversation
using a pre-trained domain agnostic Dialog Act Classifier (Data Extraction),
automatic clustering of similar user utterances (Clustering), manual annotation
of clusters with an intent label (Labeling) and propagation of intent labels to
the utterances from the previous step, which are not mapped to any cluster
(Label Propagation); to generate intent training data from raw conversations.
We have introduced a novel density-based clustering algorithm ITER-DBSCAN for
unbalanced data clustering. Subject Matter Expert (Annotators with domain
expertise) manually looks into the clustered user utterances and provides an
intent label for discovery. We conducted user studies to validate the
effectiveness of the trained intent model generated in terms of coverage of
intents, accuracy and time saving concerning manual annotation. Although the
system is developed for building an intent model for the conversational system,
this framework can also be used for a short text clustering or as a labeling
framework.
- Abstract(参考訳): 会話システムは、AIコミュニティにおいて主要な関心事である。
チャットボットは、時間単位のサポートを提供し、顧客エンゲージメントを高めるために、ますますデプロイされている。
多くの商用ボット構築フレームワークは、ユーザ入力を認識するためにインテントモデルを構築し、トレーニングする必要がある標準アプローチに従っている。
インテントモデルは、テキストによる発話とインテントラベルペアの集まりで教師あり設定で訓練される。
異なる意図でトレーニングデータをかなり広範囲に収集することは、ボット構築プロセスにおけるボトルネックである。
さらに、100から数千の会話を意図してラベル付けするコストは、時間と労力のかかる作業である。
In this paper, we present an intent discovery framework that involves 4 primary steps: Extraction of textual utterances from a conversation using a pre-trained domain agnostic Dialog Act Classifier (Data Extraction), automatic clustering of similar user utterances (Clustering), manual annotation of clusters with an intent label (Labeling) and propagation of intent labels to the utterances from the previous step, which are not mapped to any cluster (Label Propagation); to generate intent training data from raw conversations.
我々は,不均衡データクラスタリングのための新しい密度ベースクラスタリングアルゴリズムiter-dbscanを導入した。
subject Matter Expert(ドメインの専門知識を持つアノテーション)は、手動でクラスタ化されたユーザー発話を調べ、発見のためのインテントラベルを提供する。
手動アノテーションの意図範囲,正確性,時間節約の観点から,訓練した意図モデルの有効性を検証するため,ユーザ実験を行った。
このシステムは会話システムのための意図モデルを構築するために開発されたが、このフレームワークは短いテキストクラスタリングやラベリングフレームワークとしても使用できる。
関連論文リスト
- IDAS: Intent Discovery with Abstractive Summarization [16.731183915325584]
目的発見における近年の競合手法は,抽象的な要約に基づく発話のクラスタリングによってより優れることを示す。
我々は、大規模言語モデルに促すことで、記述的発話ラベルの集合を収集するIDASアプローチに貢献する。
発話とそのノイズラベルは、凍結した事前訓練されたエンコーダによって符号化され、その後クラスタ化され、潜伏した意図を回復する。
論文 参考訳(メタデータ) (2023-05-31T12:19:40Z) - Goal-Driven Explainable Clustering via Language Descriptions [50.980832345025334]
我々は新しいタスク定式化"Goal-Driven Clustering with Explanations"(GoalEx)を提案する。
GoalExは、ゴールと説明の両方を自由形式の言語記述として表現している。
提案手法は,従来の手法よりも精度が高く,目標に関連のある説明を導出する。
論文 参考訳(メタデータ) (2023-05-23T07:05:50Z) - Building the Intent Landscape of Real-World Conversational Corpora with
Extractive Question-Answering Transformers [0.0]
実世界の対話から意図や意図の分類を抽出する教師なしパイプラインを提案する。
本研究は,SQuAD2データセット上に微調整されたELECTRA大モデルによる対話理解の一般化能力を示すものである。
論文 参考訳(メタデータ) (2022-08-26T22:53:19Z) - New Intent Discovery with Pre-training and Contrastive Learning [21.25371293641141]
新しい意図発見は、ユーザ発話から新しい意図カテゴリーを明らかにして、サポート対象クラスのセットを拡張することを目的としている。
既存のアプローチは通常、大量のラベル付き発話に依存する。
本稿では,クラスタリングのためのラベルなしデータにおける自己超越的信号を活用するために,新たなコントラスト損失を提案する。
論文 参考訳(メタデータ) (2022-05-25T17:07:25Z) - What is wrong with you?: Leveraging User Sentiment for Automatic Dialog
Evaluation [73.03318027164605]
本稿では,次のユーザの発話から自動的に抽出できる情報をプロキシとして利用して,前のシステム応答の質を測定することを提案する。
本モデルは,実際のユーザおよび有償ユーザから収集した音声と書面の両方のオープンドメインダイアログコーパスを一般化する。
論文 参考訳(メタデータ) (2022-03-25T22:09:52Z) - Author Clustering and Topic Estimation for Short Texts [69.54017251622211]
同じ文書中の単語間の強い依存をモデル化することにより、遅延ディリクレ割当を拡張できる新しいモデルを提案する。
同時にユーザをクラスタ化し、ホック後のクラスタ推定の必要性を排除しています。
我々の手法は、短文で生じる問題に対する従来のアプローチよりも、-または----------- で機能する。
論文 参考訳(メタデータ) (2021-06-15T20:55:55Z) - Open Intent Discovery through Unsupervised Semantic Clustering and
Dependency Parsing [44.99113692679489]
本稿では,意図発見のための教師なし2段階アプローチを提案し,ラベルなし発話の集合から意図ラベルを自動的に生成する。
提案手法が有意義なインテントラベルを自動的に生成し,発話クラスタリングやインテント発見において高精度かつリコールを実現することを示す。
論文 参考訳(メタデータ) (2021-04-25T09:36:23Z) - Discovering New Intents with Deep Aligned Clustering [19.11073686645496]
限定された既知の意図データを用いて新しい意図を発見するための効果的な方法であるDeep Aligned Clusteringを提案する。
未知の新たな意図によって、低信頼な意図的クラスタを排除し、意図的カテゴリの数を予測する。
2つのベンチマークデータセットの実験は、私たちの方法がより堅牢であり、最先端の方法よりも大幅に改善されることを示しています。
論文 参考訳(メタデータ) (2020-12-16T14:32:06Z) - Learning with Weak Supervision for Email Intent Detection [56.71599262462638]
本稿では,メールの意図を検出するために,ユーザアクションを弱い監視源として活用することを提案する。
メール意図識別のためのエンドツーエンドの堅牢なディープニューラルネットワークモデルを開発した。
論文 参考訳(メタデータ) (2020-05-26T23:41:05Z) - AGIF: An Adaptive Graph-Interactive Framework for Joint Multiple Intent
Detection and Slot Filling [69.59096090788125]
本稿では,多目的検出とスロットフィリングを併用する適応グラフ対話フレームワーク(AGIF)を提案する。
スロットとインテントの強い相関関係をモデル化するために,インテント-スロットグラフ相互作用層を導入する。
このような相互作用層が各トークンに適応的に適用され、関連する意図情報を自動抽出する利点がある。
論文 参考訳(メタデータ) (2020-04-21T15:07:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。