論文の概要: Open Intent Discovery through Unsupervised Semantic Clustering and
Dependency Parsing
- arxiv url: http://arxiv.org/abs/2104.12114v1
- Date: Sun, 25 Apr 2021 09:36:23 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-27 14:45:04.681551
- Title: Open Intent Discovery through Unsupervised Semantic Clustering and
Dependency Parsing
- Title(参考訳): 教師なしセマンティッククラスタリングと依存性解析によるオープンインテント発見
- Authors: Pengfei Liu, Youzhang Ning, King Keung Wu, Kun Li and Helen Meng
- Abstract要約: 本稿では,意図発見のための教師なし2段階アプローチを提案し,ラベルなし発話の集合から意図ラベルを自動的に生成する。
提案手法が有意義なインテントラベルを自動的に生成し,発話クラスタリングやインテント発見において高精度かつリコールを実現することを示す。
- 参考スコア(独自算出の注目度): 44.99113692679489
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Intent understanding plays an important role in dialog systems, and is
typically formulated as a supervised classification problem. However, it is
challenging and time-consuming to design the intent labels manually to support
a new domain. This paper proposes an unsupervised two-stage approach to
discover intents and generate meaningful intent labels automatically from a
collection of unlabeled utterances. In the first stage, we aim to generate a
set of semantically coherent clusters where the utterances within each cluster
convey the same intent. We obtain the utterance representation from various
pre-trained sentence embeddings and present a metric of balanced score to
determine the optimal number of clusters in K-means clustering. In the second
stage, the objective is to generate an intent label automatically for each
cluster. We extract the ACTION-OBJECT pair from each utterance using a
dependency parser and take the most frequent pair within each cluster, e.g.,
book-restaurant, as the generated cluster label. We empirically show that the
proposed unsupervised approach can generate meaningful intent labels
automatically and achieves high precision and recall in utterance clustering
and intent discovery.
- Abstract(参考訳): インテント理解はダイアログシステムにおいて重要な役割を担い、典型的には教師付き分類問題として定式化される。
しかし、新しいドメインをサポートするためにインテントラベルを手動で設計するのは難しく、時間を要する。
本稿では,意図発見のための教師なし2段階アプローチを提案し,ラベルなし発話の集合から意味のある意図ラベルを自動的に生成する。
最初の段階では、各クラスタ内の発話が同じ意図を伝達するセマンティック・コヒーレントなクラスタの集合を生成することを目指している。
各種事前学習文の埋め込みから発話表現を取得し,K平均クラスタリングにおける最適なクラスタ数を決定するためのバランススコアの指標を示す。
第2段階では、各クラスタに対して自動的にインテントラベルを生成することが目的だ。
本稿では,各発話から依存パーサを用いてACTION-OBJECTペアを抽出し,各クラスタ内で最も頻繁なペア(例えば,ブックレストラン)を生成されたクラスタラベルとして取り出す。
提案手法は意味のある意図ラベルを自動的に生成し,発話クラスタリングや意図発見において高精度なリコールを実現する。
関連論文リスト
- Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。
クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。
提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-30T00:32:47Z) - Semantics Meets Temporal Correspondence: Self-supervised Object-centric Learning in Videos [63.94040814459116]
自己教師付き手法は、高レベルの意味論と低レベルの時間対応の学習において顕著な進歩を見せている。
融合した意味特徴と対応地図の上に,意味認識型マスキングスロットアテンションを提案する。
我々は、時間的コヒーレントなオブジェクト中心表現を促進するために、セマンティックおよびインスタンスレベルの時間的一貫性を自己スーパービジョンとして採用する。
論文 参考訳(メタデータ) (2023-08-19T09:12:13Z) - Actively Supervised Clustering for Open Relation Extraction [42.114747195195655]
本稿では,OpenREのためのアクティブなクラスタリングという,新しい設定を提案する。
設定の鍵は、どのインスタンスにラベルを付けるかを選択することである。
本稿では,未知の関係のクラスタを動的に発見する手法を提案する。
論文 参考訳(メタデータ) (2023-06-08T06:55:02Z) - IDAS: Intent Discovery with Abstractive Summarization [16.731183915325584]
目的発見における近年の競合手法は,抽象的な要約に基づく発話のクラスタリングによってより優れることを示す。
我々は、大規模言語モデルに促すことで、記述的発話ラベルの集合を収集するIDASアプローチに貢献する。
発話とそのノイズラベルは、凍結した事前訓練されたエンコーダによって符号化され、その後クラスタ化され、潜伏した意図を回復する。
論文 参考訳(メタデータ) (2023-05-31T12:19:40Z) - Goal-Driven Explainable Clustering via Language Descriptions [50.980832345025334]
我々は新しいタスク定式化"Goal-Driven Clustering with Explanations"(GoalEx)を提案する。
GoalExは、ゴールと説明の両方を自由形式の言語記述として表現している。
提案手法は,従来の手法よりも精度が高く,目標に関連のある説明を導出する。
論文 参考訳(メタデータ) (2023-05-23T07:05:50Z) - A Clustering Framework for Unsupervised and Semi-supervised New Intent
Discovery [25.900661912504397]
我々は、教師なしおよび半教師なしの新しい意図発見のための新しいクラスタリングフレームワークUSNIDを提案する。
まず、教師なしまたは半教師なしのデータをフル活用して、浅いセマンティック類似性関係を抽出する。
第2に、クラスタ割り当ての不整合の問題に対処するために、セントロイド誘導クラスタリング機構を設計する。
第3に、教師なしまたは半教師付きデータの高レベルなセマンティクスをキャプチャして、きめ細かい意図的クラスタを見つける。
論文 参考訳(メタデータ) (2023-04-16T05:30:42Z) - Analysis of Utterance Embeddings and Clustering Methods Related to Intent Induction for Task-Oriented Dialogue [8.07809100513473]
本研究では,タスク指向のダイアログスキーマの設計における課題を克服するための教師なしアプローチについて検討する。
意図の自動誘導には,(1)インテントラベリングのためのクラスタリングアルゴリズム,(2)ユーザ発話の埋め込み空間の2つの因果関係を仮定する。
クラスタリングによる事前学習したMiniLMは,NMI,ARI,F1,精度,インテント誘導タスクにおけるサンプルカバレッジを著しく向上させた。
論文 参考訳(メタデータ) (2022-12-05T04:37:22Z) - Out-of-Category Document Identification Using Target-Category Names as
Weak Supervision [64.671654559798]
Out-of-category Detection は、文書が不適格(またはターゲット)カテゴリと意味的関連性に応じて区別することを目的としている。
対象のカテゴリの1つに属する文書の信頼性を効果的に測定する,カテゴリ外検出フレームワークを提案する。
論文 参考訳(メタデータ) (2021-11-24T21:01:25Z) - You Never Cluster Alone [150.94921340034688]
我々は、主流のコントラスト学習パラダイムをクラスタレベルのスキームに拡張し、同じクラスタに属するすべてのデータが統一された表現に寄与する。
分類変数の集合をクラスタ化代入信頼度として定義し、インスタンスレベルの学習トラックとクラスタレベルの学習トラックを関連付ける。
代入変数を再パラメータ化することで、TCCはエンドツーエンドでトレーニングされる。
論文 参考訳(メタデータ) (2021-06-03T14:59:59Z) - Intent Mining from past conversations for conversational agent [1.9754522186574608]
ボットは、ラウンド・ザ・タイムのサポートと顧客エンゲージメントを高めるために、ますますデプロイされている。
商用ボット構築フレームワークの多くは、ユーザ入力を認識するためのインテントモデルの構築とトレーニングを必要とする標準的なアプローチに従っている。
我々は、不均衡なデータクラスタリングのための新しい密度ベースクラスタリングアルゴリズムITERDB-LabelSCANを導入した。
論文 参考訳(メタデータ) (2020-05-22T05:29:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。