論文の概要: Dialog Intent Induction via Density-based Deep Clustering Ensemble
- arxiv url: http://arxiv.org/abs/2201.06731v1
- Date: Tue, 18 Jan 2022 04:13:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-20 01:44:52.344249
- Title: Dialog Intent Induction via Density-based Deep Clustering Ensemble
- Title(参考訳): 密度に基づくディープクラスタリングアンサンブルによる対話インテント誘導
- Authors: Jiashu Pu, Guandan Chen, Yongzhu Chang, Xiaoxi Mao
- Abstract要約: リアルタイムアプリケーションでは,会話ログから新たな対話意図を誘導し,ユーザエクスペリエンスを向上させることが重要である。
ダイアログ意図誘導のための密度ベースDeep Clustering Ensemble (DDCE) 手法を提案する。
提案手法は,多数の外れ値が存在する実生活シナリオの処理に有効である。
- 参考スコア(独自算出の注目度): 12.05997006407326
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Existing task-oriented chatbots heavily rely on spoken language understanding
(SLU) systems to determine a user's utterance's intent and other key
information for fulfilling specific tasks. In real-life applications, it is
crucial to occasionally induce novel dialog intents from the conversation logs
to improve the user experience. In this paper, we propose the Density-based
Deep Clustering Ensemble (DDCE) method for dialog intent induction. Compared to
existing K-means based methods, our proposed method is more effective in
dealing with real-life scenarios where a large number of outliers exist. To
maximize data utilization, we jointly optimize texts' representations and the
hyperparameters of the clustering algorithm. In addition, we design an
outlier-aware clustering ensemble framework to handle the overfitting issue.
Experimental results over seven datasets show that our proposed method
significantly outperforms other state-of-the-art baselines.
- Abstract(参考訳): 既存のタスク指向チャットボットは、ユーザの発話意図や特定のタスクを実行するための重要な情報を決定するために、音声言語理解(SLU)システムに大きく依存している。
実生活アプリケーションでは、会話ログから時々新しいダイアログインテントを誘導し、ユーザエクスペリエンスを改善することが重要である。
本稿では,対話意図誘導のための密度に基づくDeep Clustering Ensemble (DDCE)法を提案する。
既存のK平均法と比較して,提案手法は,多数の外れ値が存在する実生活シナリオの処理に有効である。
データ利用を最大化するために,テキスト表現とクラスタリングアルゴリズムのハイパーパラメータを共同で最適化する。
さらに,オーバーフィッティング問題に対処するために,外部対応型クラスタリングアンサンブルフレームワークを設計した。
7つのデータセットにおける実験結果から,提案手法は他の最先端のベースラインを有意に上回っている。
関連論文リスト
- Generative Context Distillation [48.91617280112579]
Generative Context Distillation (GCD) は、ジョイントトレーニングアプローチを採用した軽量なプロンプト内在化手法である。
エージェントベースのアプリケーションシナリオにおいて,このアプローチが複雑なプロンプトを効果的に内部化することを示す。
論文 参考訳(メタデータ) (2024-11-24T17:32:20Z) - Intent-Aware Dialogue Generation and Multi-Task Contrastive Learning for Multi-Turn Intent Classification [6.459396785817196]
Chain-of-Intentは、セルフプレイを通じて意図駆動の会話を生成する。
MINT-CLはマルチタスクコントラスト学習を用いたマルチターンインテント分類のためのフレームワークである。
MINT-Eは多言語対応のマルチターンeコマース対話コーパスである。
論文 参考訳(メタデータ) (2024-11-21T15:59:29Z) - Text-Video Retrieval with Global-Local Semantic Consistent Learning [122.15339128463715]
我々は,シンプルで効果的なグローバル局所意味的一貫性学習(GLSCL)を提案する。
GLSCLは、テキストビデオ検索のためのモダリティをまたいだ潜在共有セマンティクスを活用する。
本手法はSOTAと同等の性能を実現し,計算コストの約220倍の高速化を実現している。
論文 参考訳(メタデータ) (2024-05-21T11:59:36Z) - A Weighted K-Center Algorithm for Data Subset Selection [70.49696246526199]
サブセット選択は、トレーニングデータの小さな部分を特定する上で重要な役割を果たす、基本的な問題である。
我々は,k中心および不確かさサンプリング目的関数の重み付け和に基づいて,サブセットを計算する新しい係数3近似アルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-12-17T04:41:07Z) - Free Lunch for Efficient Textual Commonsense Integration in Language
Models [20.02647320786556]
類似したコモンセンス記述を持つサンプルを1つのバッチにグループ化し、複数のサンプル間でエンコードされた記述を再利用する。
大規模な実験では、提案したバッチ分割手法が性能を保ちながら計算コストを効果的に削減することを示した。
効率の改善は、大規模なデータセットや、メモリ容量の大きいデバイスでより顕著であり、大規模なアプリケーションに実用性があることを証明している。
論文 参考訳(メタデータ) (2023-05-24T19:14:57Z) - Going beyond research datasets: Novel intent discovery in the industry
setting [60.90117614762879]
本稿では,大規模なeコマースプラットフォームに展開する意図発見パイプラインを改善する手法を提案する。
ドメイン内データに基づく事前学習型言語モデルの利点を示す。
また,クラスタリングタスクの微調整中に,実生活データセットの会話構造(質問と回答)を利用するための最善の方法も考案した。
論文 参考訳(メタデータ) (2023-05-09T14:21:29Z) - Open-vocabulary Panoptic Segmentation with Embedding Modulation [71.15502078615587]
オープン語彙のイメージセグメンテーションは、現実世界における重要な応用のために注目を集めている。
従来のクローズド・ボキャブラリ・セグメンテーション法は、新しいオブジェクトを特徴づけることができないが、最近のいくつかのオープン・ボキャブラリ試みは、満足のいく結果を得る。
オープン語彙パノプトンのための全能的でデータ効率のよいフレームワークであるOPSNetを提案する。
論文 参考訳(メタデータ) (2023-03-20T17:58:48Z) - Discovering Customer-Service Dialog System with Semi-Supervised Learning
and Coarse-to-Fine Intent Detection [6.869753194843482]
タスク指向ダイアログは,マルチターン会話による特定の目標達成を支援することを目的としている。
教師/学生のパラダイムに基づいた弱教師付きデータセットを構築した。
また,ユーザ意図を検出するために,モジュール型対話システムと粗粒度分類を統合した。
論文 参考訳(メタデータ) (2022-12-23T14:36:43Z) - Analysis of Utterance Embeddings and Clustering Methods Related to Intent Induction for Task-Oriented Dialogue [8.07809100513473]
本研究では,タスク指向のダイアログスキーマの設計における課題を克服するための教師なしアプローチについて検討する。
意図の自動誘導には,(1)インテントラベリングのためのクラスタリングアルゴリズム,(2)ユーザ発話の埋め込み空間の2つの因果関係を仮定する。
クラスタリングによる事前学習したMiniLMは,NMI,ARI,F1,精度,インテント誘導タスクにおけるサンプルカバレッジを著しく向上させた。
論文 参考訳(メタデータ) (2022-12-05T04:37:22Z) - Semi-Supervised Clustering with Contrastive Learning for Discovering New
Intents [10.634249106899304]
我々は,Deep Contrastive Semi-supervised Clustering (DCSC)を提案する。
DCSCは、テキストサンプルを半教師付きでクラスタリングし、スタッフにグループ化されたインテントを提供することを目的としている。
2つの公開データセットで実験を行い、我々のモデルをいくつかの一般的な手法と比較する。
論文 参考訳(メタデータ) (2022-01-07T09:58:43Z) - A Proposition-Level Clustering Approach for Multi-Document Summarization [82.4616498914049]
クラスタリングアプローチを再検討し、より正確な情報アライメントの提案をグループ化します。
提案手法は,有意な命題を検出し,それらをパラフラスティックなクラスタに分類し,その命題を融合して各クラスタの代表文を生成する。
DUC 2004 とTAC 2011 データセットでは,従来の最先端 MDS 法よりも要約法が優れている。
論文 参考訳(メタデータ) (2021-12-16T10:34:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。