論文の概要: Topic Detection from Conversational Dialogue Corpus with Parallel
Dirichlet Allocation Model and Elbow Method
- arxiv url: http://arxiv.org/abs/2006.03353v1
- Date: Fri, 5 Jun 2020 10:24:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-25 04:10:57.220621
- Title: Topic Detection from Conversational Dialogue Corpus with Parallel
Dirichlet Allocation Model and Elbow Method
- Title(参考訳): 並列ディリクレ割当てモデルと肘法による会話コーパスからの話題検出
- Authors: Haider Khalid, Vincent Wade
- Abstract要約: 並列遅延ディリクレアロケーション(PLDA)モデルを用いたトピック検出手法を提案する。
クラスタ内での一貫性の解釈と検証には,Elbow Method を用いた K-mean クラスタリングを用いる。
実験の結果,PLDAとElbow法を組み合わせることで,最適なクラスタ数を選択し,会話のトピックを洗練できることがわかった。
- 参考スコア(独自算出の注目度): 1.599072005190786
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A conversational system needs to know how to switch between topics to
continue the conversation for a more extended period. For this topic detection
from dialogue corpus has become an important task for a conversation and
accurate prediction of conversation topics is important for creating coherent
and engaging dialogue systems. In this paper, we proposed a topic detection
approach with Parallel Latent Dirichlet Allocation (PLDA) Model by clustering a
vocabulary of known similar words based on TF-IDF scores and Bag of Words (BOW)
technique. In the experiment, we use K-mean clustering with Elbow Method for
interpretation and validation of consistency within-cluster analysis to select
the optimal number of clusters. We evaluate our approach by comparing it with
traditional LDA and clustering technique. The experimental results show that
combining PLDA with Elbow method selects the optimal number of clusters and
refine the topics for the conversation.
- Abstract(参考訳): 会話システムは、より長い期間会話を続けるために、トピック間の切り替え方法を知る必要があります。
対話コーパスからのトピック検出は,対話における重要なタスクとなり,対話システムの構築には,会話トピックの正確な予測が重要である。
本稿では,tf-idfスコアとbag of words (bow) 手法に基づいて既知の類似語の語彙をクラスタリングすることにより,並列潜在ディリクレ割当(plda)モデルを用いた話題検出手法を提案する。
実験では,k-meanクラスタリングを用いてクラスタ内一貫性の解釈と検証を行い,クラスタ数を最適に決定する。
従来のLDAとクラスタリング技術との比較により,我々のアプローチを評価する。
実験の結果,pldaと肘法を組み合わせることで,最適なクラスタ数を選択し,会話のトピックを洗練できることがわかった。
関連論文リスト
- Multi-turn Dialogue Comprehension from a Topic-aware Perspective [70.37126956655985]
本稿では,話題認識の観点から,マルチターン対話をモデル化することを提案する。
対話文のセグメント化アルゴリズムを用いて、対話文を教師なしの方法でトピック集中フラグメントに分割する。
また,トピックセグメントを処理要素として扱う新しいモデルとして,トピック認識デュアルアテンションマッチング(TADAM)ネットワークを提案する。
論文 参考訳(メタデータ) (2023-09-18T11:03:55Z) - Multi-Granularity Prompts for Topic Shift Detection in Dialogue [13.739991183173494]
対話トピックシフト検出の目標は、会話中の現在のトピックが変更されたか、変更する必要があるかを特定することである。
従来の研究は、事前訓練されたモデルを用いて発話を符号化するトピックシフトの検出に重点を置いていた。
我々は,複数粒度での対話,すなわちラベル,ターン,トピックから話題情報を抽出するために,プロンプトベースのアプローチを採用する。
論文 参考訳(メタデータ) (2023-05-23T12:35:49Z) - Unsupervised Dialogue Topic Segmentation with Topic-aware Utterance
Representation [51.22712675266523]
対話トピック(DTS)は、様々な対話モデリングタスクにおいて重要な役割を果たす。
本稿では,ラベルなし対話データからトピック対応発話表現を学習する,教師なしDSSフレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-04T11:35:23Z) - Improve Retrieval-based Dialogue System via Syntax-Informed Attention [46.79601705850277]
文内構文情報と文間構文情報の両方を考慮したSIA, Syntax-Informed Attentionを提案する。
提案手法を広範に使用した3つのベンチマークで評価し,対話応答選択における本手法の一般的な優位性を示す実験結果を得た。
論文 参考訳(メタデータ) (2023-03-12T08:14:16Z) - CluCDD:Contrastive Dialogue Disentanglement via Clustering [18.06976502939079]
毎日、膨大な数の多人数の対話がオンラインで行われている。
対話の切り離しは、絡み合った対話を分離したセッションに分けることを目的としている。
コントラスト学習により発話を集約するCluCDDというモデルを提案する。
論文 参考訳(メタデータ) (2023-02-16T08:47:51Z) - Findings on Conversation Disentanglement [28.874162427052905]
発話から発話への分類と発話からスレッドへの分類を学習する学習モデルを構築した。
Ubuntu IRCデータセットの実験は、このアプローチが従来の欲求的アプローチを上回る可能性があることを示している。
論文 参考訳(メタデータ) (2021-12-10T05:54:48Z) - Response Selection for Multi-Party Conversations with Dynamic Topic
Tracking [63.15158355071206]
我々は、応答と関連する会話コンテキストの間のトピックを一致させるために、動的トピック追跡タスクとして応答選択をフレーム化する。
本研究では,大規模な事前学習モデルによる効率的な符号化を支援する新しいマルチタスク学習フレームワークを提案する。
DSTC-8 Ubuntu IRCデータセットの実験結果は、応答選択とトピックのアンタングル化タスクにおける最先端の結果を示している。
論文 参考訳(メタデータ) (2020-10-15T14:21:38Z) - Multi-View Sequence-to-Sequence Models with Conversational Structure for
Abstractive Dialogue Summarization [72.54873655114844]
テキスト要約は、NLPにおいて最も困難で興味深い問題の1つである。
本研究では、まず、異なる視点から構造化されていない日々のチャットの会話構造を抽出し、会話を表現するマルチビューシーケンス・ツー・シーケンスモデルを提案する。
大規模対話要約コーパスの実験により,本手法は,自動評価と人的判断の両面から,従来の最先端モデルよりも有意に優れた性能を示した。
論文 参考訳(メタデータ) (2020-10-04T20:12:44Z) - Modeling Topical Relevance for Multi-Turn Dialogue Generation [61.87165077442267]
マルチターン対話におけるトピックドリフト問題に対処する新しいモデルSTAR-BTMを提案する。
バイラルトピックモデルは、トレーニングデータセット全体に基づいて事前トレーニングされ、各コンテキストのトピック表現に基づいてトピックレベルの注意重みが計算される。
中国における顧客サービスデータと英語Ubuntuの対話データの両方の実験結果から、STAR-BTMは最先端の手法を著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2020-09-27T03:33:22Z) - Topic-Aware Multi-turn Dialogue Modeling [91.52820664879432]
本稿では,トピック認識発話を教師なしでセグメント化して抽出する,多元対話モデリングのための新しいソリューションを提案する。
トピック・アウェア・モデリングは、新たに提案されたトピック・アウェア・セグメンテーション・アルゴリズムとトピック・アウェア・デュアル・アテンション・マッチング(TADAM)ネットワークによって実現されている。
論文 参考訳(メタデータ) (2020-09-26T08:43:06Z) - A Hybrid Framework for Topic Structure using Laughter Occurrences [0.3680403821470856]
この作業では、パラ言語的知識と言語的知識を多段階階層を通してハイブリッドフレームワークに組み合わせます。
笑いの発生は、ICSIデータベースの多人数会議記録からパラ言語情報として使用される。
このトレーニング不要なトピック構造化アプローチは、音声対話のオンライン理解に適用できる。
論文 参考訳(メタデータ) (2019-12-31T23:31:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。