論文の概要: Unsupervised Summarization for Chat Logs with Topic-Oriented Ranking and
Context-Aware Auto-Encoders
- arxiv url: http://arxiv.org/abs/2012.07300v1
- Date: Mon, 14 Dec 2020 07:31:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-08 14:34:55.295341
- Title: Unsupervised Summarization for Chat Logs with Topic-Oriented Ranking and
Context-Aware Auto-Encoders
- Title(参考訳): トピック指向ランキングとコンテキスト対応自動エンコーダを用いたチャットログの教師なし要約
- Authors: Yicheng Zou, Jun Lin, Lujun Zhao, Yangyang Kang, Zhuoren Jiang,
Changlong Sun, Qi Zhang, Xuanjing Huang, Xiaozhong Liu
- Abstract要約: 本稿では,手動ラベル付きデータを用いずにチャット要約を行うrankaeという新しいフレームワークを提案する。
RankAEは、中心性と多様性に応じてトピックの発話を同時に選択するトピック指向のランキング戦略で構成されています。
消音自動エンコーダは、選択された発話に基づいて簡潔でコンテキスト情報に基づいた要約を生成するように設計されています。
- 参考スコア(独自算出の注目度): 59.038157066874255
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automatic chat summarization can help people quickly grasp important
information from numerous chat messages. Unlike conventional documents, chat
logs usually have fragmented and evolving topics. In addition, these logs
contain a quantity of elliptical and interrogative sentences, which make the
chat summarization highly context dependent. In this work, we propose a novel
unsupervised framework called RankAE to perform chat summarization without
employing manually labeled data. RankAE consists of a topic-oriented ranking
strategy that selects topic utterances according to centrality and diversity
simultaneously, as well as a denoising auto-encoder that is carefully designed
to generate succinct but context-informative summaries based on the selected
utterances. To evaluate the proposed method, we collect a large-scale dataset
of chat logs from a customer service environment and build an annotated set
only for model evaluation. Experimental results show that RankAE significantly
outperforms other unsupervised methods and is able to generate high-quality
summaries in terms of relevance and topic coverage.
- Abstract(参考訳): 自動チャット要約は、多くのチャットメッセージから重要な情報を素早く把握するのに役立つ。
従来の文書とは異なり、チャットログは通常断片化され、進化するトピックを持つ。
さらに、これらのログには楕円文と疑問文の量が含まれており、チャットの要約は文脈に依存している。
本研究では,手動でラベル付けしたデータを使わずにチャット要約を行うRanAEという新しいフレームワークを提案する。
RankAEは、集中度と多様性に応じてトピックの発話を同時に選択するトピック指向のランキング戦略と、選択した発話に基づいて簡潔だが文脈インフォームティブな要約を生成するために慎重に設計された自動エンコーダから構成される。
提案手法を評価するために,チャットログの大規模データセットをカスタマサービス環境から収集し,モデル評価のみに注釈付きデータセットを構築する。
実験の結果,rankaeは他の教師なしの手法を著しく上回り,関連度や話題のカバレッジの観点から質の高い要約を生成できることがわかった。
関連論文リスト
- Topic-Aware Encoding for Extractive Summarization [15.113768658584979]
この問題に対処するために,文書要約のためのトピック認識符号化を提案する。
ニューラルネットワークに基づく文レベルの表現学習にニューラルトピックモデルを追加し、中心トピック情報を適切に検討する。
3つの公開データセットの実験結果は、我々のモデルが最先端のモデルより優れていることを示している。
論文 参考訳(メタデータ) (2021-12-17T15:26:37Z) - Author Clustering and Topic Estimation for Short Texts [69.54017251622211]
同じ文書中の単語間の強い依存をモデル化することにより、遅延ディリクレ割当を拡張できる新しいモデルを提案する。
同時にユーザをクラスタ化し、ホック後のクラスタ推定の必要性を排除しています。
我々の手法は、短文で生じる問題に対する従来のアプローチよりも、-または----------- で機能する。
論文 参考訳(メタデータ) (2021-06-15T20:55:55Z) - ConvoSumm: Conversation Summarization Benchmark and Improved Abstractive
Summarization with Argument Mining [61.82562838486632]
我々は、さまざまなオンライン会話形式のニュースコメント、ディスカッションフォーラム、コミュニティ質問応答フォーラム、電子メールスレッドに関する4つの新しいデータセットをクラウドソースする。
我々は、データセットの最先端モデルをベンチマークし、データに関連する特徴を分析します。
論文 参考訳(メタデータ) (2021-06-01T22:17:13Z) - Structure-Aware Abstractive Conversation Summarization via Discourse and
Action Graphs [22.58861442978803]
より正確で正確な会話要約のために、会話の豊富な構造を明示的にモデル化することを提案する。
発話とアクショントリプル間の会話関係を構造化されたグラフを通して表現し、会話をよりよくエンコードする。
実験により,提案したモデルは最先端の手法より優れ,他の領域でよく一般化されていることが示された。
論文 参考訳(メタデータ) (2021-04-16T23:04:52Z) - Multi-View Sequence-to-Sequence Models with Conversational Structure for
Abstractive Dialogue Summarization [72.54873655114844]
テキスト要約は、NLPにおいて最も困難で興味深い問題の1つである。
本研究では、まず、異なる視点から構造化されていない日々のチャットの会話構造を抽出し、会話を表現するマルチビューシーケンス・ツー・シーケンスモデルを提案する。
大規模対話要約コーパスの実験により,本手法は,自動評価と人的判断の両面から,従来の最先端モデルよりも有意に優れた性能を示した。
論文 参考訳(メタデータ) (2020-10-04T20:12:44Z) - Topic-Aware Multi-turn Dialogue Modeling [91.52820664879432]
本稿では,トピック認識発話を教師なしでセグメント化して抽出する,多元対話モデリングのための新しいソリューションを提案する。
トピック・アウェア・モデリングは、新たに提案されたトピック・アウェア・セグメンテーション・アルゴリズムとトピック・アウェア・デュアル・アテンション・マッチング(TADAM)ネットワークによって実現されている。
論文 参考訳(メタデータ) (2020-09-26T08:43:06Z) - Detecting and Classifying Malevolent Dialogue Responses: Taxonomy, Data
and Methodology [68.8836704199096]
コーパスベースの会話インタフェースは、テンプレートベースのエージェントや検索ベースのエージェントよりも多様な自然なレスポンスを生成することができる。
コーパスベースの会話エージェントの生成能力が増大すると、マレヴォレントな反応を分類し、フィルタリングする必要性が生じる。
不適切な内容の認識と分類に関するこれまでの研究は、主にある種のマレヴォレンスに焦点を絞っている。
論文 参考訳(メタデータ) (2020-08-21T22:43:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。