論文の概要: Improving Unsupervised Dialogue Topic Segmentation with Utterance-Pair
Coherence Scoring
- arxiv url: http://arxiv.org/abs/2106.06719v1
- Date: Sat, 12 Jun 2021 08:49:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2021-06-19 20:50:57.957869
- Title: Improving Unsupervised Dialogue Topic Segmentation with Utterance-Pair
Coherence Scoring
- Title(参考訳): 発話対コヒーレンススコアリングによる教師なし対話トピックセグメンテーションの改善
- Authors: Linzi Xing, Giuseppe Carenini
- Abstract要約: 発話対ペアコヒーレンススコアのトレーニングコーパスを生成するための戦略を提案する。
そして,得られた学習コーパスを用いて,BERTに基づくニューラル発話対ペアコヒーレンスモデルを訓練する。
最後に、このようなモデルを用いて発話間の話題関係を計測し、セグメンテーション推論の基盤として機能する。
- 参考スコア(独自算出の注目度): 8.31009800792799
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Dialogue topic segmentation is critical in several dialogue modeling
problems. However, popular unsupervised approaches only exploit surface
features in assessing topical coherence among utterances. In this work, we
address this limitation by leveraging supervisory signals from the
utterance-pair coherence scoring task. First, we present a simple yet effective
strategy to generate a training corpus for utterance-pair coherence scoring.
Then, we train a BERT-based neural utterance-pair coherence model with the
obtained training corpus. Finally, such model is used to measure the topical
relevance between utterances, acting as the basis of the segmentation
inference. Experiments on three public datasets in English and Chinese
demonstrate that our proposal outperforms the state-of-the-art baselines.
- Abstract(参考訳): 対話トピックセグメンテーションは、いくつかの対話モデリング問題において重要である。
しかし、一般的な教師なしアプローチは、発話間の話題のコヒーレンスを評価する際にのみ表面的特徴を利用する。
本研究は,発話対ペアのコヒーレンススコアリングタスクからの監視信号を活用することで,この制限に対処する。
まず,発話対ペアコヒーレンススコアのトレーニングコーパスを生成するための簡易かつ効果的な手法を提案する。
そして,得られた学習コーパスを用いて,BERTに基づくニューラル発話対ペアコヒーレンスモデルを訓練する。
最後に、このようなモデルを用いて発話間の話題関係を計測し、セグメンテーション推論の基盤として機能する。
英語と中国語の3つの公開データセットの実験では、私たちの提案は最先端のベースラインよりも優れています。
関連論文リスト
- Disco-Bench: A Discourse-Aware Evaluation Benchmark for Language
Modelling [70.23876429382969]
本研究では,多種多様なNLPタスクに対して,文内談話特性を評価できるベンチマークを提案する。
ディスコ・ベンチは文学領域における9つの文書レベルのテストセットから構成されており、豊富な談話現象を含んでいる。
また,言語分析のために,対象モデルが談話知識を学習するかどうかを検証できる診断テストスイートを設計する。
論文 参考訳(メタデータ) (2023-07-16T15:18:25Z) - Pre-training Multi-party Dialogue Models with Latent Discourse Inference [85.9683181507206]
我々は、多人数対話の会話構造、すなわち、各発話が応答する相手を理解するモデルを事前訓練する。
ラベル付きデータを完全に活用するために,談話構造を潜在変数として扱い,それらを共同で推論し,談話認識モデルを事前学習することを提案する。
論文 参考訳(メタデータ) (2023-05-24T14:06:27Z) - Unsupervised Dialogue Topic Segmentation with Topic-aware Utterance
Representation [51.22712675266523]
対話トピック(DTS)は、様々な対話モデリングタスクにおいて重要な役割を果たす。
本稿では,ラベルなし対話データからトピック対応発話表現を学習する,教師なしDSSフレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-04T11:35:23Z) - Improving Topic Segmentation by Injecting Discourse Dependencies [29.353285741379334]
本論文では, 談話依存構造を注入した談話認識型ニューラルトピックセグメンテーションモデルを提案する。
英語評価データセットに関する実証研究により,ニューラルネットワークのトピックセグメンタに上述の談話構造を注入することで,その性能が大幅に向上することが示された。
論文 参考訳(メタデータ) (2022-09-18T18:22:25Z) - Opponent Modeling in Negotiation Dialogues by Related Data Adaptation [20.505272677769355]
本稿では交渉対話から優先順位を識別するためのランク付け手法を提案する。
モデルは部分対話を入力として受け取り、相手の優先順位を予測する。
本稿では,2つの対話データセットに基づく広範囲な実験を通じて提案手法の有用性を示す。
論文 参考訳(メタデータ) (2022-04-30T21:11:41Z) - FlowEval: A Consensus-Based Dialogue Evaluation Framework Using Segment
Act Flows [63.116280145770006]
本稿では,音声レベルからセグメントレベルへのダイアログ行為の拡張であるセグメントアクトを提案し,大規模データセットをクラウドソースする。
セグメントアクトフローを利用するために,セグメントアクションのシーケンスを評価のために,最初のコンセンサスに基づく対話評価フレームワークであるFlowEvalを開発した。
論文 参考訳(メタデータ) (2022-02-14T11:37:20Z) - DialogueCSE: Dialogue-based Contrastive Learning of Sentence Embeddings [33.89889949577356]
本稿では,対話型コントラスト学習手法であるDialogueCSEを提案する。
我々は,Microsoft Dialogue Corpus,Jing Dong Dialogue Corpus,E-Commerce Dialogue Corpusの3つの多ターン対話データセットについて評価を行った。
論文 参考訳(メタデータ) (2021-09-26T13:25:41Z) - DialogBERT: Discourse-Aware Response Generation via Learning to Recover
and Rank Utterances [18.199473005335093]
本稿では,従来の PLM に基づく対話モデルを強化した対話応答生成モデルである DialogBERT を提案する。
発話間の談話レベルのコヒーレンスを効果的に把握するために,マスク付き発話回帰を含む2つの訓練目標を提案する。
3つのマルチターン会話データセットの実験により、我々のアプローチがベースラインを著しく上回ることを示した。
論文 参考訳(メタデータ) (2020-12-03T09:06:23Z) - Probing Task-Oriented Dialogue Representation from Language Models [106.02947285212132]
本稿では,タスク指向対話タスクにおいて,どのモデルが本質的に最も有意義な表現を担っているかを明らかにするために,事前学習された言語モデルについて検討する。
我々は、アノテートラベルを教師付き方法で固定された事前学習言語モデルの上に、分類器プローブとしてフィードフォワード層を微調整する。
論文 参考訳(メタデータ) (2020-10-26T21:34:39Z) - Modeling Topical Relevance for Multi-Turn Dialogue Generation [61.87165077442267]
マルチターン対話におけるトピックドリフト問題に対処する新しいモデルSTAR-BTMを提案する。
バイラルトピックモデルは、トレーニングデータセット全体に基づいて事前トレーニングされ、各コンテキストのトピック表現に基づいてトピックレベルの注意重みが計算される。
中国における顧客サービスデータと英語Ubuntuの対話データの両方の実験結果から、STAR-BTMは最先端の手法を著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2020-09-27T03:33:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。