論文の概要: Diversifying Dialogue Generation with Non-Conversational Text
- arxiv url: http://arxiv.org/abs/2005.04346v2
- Date: Wed, 13 May 2020 08:11:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-05 06:50:52.607687
- Title: Diversifying Dialogue Generation with Non-Conversational Text
- Title(参考訳): 非会話テキストによる多変量対話生成
- Authors: Hui Su, Xiaoyu Shen, Sanqiang Zhao, Xiao Zhou, Pengwei Hu, Randy
Zhong, Cheng Niu and Jie Zhou
- Abstract要約: 非会話的テキストを活用することで対話生成を多様化する新しい視点を提案する。
我々は、フォーラムコメント、イディオム、本スニペットを含む複数の情報源から、大規模な非会話コーパスを収集する。
得られたモデルは、2つの会話データセット上でテストされ、コンテキストとの関連性を犠牲にすることなく、はるかに多様な応答を生成することが示されている。
- 参考スコア(独自算出の注目度): 38.03510529185192
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Neural network-based sequence-to-sequence (seq2seq) models strongly suffer
from the low-diversity problem when it comes to open-domain dialogue
generation. As bland and generic utterances usually dominate the frequency
distribution in our daily chitchat, avoiding them to generate more interesting
responses requires complex data filtering, sampling techniques or modifying the
training objective. In this paper, we propose a new perspective to diversify
dialogue generation by leveraging non-conversational text. Compared with
bilateral conversations, non-conversational text are easier to obtain, more
diverse and cover a much broader range of topics. We collect a large-scale
non-conversational corpus from multi sources including forum comments, idioms
and book snippets. We further present a training paradigm to effectively
incorporate these text via iterative back translation. The resulting model is
tested on two conversational datasets and is shown to produce significantly
more diverse responses without sacrificing the relevance with context.
- Abstract(参考訳): seq2seq(neural network-based sequence-to-sequence)モデルは、オープンドメインの対話生成に関して、低多様性の問題に強く苦しむ。
blandとgeneric utterancesは通常、日々のchitchatの頻度分布を支配しているため、より興味深いレスポンスを生成するのを避けるには、複雑なデータフィルタリング、サンプリングテクニック、トレーニング目的の変更が必要です。
本稿では,非会話テキストを活用した対話生成の多様化のための新しい視点を提案する。
双方向の会話と比較して、非会話テキストはより入手しやすく、より多様性があり、より幅広い話題をカバーする。
フォーラムコメントやイディオム,書籍スニペットなど,複数のソースから大規模な非会話コーパスを収集する。
さらに,これらのテキストを反復的な逆変換によって効果的に組み込むための学習パラダイムを提案する。
得られたモデルは2つの会話型データセット上でテストされ、コンテキストとの関連性を犠牲にすることなく、はるかに多様な応答を生成することが示される。
関連論文リスト
- Multi-party Response Generation with Relation Disentanglement [8.478506896774137]
既存のニューラルレスポンス生成モデルは、双方向の会話で大幅に改善されている。
しかし、現実世界の対話の多くは複数の対話者を含み、会話の文脈の構造はより複雑である。
本研究では,人間ラベルを使わずに,会話の文脈内での微妙な手がかりに基づいて関係性を推論する手法を提案する。
論文 参考訳(メタデータ) (2024-03-16T06:33:44Z) - Multi-turn Dialogue Comprehension from a Topic-aware Perspective [70.37126956655985]
本稿では,話題認識の観点から,マルチターン対話をモデル化することを提案する。
対話文のセグメント化アルゴリズムを用いて、対話文を教師なしの方法でトピック集中フラグメントに分割する。
また,トピックセグメントを処理要素として扱う新しいモデルとして,トピック認識デュアルアテンションマッチング(TADAM)ネットワークを提案する。
論文 参考訳(メタデータ) (2023-09-18T11:03:55Z) - X-ReCoSa: Multi-Scale Context Aggregation For Multi-Turn Dialogue
Generation [0.0]
マルチターン対話生成では、応答は文脈の話題や背景だけでなく、文脈の文中の単語やフレーズにも関係している。
現在広く使われている階層型ダイアログモデルは、単語レベルのエンコーダから出力される文表現を無視して、発話レベルのエンコーダからの文脈表現のみに依存している。
本稿では,階層型ダイアログモデルのためのマルチスケールコンテキスト情報を集約する,新しいダイアログモデルX-ReCoSaを提案する。
論文 参考訳(メタデータ) (2023-03-14T12:15:52Z) - Counterfactual Data Augmentation via Perspective Transition for
Open-Domain Dialogues [34.78482218571574]
本稿では,異なるセマンティクスによる高品質な応答を自動的に拡張するデータ拡張手法を提案する。
実験結果から,データ拡張手法は対話履歴の異なるセマンティクスで高品質な応答を増強し,複数の下流タスクにおいて競合的ベースラインを上回り得ることが示された。
論文 参考訳(メタデータ) (2022-10-30T13:26:49Z) - Dialogue History Matters! Personalized Response Selectionin Multi-turn
Retrieval-based Chatbots [62.295373408415365]
本稿では,コンテキスト応答マッチングのためのパーソナライズドハイブリッドマッチングネットワーク(phmn)を提案する。
1) ユーザ固有の対話履歴からパーソナライズされた発話行動を付加的なマッチング情報として抽出する。
ユーザ識別による2つの大規模データセット,すなわちパーソナライズされた対話 Corpus Ubuntu (P-Ubuntu) とパーソナライズされたWeiboデータセット (P-Weibo) のモデルを評価する。
論文 参考訳(メタデータ) (2021-03-17T09:42:11Z) - MultiTalk: A Highly-Branching Dialog Testbed for Diverse Conversations [39.81965687032923]
会話対話文のコーパスであるMultiTalkデータセットについて述べる。
高分岐環境におけるダイアログ生成の研究に複数の貢献をしている。
我々の達成課題は心の問題の挑戦的理論であり、制御可能な生成課題である。
論文 参考訳(メタデータ) (2021-02-02T02:29:40Z) - Reasoning in Dialog: Improving Response Generation by Context Reading
Comprehension [49.92173751203827]
マルチターンダイアログでは、発話が文の完全な形を取るとは限らない。
読み解きの質問に答えるモデルの能力を検討し、応答生成性能の向上を提案する。
論文 参考訳(メタデータ) (2020-12-14T10:58:01Z) - Multi-View Sequence-to-Sequence Models with Conversational Structure for
Abstractive Dialogue Summarization [72.54873655114844]
テキスト要約は、NLPにおいて最も困難で興味深い問題の1つである。
本研究では、まず、異なる視点から構造化されていない日々のチャットの会話構造を抽出し、会話を表現するマルチビューシーケンス・ツー・シーケンスモデルを提案する。
大規模対話要約コーパスの実験により,本手法は,自動評価と人的判断の両面から,従来の最先端モデルよりも有意に優れた性能を示した。
論文 参考訳(メタデータ) (2020-10-04T20:12:44Z) - Generating Dialogue Responses from a Semantic Latent Space [75.18449428414736]
語彙のエンドツーエンド分類に代わる方法を提案する。
潜在空間上の回帰タスクとして,プロンプトと応答のペア関係を学習する。
人間の評価は、連続した空間でタスクを学習すると、関連性と情報性の両方を持つ応答が生成されることを示した。
論文 参考訳(メタデータ) (2020-10-04T19:06:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。