論文の概要: Stylistic Retrieval-based Dialogue System with Unparallel Training Data
- arxiv url: http://arxiv.org/abs/2109.05477v1
- Date: Sun, 12 Sep 2021 09:56:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-16 13:51:17.650754
- Title: Stylistic Retrieval-based Dialogue System with Unparallel Training Data
- Title(参考訳): 非並列訓練データを用いたスタイリスティック検索に基づく対話システム
- Authors: Hao Fu, Yan Wang, Ruihua Song, Tianran Hu, Jianyun Nie
- Abstract要約: 本稿では,並列データを持たない特定のペルソナの言語スタイルを模倣するために,汎用的な検索ベース対話システムに適応するフレキシブルなフレームワークを提案する。
提案手法は, ジェルゴンの使用法を学習し, ジェルゴンを組み込むことで, ジェネリックな会話をスタイル化されたものに書き換えることによって, スタイル化されたデータの自動生成に基づく。
- 参考スコア(独自算出の注目度): 19.777894827625275
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The ability of a dialog system to express consistent language style during
conversations has a direct, positive impact on its usability and on user
satisfaction. Although previous studies have demonstrated that style transfer
is feasible with a large amount of parallel data, it is often impossible to
collect such data for different styles. In this paper, instead of manually
constructing conversation data with a certain style, we propose a flexible
framework that adapts a generic retrieval-based dialogue system to mimic the
language style of a specified persona without any parallel data. Our approach
is based on automatic generation of stylized data by learning the usage of
jargon, and then rewriting the generic conversations to a stylized one by
incorporating the jargon. In experiments we implemented dialogue systems with
five distinct language styles, and the result shows our framework significantly
outperforms baselines in terms of the average score of responses' relevance and
style degree, and content diversity. A/B testing on a commercial chatbot shows
that users are more satisfied with our system. This study demonstrates the
feasibility of building stylistic dialogue systems by simple data augmentation.
- Abstract(参考訳): 会話中に一貫した言語スタイルを表現するダイアログシステムの能力は、ユーザビリティとユーザの満足度に直接的なポジティブな影響を与える。
従来の研究では、大量の並列データでスタイル転送が可能であることが示されているが、異なるスタイルでそのようなデータを収集することはしばしば不可能である。
本稿では,あるスタイルで会話データを手作業で構築する代わりに,並列データなしで特定の人物の言語スタイルを模倣するために汎用検索ベースの対話システムを適用する柔軟な枠組みを提案する。
このアプローチは、jargonの使用法を学習してスタイリッシュなデータを自動的に生成し、jargonを組み込むことで汎用的な会話をスタイリッシュなデータに書き換える手法である。
実験では,5つの異なる言語スタイルの対話システムを実装した。その結果,反応の関連性,スタイルの程度,内容の多様性の平均スコアにおいて,我々のフレームワークは,ベースラインよりも有意に優れていた。
商用チャットボットでのa/bテストは、ユーザーが我々のシステムに満足していることを示している。
本研究では,単純なデータ拡張によるスタイリスティック対話システムの実現可能性を示す。
関連論文リスト
- Conversation Style Transfer using Few-Shot Learning [56.43383396058639]
本稿では,会話スタイルの伝達を数ショットの学習問題として紹介する。
そこで本研究では,スタイルフリー対話による課題をピボットとして解くための,コンテキスト内学習手法を提案する。
会話スタイルの転送は下流のタスクにも役立ちます。
論文 参考訳(メタデータ) (2023-02-16T15:27:00Z) - Mitigating Negative Style Transfer in Hybrid Dialogue System [42.65754135759929]
ユーザ固有の目標を達成し,ユーザとのオープン・トピック・チャットに参加するハイブリッド対話システムに注目が集まっている。
既存の研究は、マルチタスク融合技術を利用して両方のタスクを同時に学習するが、ユニークなテキストスタイルの違いによって引き起こされる負の伝達現象を無視する。
多様なデータセットに対する教師付き自己監督型正負のサンプル構成を考案する。
論文 参考訳(メタデータ) (2022-12-14T12:13:34Z) - Controllable Dialogue Simulation with In-Context Learning [39.04491297557292]
textscDialogicは、大規模言語モデルに基づく対話シミュレーション手法である。
本手法は,人間の関与を最小あるいはゼロに抑えながら,少数の対話データを迅速に拡張することができる。
我々のシミュレートされた対話は、ほぼ人間に近い流速とアノテーションの精度を持つ。
論文 参考訳(メタデータ) (2022-10-09T06:32:58Z) - Building a Role Specified Open-Domain Dialogue System Leveraging
Large-Scale Language Models [15.062014096238803]
本研究では,オープンドメイン対話システムにおける役割を示唆する課題について検討する。
スクラッチからロール充足型対話データセットを構築するための効率的なデータ収集フレームワークを提案する。
当社のモデルでは,一般的なメトリクス上での競合的なパフォーマンスを維持しながら,アウトオブバウンド(out-of-bound)な発話をほとんど返さない。
論文 参考訳(メタデータ) (2022-04-30T06:23:06Z) - HybriDialogue: An Information-Seeking Dialogue Dataset Grounded on
Tabular and Textual Data [87.67278915655712]
我々は、ウィキペディアのテキストとテーブルの両方を基盤とした、クラウドソーシングされた自然な会話からなる新しい対話データセットHybriDialogueを提示する。
これらの会話は、複雑なマルチホップ質問をシンプルで現実的なマルチターン対話に分解することで生成される。
論文 参考訳(メタデータ) (2022-04-28T00:52:16Z) - Dialogue History Matters! Personalized Response Selectionin Multi-turn
Retrieval-based Chatbots [62.295373408415365]
本稿では,コンテキスト応答マッチングのためのパーソナライズドハイブリッドマッチングネットワーク(phmn)を提案する。
1) ユーザ固有の対話履歴からパーソナライズされた発話行動を付加的なマッチング情報として抽出する。
ユーザ識別による2つの大規模データセット,すなわちパーソナライズされた対話 Corpus Ubuntu (P-Ubuntu) とパーソナライズされたWeiboデータセット (P-Weibo) のモデルを評価する。
論文 参考訳(メタデータ) (2021-03-17T09:42:11Z) - Stylized Dialogue Response Generation Using Stylized Unpaired Texts [63.69880979112312]
本稿では,文中に埋め込まれた文体の特徴を抽出する文体化対話生成手法を提案する。
提案手法は,与えられたコンテキストに忠実で,対象のスタイルに適合する対話応答を生成できる。
論文 参考訳(メタデータ) (2020-09-27T01:04:06Z) - Ranking Enhanced Dialogue Generation [77.8321855074999]
対話履歴を効果的に活用する方法は、マルチターン対話生成において重要な問題である。
これまでの研究は通常、歴史をモデル化するために様々なニューラルネットワークアーキテクチャを使用していた。
本稿では,ランキング拡張対話生成フレームワークを提案する。
論文 参考訳(メタデータ) (2020-08-13T01:49:56Z) - Prototype-to-Style: Dialogue Generation with Style-Aware Editing on
Retrieval Memory [65.98002918470543]
文体対話生成の課題に対処する新しいプロトタイプ・ツー・スタイルのフレームワークを提案する。
このフレームワークは、IR(Information Retrieval)システムを使用して、検索した応答から応答プロトタイプを抽出する。
スタイリスティック応答生成器は、プロトタイプと所望の言語スタイルをモデル入力として、高品質でスタイリスティックな応答を得る。
論文 参考訳(メタデータ) (2020-04-05T14:36:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。