論文の概要: Unsupervised Contextual Paraphrase Generation using Lexical Control and
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2103.12777v1
- Date: Tue, 23 Mar 2021 18:22:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-25 14:14:52.861928
- Title: Unsupervised Contextual Paraphrase Generation using Lexical Control and
Reinforcement Learning
- Title(参考訳): 語彙制御と強化学習を用いた教師なし文脈パラフレーズ生成
- Authors: Sonal Garg, Sumanth Prabhu, Hemant Misra, and G. Srinivasaraghavan
- Abstract要約: 自己回帰モデルを用いた文脈パラフレーズ生成のための教師なしフレームワークを提案する。
また, 意味的類似性, テクスト的含意, 表現の多様性, フラレンシに基づく自動測定法を提案し, 文脈的パラフレーズの質を評価する。
- 参考スコア(独自算出の注目度): 3.2811284938530636
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Customer support via chat requires agents to resolve customer queries with
minimum wait time and maximum customer satisfaction. Given that the agents as
well as the customers can have varying levels of literacy, the overall quality
of responses provided by the agents tend to be poor if they are not predefined.
But using only static responses can lead to customer detraction as the
customers tend to feel that they are no longer interacting with a human. Hence,
it is vital to have variations of the static responses to reduce monotonicity
of the responses. However, maintaining a list of such variations can be
expensive. Given the conversation context and the agent response, we propose an
unsupervised frame-work to generate contextual paraphrases using autoregressive
models. We also propose an automated metric based on Semantic Similarity,
Textual Entailment, Expression Diversity and Fluency to evaluate the quality of
contextual paraphrases and demonstrate performance improvement with
Reinforcement Learning (RL) fine-tuning using the automated metric as the
reward function.
- Abstract(参考訳): チャットによるカスタマーサポートには、最低待ち時間と顧客満足度で顧客クエリを解決する必要がある。
エージェントと顧客の両方がさまざまなレベルのリテラシーを持つことができるため、エージェントが提供した反応の質は、事前に定義されていないと貧弱になる傾向がある。
しかし、静的レスポンスのみを使用すると、顧客はもはや人間と対話していないと感じやすいため、顧客の減退につながる可能性がある。
したがって、応答の単調さを減らすために静的応答のバリエーションを持つことが不可欠である。
しかし、そのようなバリエーションのリストを維持することはコストがかかる。
会話コンテキストとエージェント応答を考慮し,自己回帰モデルを用いて文脈パラフレーズを生成するための教師なしフレームワークを提案する。
また,文脈パラフレーズの質を評価するために,意味的類似性,テキスト的包含性,表現の多様性,フラレンシに基づく自動計測法を提案し,自動計測を報酬関数として用いた強化学習(rl)による性能改善を実証する。
関連論文リスト
- RSVP: Customer Intent Detection via Agent Response Contrastive and
Generative Pre-Training [16.183398769581075]
RSVPはタスク指向の対話に特化した自己教師型フレームワークである。
エージェント応答を2段階的に事前訓練する。
実世界の2つのカスタマーサービスデータセットのベンチマーク結果は、RSVPが最先端のベースラインを大幅に上回っていることを示している。
論文 参考訳(メタデータ) (2023-10-15T08:21:38Z) - Leveraging Implicit Feedback from Deployment Data in Dialogue [83.02878726357523]
本研究では,ユーザ間の自然な対話とデプロイモデルから学習することで,社会的会話エージェントの改善について検討する。
我々は、ユーザ応答長、感情、未来の人間の発話の反応などの信号を、収集された対話エピソードで活用する。
論文 参考訳(メタデータ) (2023-07-26T11:34:53Z) - Controllable Mixed-Initiative Dialogue Generation through Prompting [50.03458333265885]
混合開始対話タスクには、情報の繰り返し交換と会話制御が含まれる。
エージェントは、ポリシープランナーが定める特定の対話意図や戦略に従う応答を生成することにより、コントロールを得る。
標準的なアプローチは、これらの意図に基づいて生成条件を実行するために、訓練済みの言語モデルを微調整している。
代わりに、条件生成の微調整に代えて、大きな言語モデルをドロップインで置き換えるように促します。
論文 参考訳(メタデータ) (2023-05-06T23:11:25Z) - WeaSuL: Weakly Supervised Dialogue Policy Learning: Reward Estimation
for Multi-turn Dialogue [17.663449579168297]
エージェントとユーザ(教師付き学習目標を持つエージェントに類似したモデル化)の対話をシミュレートし、相互に対話する。
エージェントは動的ブロッキングを使用して、ランク付けされた多様な応答と探索-探索を生成し、トップK応答の中から選択する。
2つのベンチマークによる実証研究は、我々のモデルが応答品質を著しく上回り、会話の成功につながることを示唆している。
論文 参考訳(メタデータ) (2021-08-01T08:00:45Z) - Evaluating Empathetic Chatbots in Customer Service Settings [6.523873187705393]
顧客からの質問に応答する混合スキルチャットボットモデルは、感情を認識し、適切な共感を示すように訓練された場合、実際のエージェント応答によく似ている。
分析には、20の有名なブランドから顧客サービスコンテキストで数百万の顧客->エージェントダイアログの例を含むTwitterのカスタマーサービスデータセットを活用します。
論文 参考訳(メタデータ) (2021-01-05T03:34:35Z) - Turn-level Dialog Evaluation with Dialog-level Weak Signals for
Bot-Human Hybrid Customer Service Systems [0.0]
インタラクションの間いつでも、顧客サービスコンタクトにおける成功や価値の複数の側面を定量化する機械学習アプローチを開発しました。
いくつかのアプリケーションにおいて、Amazonのカスタマーサービス品質がどのように改善されているかを示します。
論文 参考訳(メタデータ) (2020-10-25T19:36:23Z) - How To Evaluate Your Dialogue System: Probe Tasks as an Alternative for
Token-level Evaluation Metrics [47.20761880464552]
生成的対話モデリングは言語モデリングタスクとして広く見なされている。
このタスクは、エージェントが入力テキストを複雑な自然言語で理解し、ユーザと意味のある対話を行うように要求する。
使用される自動メトリクスは、生成されたテキストの品質を、エージェントの全体的相互作用のプロキシとして評価する。
論文 参考訳(メタデータ) (2020-08-24T13:28:35Z) - A Controllable Model of Grounded Response Generation [122.7121624884747]
現在のエンドツーエンドのニューラルネットワークモデルは、応答生成プロセスにセマンティックコントロールを課す柔軟性を本質的に欠いている。
我々は制御可能な接地応答生成(CGRG)と呼ばれるフレームワークを提案する。
このフレームワークを用いることで、会話のようなRedditデータセットでトレーニングされた、新しいインダクティブアテンション機構を備えたトランスフォーマーベースのモデルが、強力な生成ベースラインを上回っていることを示す。
論文 参考訳(メタデータ) (2020-05-01T21:22:08Z) - Learning an Unreferenced Metric for Online Dialogue Evaluation [53.38078951628143]
本稿では,大規模な事前学習言語モデルを用いて発話の潜在表現を抽出する非参照自動評価指標を提案する。
提案手法は,オンライン環境でのアノテーションと高い相関性を実現すると同時に,推論時に比較に真の応答を必要としないことを示す。
論文 参考訳(メタデータ) (2020-05-01T20:01:39Z) - Improving Factual Consistency Between a Response and Persona Facts [64.30785349238619]
応答生成のためのニューラルネットワークは、意味論的に妥当であるが、必ずしも話者のペルソナを記述する事実と矛盾しない応答を生成する。
我々は,これらのモデルを強化学習により微調整し,応答とペルソナ事実の一貫性と意味的妥当性を明確に把握する効率的な報酬関数を提案する。
論文 参考訳(メタデータ) (2020-04-30T18:08:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。