論文の概要: SMRT Chatbots: Improving Non-Task-Oriented Dialog with Simulated
Multiple Reference Training
- arxiv url: http://arxiv.org/abs/2011.00547v1
- Date: Sun, 1 Nov 2020 16:11:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-30 23:19:40.865562
- Title: SMRT Chatbots: Improving Non-Task-Oriented Dialog with Simulated
Multiple Reference Training
- Title(参考訳): smrtチャットボット:マルチリファレンストレーニングによる非タスク指向ダイアログの改善
- Authors: Huda Khayrallah, Jo\~ao Sedoc
- Abstract要約: 非タスク指向ダイアログモデルは、品質の低下と非多様性の応答に悩まされる。
限られた会話データを克服するために、シミュレートされた多重参照訓練を適用する。
SMRTは,人間と自動品質スコアと語彙の多様性によって,強力なトランスフォーマーベースラインよりも改善されている。
- 参考スコア(独自算出の注目度): 4.862484260682186
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Non-task-oriented dialog models suffer from poor quality and non-diverse
responses. To overcome limited conversational data, we apply Simulated Multiple
Reference Training (SMRT; Khayrallah et al., 2020), and use a paraphraser to
simulate multiple responses per training prompt. We find SMRT improves over a
strong Transformer baseline as measured by human and automatic quality scores
and lexical diversity. We also find SMRT is comparable to pretraining in human
evaluation quality, and outperforms pretraining on automatic quality and
lexical diversity, without requiring related-domain dialog data.
- Abstract(参考訳): 非タスク指向のダイアログモデルは品質の低下と非分散応答に苦しむ。
限られた会話データに対処するため,Simulated Multiple Reference Training (SMRT; Khayrallah et al., 2020) を適用し,パラフレーズを用いてトレーニングプロンプト毎に複数の応答をシミュレートする。
SMRTは,人間と自動品質スコアと語彙の多様性によって,強力なトランスフォーマーベースラインよりも改善されている。
また、SMRTは人間の評価品質の事前訓練に匹敵し、関連ドメインのダイアログデータを必要としない自動品質と語彙の多様性の事前訓練に優れていた。
関連論文リスト
- Self-Directed Turing Test for Large Language Models [56.64615470513102]
チューリングテストは、自然言語の会話においてAIが人間のような振る舞いを示すことができるかどうかを調べる。
従来のチューリングテストでは、各参加者が1回に1つのメッセージだけを送信する厳格な対話形式を採用している。
本稿では,バーストダイアログ形式を用いた自己指示チューリングテストを提案する。
論文 参考訳(メタデータ) (2024-08-19T09:57:28Z) - UniPCM: Universal Pre-trained Conversation Model with Task-aware
Automatic Prompt [44.835294340615654]
本稿では,タスクベースの自動プロンプト生成(TAP)を用いて,高品質なプロンプトの自動生成を提案する。
事前学習した会話モデルのコーパスを15の対話関連タスクから122のデータセットに拡張する。
TAPがクラウドソーシングで集めたものと同等のプロンプトを生成できるのは驚きです。
論文 参考訳(メタデータ) (2023-09-20T05:05:40Z) - Stabilized In-Context Learning with Pre-trained Language Models for Few
Shot Dialogue State Tracking [57.92608483099916]
大規模事前学習言語モデル(PLM)は、多くのNLPタスクにまたがる優れた性能を示している。
対話状態追跡(DST)のようなより複雑なタスクでは、望ましい意図を確実に伝達するプロンプトを設計するのは簡単ではない。
対話文の長さを制限するためのサリエンシモデルを導入し、クエリ毎に多くの例を含めることができます。
論文 参考訳(メタデータ) (2023-02-12T15:05:10Z) - GODEL: Large-Scale Pre-Training for Goal-Directed Dialog [119.1397031992088]
ダイアログのための大規模事前学習言語モデルであるGODELを紹介する。
GODELは、数ショットの微調整設定で、最先端の事前訓練ダイアログモデルより優れていることを示す。
評価手法の新たな特徴は,応答の有用性を評価するユーティリティの概念の導入である。
論文 参考訳(メタデータ) (2022-06-22T18:19:32Z) - What is wrong with you?: Leveraging User Sentiment for Automatic Dialog
Evaluation [73.03318027164605]
本稿では,次のユーザの発話から自動的に抽出できる情報をプロキシとして利用して,前のシステム応答の質を測定することを提案する。
本モデルは,実際のユーザおよび有償ユーザから収集した音声と書面の両方のオープンドメインダイアログコーパスを一般化する。
論文 参考訳(メタデータ) (2022-03-25T22:09:52Z) - Towards Robust Online Dialogue Response Generation [62.99904593650087]
これは、トレーニングと実世界のテストの相違によって引き起こされる可能性がある、と私たちは主張する。
本稿では, 発話レベルサンプリングと半発話レベルサンプリングの両方からなる階層的サンプリング手法を提案する。
論文 参考訳(メタデータ) (2022-03-07T06:51:41Z) - WeaSuL: Weakly Supervised Dialogue Policy Learning: Reward Estimation
for Multi-turn Dialogue [17.663449579168297]
エージェントとユーザ(教師付き学習目標を持つエージェントに類似したモデル化)の対話をシミュレートし、相互に対話する。
エージェントは動的ブロッキングを使用して、ランク付けされた多様な応答と探索-探索を生成し、トップK応答の中から選択する。
2つのベンチマークによる実証研究は、我々のモデルが応答品質を著しく上回り、会話の成功につながることを示唆している。
論文 参考訳(メタデータ) (2021-08-01T08:00:45Z) - Automatic Curriculum Learning With Over-repetition Penalty for Dialogue
Policy Learning [8.744026064255337]
ACL-DQN(Automatic Curriculum Learning-based Deep Q-Network)という新しいフレームワークを提案し,自動カリキュラム学習のための対話方針を実現する。
教師モデルは、有意義な順序のカリキュラムを配置し、対話エージェントの学習進捗を監視して自動的に調整する。
実験により,ACL-DQNは,統計的に有意なマージンを有する対話タスクの有効性と安定性を著しく向上することが示された。
論文 参考訳(メタデータ) (2020-12-28T02:44:49Z) - Learning an Unreferenced Metric for Online Dialogue Evaluation [53.38078951628143]
本稿では,大規模な事前学習言語モデルを用いて発話の潜在表現を抽出する非参照自動評価指標を提案する。
提案手法は,オンライン環境でのアノテーションと高い相関性を実現すると同時に,推論時に比較に真の応答を必要としないことを示す。
論文 参考訳(メタデータ) (2020-05-01T20:01:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。