論文の概要: Generate, Evaluate, and Select: A Dialogue System with a Response
Evaluator for Diversity-Aware Response Generation
- arxiv url: http://arxiv.org/abs/2206.04937v1
- Date: Fri, 10 Jun 2022 08:22:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-13 23:28:41.081201
- Title: Generate, Evaluate, and Select: A Dialogue System with a Response
Evaluator for Diversity-Aware Response Generation
- Title(参考訳): 多様性認識応答生成のための応答評価器を用いた対話システムの作成・評価・選択
- Authors: Ryoma Sakaeda, Daisuke Kawahara
- Abstract要約: 現在の対話システムにおける多様性の欠如を克服することを目的としている。
本稿では,応答生成器が生成する複数の応答を評価するジェネレータ・評価器モデルを提案する。
我々は,提案システムとベースラインシステムの出力を比較するために人的評価を行う。
- 参考スコア(独自算出の注目度): 9.247397520986999
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We aim to overcome the lack of diversity in responses of current dialogue
systems and to develop a dialogue system that is engaging as a conversational
partner. We propose a generator-evaluator model that evaluates multiple
responses generated by a response generator and selects the best response by an
evaluator. By generating multiple responses, we obtain diverse responses. We
conduct human evaluations to compare the output of the proposed system with
that of a baseline system. The results of the human evaluations showed that the
proposed system's responses were often judged to be better than the baseline
system's, and indicated the effectiveness of the proposed method.
- Abstract(参考訳): 我々は,現在の対話システムにおける多様性の欠如を克服し,対話相手として係わる対話システムを開発することを目的としている。
本稿では,応答生成器が生成した複数の応答を評価し,評価器が最適な応答を選択するジェネレータ評価モデルを提案する。
複数の応答を生成して、多様な応答を得る。
提案システムの出力とベースラインシステムの出力を比較するために,人間による評価を行う。
評価の結果,提案システムの応答はベースラインシステムよりも優れていると判断されることが多く,提案手法の有効性が示された。
関連論文リスト
- PICK: Polished & Informed Candidate Scoring for Knowledge-Grounded
Dialogue Systems [59.1250765143521]
現在の知識接地対話システムは、生成された応答を人間に好まれる品質に合わせるのに失敗することが多い。
我々は,世代別再描画フレームワークであるPolseed & Informed Candidate Scoring (PICK)を提案する。
対話履歴に関連性を維持しつつ,より忠実な応答を生成するためのPICKの有効性を示す。
論文 参考訳(メタデータ) (2023-09-19T08:27:09Z) - EM Pre-training for Multi-party Dialogue Response Generation [86.25289241604199]
多人数対話では、応答発話の宛先を生成前に指定する必要がある。
本稿では,アドレナラベルを生成するための期待ステップを反復的に実行する期待最大化(EM)アプローチを提案する。
論文 参考訳(メタデータ) (2023-05-21T09:22:41Z) - Reranking Overgenerated Responses for End-to-End Task-Oriented Dialogue
Systems [71.33737787564966]
エンド・ツー・エンド(E2E)タスク指向対話システム(ToD)は、いわゆる「いいね!
本稿では,システムによって当初過剰に生成された応答リストから高品質な項目を選択する方法を提案する。
本研究では,最先端のE2E ToDシステムを2.4BLEU,3.2ROUGE,2.8 METEORで改善し,新たなピーク値を得た。
論文 参考訳(メタデータ) (2022-11-07T15:59:49Z) - Measuring and Improving Semantic Diversity of Dialogue Generation [21.59385143783728]
生成した応答のセマンティックな多様性を測定するための新しい自動評価指標を提案する。
提案手法は,既存の語彙レベルの多様性指標よりも,応答の多様性に関する人間の判断をよりよく捉えていることを示す。
また、生成した応答のセマンティックな多様性を改善するための、シンプルで効果的な学習方法を提案する。
論文 参考訳(メタデータ) (2022-10-11T18:36:54Z) - Assessing Dialogue Systems with Distribution Distances [48.61159795472962]
そこで本研究では,対話と実世界の会話の分散的距離を計算し,対話システムの性能を計測する。
複数の対話コーパスを用いた実験により,提案手法は既存の指標よりも人間の判断によく相関することが示された。
論文 参考訳(メタデータ) (2021-05-06T10:30:13Z) - Is Your Goal-Oriented Dialog Model Performing Really Well? Empirical
Analysis of System-wise Evaluation [114.48767388174218]
本稿では,異なる設定の異なるモジュールから構成される異なるダイアログシステムについて,実験的検討を行った。
この結果から, 粗粒度ラベルで学習した連系や終端モデルを用いたシステムよりも, 細粒度監視信号を用いて訓練したパイプラインダイアログシステムの方が, 高い性能が得られることが示唆された。
論文 参考訳(メタデータ) (2020-05-15T05:20:06Z) - Weakly-Supervised Neural Response Selection from an Ensemble of
Task-Specialised Dialogue Agents [11.21333474984984]
異種対話エージェントが生成する応答の集合から最適な応答を選択するという問題をモデル化する。
提案手法は,カリキュラム学習機構を用いて,一対一の会話における一貫性のある応答のセットを予測することを訓練する。
論文 参考訳(メタデータ) (2020-05-06T18:40:26Z) - Evaluating Dialogue Generation Systems via Response Selection [42.56640173047927]
提案手法では, 提案手法を用いて, 提案手法を検証し, 提案手法を提案する。
本研究では,本手法によって開発されたテストセットによる応答選択によるシステム評価が,人間による評価と強く相関していることを示す。
論文 参考訳(メタデータ) (2020-04-29T16:21:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。