論文の概要: PICK: Polished & Informed Candidate Scoring for Knowledge-Grounded
Dialogue Systems
- arxiv url: http://arxiv.org/abs/2309.10413v1
- Date: Tue, 19 Sep 2023 08:27:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-20 15:47:30.454096
- Title: PICK: Polished & Informed Candidate Scoring for Knowledge-Grounded
Dialogue Systems
- Title(参考訳): PICK:知識付き対話システムのための合成・インフォームド候補照合
- Authors: Bryan Wilie, Yan Xu, Willy Chung, Samuel Cahyawijaya, Holy Lovenia,
Pascale Fung
- Abstract要約: 現在の知識接地対話システムは、生成された応答を人間に好まれる品質に合わせるのに失敗することが多い。
我々は,世代別再描画フレームワークであるPolseed & Informed Candidate Scoring (PICK)を提案する。
対話履歴に関連性を維持しつつ,より忠実な応答を生成するためのPICKの有効性を示す。
- 参考スコア(独自算出の注目度): 59.1250765143521
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Grounding dialogue response generation on external knowledge is proposed to
produce informative and engaging responses. However, current knowledge-grounded
dialogue (KGD) systems often fail to align the generated responses with
human-preferred qualities due to several issues like hallucination and the lack
of coherence. Upon analyzing multiple language model generations, we observe
the presence of alternative generated responses within a single decoding
process. These alternative responses are more faithful and exhibit a comparable
or higher level of relevance to prior conversational turns compared to the
optimal responses prioritized by the decoding processes. To address these
challenges and driven by these observations, we propose Polished \& Informed
Candidate Scoring (PICK), a generation re-scoring framework that empowers
models to generate faithful and relevant responses without requiring additional
labeled data or model tuning. Through comprehensive automatic and human
evaluations, we demonstrate the effectiveness of PICK in generating responses
that are more faithful while keeping them relevant to the dialogue history.
Furthermore, PICK consistently improves the system's performance with both
oracle and retrieved knowledge in all decoding strategies. We provide the
detailed implementation in https://github.com/bryanwilie/pick .
- Abstract(参考訳): 外部知識に基づく対話応答生成法を提案する。
しかしながら、現在の知識基底対話(KGD)システムは、幻覚や一貫性の欠如といったいくつかの問題により、生成した応答と人間の優先的な品質を一致させることができないことが多い。
複数の言語モデル生成を解析すると、一つの復号プロセス内で、代替生成された応答の存在が観察される。
これらの代替応答はより忠実であり、復号プロセスによって優先順位付けされる最適な応答と比較して、以前の会話のターンと同等あるいは高いレベルの関係を示す。
これらの課題に対処し、これらの観測を駆使して、追加のラベル付きデータやモデルチューニングを必要とせずに、モデルに忠実で関連する応答を生成するための世代再描画フレームワークであるPolseed \& Informed Candidate Scoring (PICK)を提案する。
総合的な自動評価と人間評価を通じて,対話履歴に関連し,より忠実な応答を生成するための選択の有効性を実証する。
さらにpickは,oracleと取得したすべてのデコーディング戦略に関する知識によって,システムのパフォーマンスを一貫して向上させる。
詳細な実装はhttps://github.com/bryanwilie/pick で公開しています。
関連論文リスト
- UniMS-RAG: A Unified Multi-source Retrieval-Augmented Generation for Personalized Dialogue Systems [43.266153244137215]
大規模言語モデル(LLM)は多くの自然言語理解および生成タスクにおいて例外的な機能を示している。
我々は、パーソナライズされた応答を3つのサブタスク(知識ソース選択、知識検索、応答生成)に分解する。
統一多ソース検索拡張生成システム(UniMS-RAG)を提案する。
論文 参考訳(メタデータ) (2024-01-24T06:50:20Z) - FCC: Fusing Conversation History and Candidate Provenance for Contextual
Response Ranking in Dialogue Systems [53.89014188309486]
複数のチャネルからコンテキスト情報を統合できるフレキシブルなニューラルネットワークフレームワークを提案する。
会話応答ランキングタスクの評価に広く用いられているMSDialogデータセット上で,本モデルの評価を行った。
論文 参考訳(メタデータ) (2023-03-31T23:58:28Z) - Search-Engine-augmented Dialogue Response Generation with Cheaply
Supervised Query Production [98.98161995555485]
応答生成のために,任意の検索エンジンから膨大な動的情報にアクセス可能な対話モデルを提案する。
コアモジュールとして、クエリプロデューサを使用して、対話コンテキストからクエリを生成して、検索エンジンと対話する。
R@1とR@5のレートを62.4%と74.8%で達成できることを示す実験を行った。
論文 参考訳(メタデータ) (2023-02-16T01:58:10Z) - Reranking Overgenerated Responses for End-to-End Task-Oriented Dialogue
Systems [71.33737787564966]
エンド・ツー・エンド(E2E)タスク指向対話システム(ToD)は、いわゆる「いいね!
本稿では,システムによって当初過剰に生成された応答リストから高品質な項目を選択する方法を提案する。
本研究では,最先端のE2E ToDシステムを2.4BLEU,3.2ROUGE,2.8 METEORで改善し,新たなピーク値を得た。
論文 参考訳(メタデータ) (2022-11-07T15:59:49Z) - Achieving Conversational Goals with Unsupervised Post-hoc Knowledge
Injection [37.15893335147598]
現在のニューラルダイアログモデルの制限は、生成された応答における特異性と情報性の欠如に悩まされる傾向があることである。
本稿では,対話履歴と既存の対話モデルから初期応答の両方を条件とした,多様な知識スニペットの集合を検索する,ポストホックな知識注入手法を提案する。
我々は,各検索したスニペットを,勾配に基づく復号法を用いて初期応答に個別に注入し,教師なしランキングステップで最終応答を選択する複数の候補応答を構築する。
論文 参考訳(メタデータ) (2022-03-22T00:42:27Z) - WeaSuL: Weakly Supervised Dialogue Policy Learning: Reward Estimation
for Multi-turn Dialogue [17.663449579168297]
エージェントとユーザ(教師付き学習目標を持つエージェントに類似したモデル化)の対話をシミュレートし、相互に対話する。
エージェントは動的ブロッキングを使用して、ランク付けされた多様な応答と探索-探索を生成し、トップK応答の中から選択する。
2つのベンチマークによる実証研究は、我々のモデルが応答品質を著しく上回り、会話の成功につながることを示唆している。
論文 参考訳(メタデータ) (2021-08-01T08:00:45Z) - Improving Response Quality with Backward Reasoning in Open-domain
Dialogue Systems [53.160025961101354]
本稿では,バニラエンコーダデコーダトレーニングに後方推論ステップを追加することで,生成モデルを双方向にトレーニングすることを提案する。
提案する後方推論ステップは、モデルがより有益で一貫性のあるコンテンツを生成するように促す。
副次的な情報を導入することなく応答品質を向上させることができる。
論文 参考訳(メタデータ) (2021-04-30T20:38:27Z) - Learning an Effective Context-Response Matching Model with
Self-Supervised Tasks for Retrieval-based Dialogues [88.73739515457116]
我々は,次のセッション予測,発話復元,不整合検出,一貫性判定を含む4つの自己教師型タスクを導入する。
我々はPLMに基づく応答選択モデルとこれらの補助タスクをマルチタスク方式で共同で訓練する。
実験結果から,提案した補助的自己教師型タスクは,多ターン応答選択において大きな改善をもたらすことが示された。
論文 参考訳(メタデータ) (2020-09-14T08:44:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。