論文の概要: Improving Conversational Question Answering Systems after Deployment
using Feedback-Weighted Learning
- arxiv url: http://arxiv.org/abs/2011.00615v1
- Date: Sun, 1 Nov 2020 19:50:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-30 23:30:39.307001
- Title: Improving Conversational Question Answering Systems after Deployment
using Feedback-Weighted Learning
- Title(参考訳): フィードバック重み学習を用いた展開後の会話質問応答システムの改善
- Authors: Jon Ander Campos, Kyunghyun Cho, Arantxa Otegi, Aitor Soroa, Gorka
Azkune, Eneko Agirre
- Abstract要約: 本稿では,二元的ユーザフィードバックを用いた初期教師付きシステムを改善するために,重要サンプリングに基づくフィードバック重み付き学習を提案する。
当社の作業は,実際のユーザとのインタラクションを活用し,デプロイ後の会話システムを改善する可能性を開くものだ。
- 参考スコア(独自算出の注目度): 69.42679922160684
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The interaction of conversational systems with users poses an exciting
opportunity for improving them after deployment, but little evidence has been
provided of its feasibility. In most applications, users are not able to
provide the correct answer to the system, but they are able to provide binary
(correct, incorrect) feedback. In this paper we propose feedback-weighted
learning based on importance sampling to improve upon an initial supervised
system using binary user feedback. We perform simulated experiments on document
classification (for development) and Conversational Question Answering datasets
like QuAC and DoQA, where binary user feedback is derived from gold
annotations. The results show that our method is able to improve over the
initial supervised system, getting close to a fully-supervised system that has
access to the same labeled examples in in-domain experiments (QuAC), and even
matching in out-of-domain experiments (DoQA). Our work opens the prospect to
exploit interactions with real users and improve conversational systems after
deployment.
- Abstract(参考訳): ユーザとの会話システムとのインタラクションは、デプロイ後にそれらを改善するエキサイティングな機会となるが、その実現可能性に関する証拠はほとんど提供されていない。
ほとんどのアプリケーションでは、ユーザはシステムに対して正しい答えを提供することはできないが、バイナリ(正しい、間違った)フィードバックを提供することができる。
本稿では,二元ユーザフィードバックを用いた初期教師付きシステムの改善のために,重要度サンプリングに基づくフィードバック強調学習を提案する。
文書分類(開発)やquacやdoqaといった会話型質問応答データセットに関するシミュレーション実験を行い,バイナリユーザからのフィードバックをゴールドアノテーションから導出する。
その結果,本手法は初期教師付きシステムよりも改良され,ドメイン内実験 (quac) で同じラベル付きサンプルにアクセス可能な完全教師付きシステム,さらにはドメイン外実験 (doqa) とのマッチングが可能となった。
当社の作業は,実際のユーザとのインタラクションを活用し,デプロイ後の会話システムを改善する可能性を開く。
関連論文リスト
- Rethinking the Evaluation of Dialogue Systems: Effects of User Feedback on Crowdworkers and LLMs [57.16442740983528]
アドホック検索では、評価は暗黙のフィードバックを含むユーザーの行動に大きく依存する。
アノテータの会話知覚におけるターン評価におけるユーザフィードバックの役割はほとんど研究されていない。
本稿では,タスク指向対話システム(TDS)の評価が,ターンのフォローアップ発話を通じて提供されるユーザフィードバック,明示的あるいは暗黙的な評価にどのように影響するかに注目した。
論文 参考訳(メタデータ) (2024-04-19T16:45:50Z) - System-Level Natural Language Feedback [83.24259100437965]
システムレベルの設計決定を人為的なループプロセスで形式化する上で,フィードバックの活用方法を示す。
検索クエリと対話応答生成を改善するために,本手法のケーススタディを2つ実施する。
システムレベルのフィードバックとインスタンスレベルのフィードバックの組み合わせは、さらなる利益をもたらします。
論文 参考訳(メタデータ) (2023-06-23T16:21:40Z) - Continually Improving Extractive QA via Human Feedback [59.49549491725224]
本研究では,人間のフィードバックによる抽出質問応答(QA)システムの改善を継続的に進める。
多様な設定の下で何千ものユーザインタラクションを含む実験を行い、時間とともにフィードバックからの学習の理解を広げます。
論文 参考訳(メタデータ) (2023-05-21T14:35:32Z) - Towards Teachable Reasoning Systems [29.59387051046722]
質問応答のための授業可能な推論システム(QA)を開発した。
私たちのアプローチは3つあります。 まず、生成された推論の連鎖は、システムの内部の信念によってどのように答えが示唆されるかを示しています。
第二に、ユーザーは説明と対話して誤ったモデル信念を特定し、修正を行うことができる。
第3に、そのような補正の動的なメモリでモデルを増強する。
論文 参考訳(メタデータ) (2022-04-27T17:15:07Z) - Using Interactive Feedback to Improve the Accuracy and Explainability of
Question Answering Systems Post-Deployment [20.601284299825895]
1)QAシステムのパフォーマンス自体の改善,2) 回答の正確性や誤りを説明する能力を備えたモデルの提供。
ユーザからの対話的なフィードバックを含む検索ベースのQAデータセットであるFeedbackQAを収集する。
フィードバックデータは、デプロイされたQAシステムの精度を向上するだけでなく、他のより強力な非デプロイシステムも改善することを示す。
論文 参考訳(メタデータ) (2022-04-06T18:17:09Z) - Simulating Bandit Learning from User Feedback for Extractive Question
Answering [51.97943858898579]
教師付きデータを用いたフィードバックのシミュレーションにより,ユーザフィードバックからの学習を抽出的質問応答に適用する。
当初は少数の例でトレーニングしたシステムが,モデル予測された回答に対するユーザからのフィードバックを劇的に改善できることが示される。
論文 参考訳(メタデータ) (2022-03-18T17:47:58Z) - An Adversarial Learning based Multi-Step Spoken Language Understanding
System through Human-Computer Interaction [70.25183730482915]
対戦型学習に基づく多段階音声言語理解システムを提案する。
我々は,F1の観点で解析性能を少なくとも2.5%向上させることを実証した。
論文 参考訳(メタデータ) (2021-06-06T03:46:53Z) - Soliciting Human-in-the-Loop User Feedback for Interactive Machine
Learning Reduces User Trust and Impressions of Model Accuracy [8.11839312231511]
混合開始システムにより、ユーザは対話的にフィードバックを提供し、システムパフォーマンスを向上させることができる。
本研究は,フィードバックの提供行為が知的システムのユーザ理解とその正確性に与える影響について検討する。
論文 参考訳(メタデータ) (2020-08-28T16:46:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。