論文の概要: ConfNet2Seq: Full Length Answer Generation from Spoken Questions
- arxiv url: http://arxiv.org/abs/2006.05163v2
- Date: Thu, 11 Jun 2020 08:39:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-23 13:16:25.887360
- Title: ConfNet2Seq: Full Length Answer Generation from Spoken Questions
- Title(参考訳): confnet2seq: 音声質問からの完全長回答生成
- Authors: Vaishali Pal, Manish Shrivastava and Laurent Besacier
- Abstract要約: 本稿では,音声質問とファクトイド回答から全長の自然言語回答を生成する新しいシステムを提案する。
予め訓練された自動音声認識器から抽出された混乱ネットワークとして、音声シーケンスをコンパクトに表現する。
本研究では,259,788件の音声質問の大規模データセット,そのファクトイド回答,およびそれに対応する全文回答を公表する。
- 参考スコア(独自算出の注目度): 35.5617271023687
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Conversational and task-oriented dialogue systems aim to interact with the
user using natural responses through multi-modal interfaces, such as text or
speech. These desired responses are in the form of full-length natural answers
generated over facts retrieved from a knowledge source. While the task of
generating natural answers to questions from an answer span has been widely
studied, there has been little research on natural sentence generation over
spoken content. We propose a novel system to generate full length natural
language answers from spoken questions and factoid answers. The spoken sequence
is compactly represented as a confusion network extracted from a pre-trained
Automatic Speech Recognizer. This is the first attempt towards generating
full-length natural answers from a graph input(confusion network) to the best
of our knowledge. We release a large-scale dataset of 259,788 samples of spoken
questions, their factoid answers and corresponding full-length textual answers.
Following our proposed approach, we achieve comparable performance with best
ASR hypothesis.
- Abstract(参考訳): 会話やタスク指向の対話システムは,テキストや音声などのマルチモーダルインタフェースを通じて,自然な応答を用いてユーザと対話することを目的としている。
これらの望ましい回答は、知識ソースから取得した事実よりも長い自然な回答の形で生成される。
回答スパンから質問への自然な回答を生成するタスクは広く研究されているが、音声コンテンツよりも自然文生成に関する研究は少ない。
本稿では,音声質問とファクトイド回答から全長の自然言語回答を生成するシステムを提案する。
予め訓練された自動音声認識装置から抽出された混乱ネットワークとして音声シーケンスをコンパクトに表現する。
これは、グラフ入力(コンフュージョンネットワーク)から我々の知識を最大限に活用するための、完全な自然解を生成する最初の試みである。
音声質問の大規模データセット259,788件, 事実型回答, 対応する全文回答を公表した。
提案手法に従えば,最高のASR仮説で同等の性能が得られる。
関連論文リスト
- Question Answering in Natural Language: the Special Case of Temporal
Expressions [0.0]
本研究の目的は,1段落内の時間的質問に対する回答を見つけるために,一般的な質問応答や回答抽出に使用される一般的なアプローチを活用することである。
モデルをトレーニングするために、SQuADにインスパイアされた新しいデータセットを提案する。
本評価は,パターンマッチングを訓練した深層学習モデルにおいて,時間的質問応答に適応できることを示す。
論文 参考訳(メタデータ) (2023-11-23T16:26:24Z) - Prompt Guided Copy Mechanism for Conversational Question Answering [30.247806772658635]
本稿では,抽出された回答の流速と適切性を改善するために,新しいプロンプト誘導コピー機構を提案する。
提案手法では,質問と回答をリンクするプロンプトを用いて,抽出された回答の自然性を検証するために,コピー機構のガイドに注意を払っている。
論文 参考訳(メタデータ) (2023-08-07T09:15:03Z) - Concise Answers to Complex Questions: Summarization of Long-form Answers [27.190319030219285]
我々は,最先端モデルから生成された要約された回答と,新たに提案した抽出・デコンテクライズ手法について,ユーザスタディを行った。
複雑で暗黙的な解答は圧縮が困難であるのに対し、少なくとも1つのシステムによって、大量の長文解答を適切に要約できることがわかった。
要約作業において,非コンテクスト化によって抽出された要約の質が向上し,その可能性を実証する。
論文 参考訳(メタデータ) (2023-05-30T17:59:33Z) - Conversational QA Dataset Generation with Answer Revision [2.5838973036257458]
本稿では,一節から質問に値するフレーズを抽出し,過去の会話を考慮し,それに対応する質問を生成する新しい枠組みを提案する。
本フレームワークでは,抽出した回答を質問生成後に修正し,その回答が一致した質問に正確に一致するようにした。
論文 参考訳(メタデータ) (2022-09-23T04:05:38Z) - End-to-end Spoken Conversational Question Answering: Task, Dataset and
Model [92.18621726802726]
音声による質問応答では、システムは関連する音声書き起こしの中に連続したテキストスパンからの質問に答えるように設計されている。
本稿では,複雑な対話フローをモデル化することを目的とした音声対話型質問応答タスク(SCQA)を提案する。
本研究の目的は,音声記録に基づく対話型質問に対処するシステムを構築することであり,情報収集システムによる様々なモダリティからより多くの手がかりを提供する可能性を探ることである。
論文 参考訳(メタデータ) (2022-04-29T17:56:59Z) - How Do We Answer Complex Questions: Discourse Structure of Long-form
Answers [51.973363804064704]
3つのデータセットから収集した長文回答の機能構造について検討した。
私たちの主な目標は、人間が複雑な答えを作るためにどのように情報を整理するかを理解することです。
我々の研究は、長期QAシステムの談話レベルのモデリングと評価に関する将来の研究に刺激を与えることができる。
論文 参考訳(メタデータ) (2022-03-21T15:14:10Z) - A Graph-guided Multi-round Retrieval Method for Conversational
Open-domain Question Answering [52.041815783025186]
本稿では,会話のターン間の回答間の関係をモデル化するグラフ誘導検索手法を提案する。
また,検索コンテキストが現在の質問理解に与える影響を検討するために,マルチラウンド関連フィードバック手法を導入することを提案する。
論文 参考訳(メタデータ) (2021-04-17T04:39:41Z) - Towards Data Distillation for End-to-end Spoken Conversational Question
Answering [65.124088336738]
音声対話型質問応答タスク(SCQA)を提案する。
SCQAは,音声発話とテキストコーパスから複雑な対話の流れをモデル化することを目的としている。
我々の主な目的は、音声とテキストの両方で会話的な質問に対処するQAシステムを構築することである。
論文 参考訳(メタデータ) (2020-10-18T05:53:39Z) - Generating Dialogue Responses from a Semantic Latent Space [75.18449428414736]
語彙のエンドツーエンド分類に代わる方法を提案する。
潜在空間上の回帰タスクとして,プロンプトと応答のペア関係を学習する。
人間の評価は、連続した空間でタスクを学習すると、関連性と情報性の両方を持つ応答が生成されることを示した。
論文 参考訳(メタデータ) (2020-10-04T19:06:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。