論文の概要: An Initial Investigation of Non-Native Spoken Question-Answering
- arxiv url: http://arxiv.org/abs/2107.04691v1
- Date: Fri, 9 Jul 2021 21:59:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-14 10:59:07.983821
- Title: An Initial Investigation of Non-Native Spoken Question-Answering
- Title(参考訳): 非Native Spoken Question-Answering の初期調査
- Authors: Vatsal Raina, Mark J.F. Gales
- Abstract要約: SQuAD2.0 で訓練された単純なテキストベースの ELECTRA MC モデルは,音声による質問応答テストに適していることを示す。
重要な課題の1つは、このタスクのためにシステムを訓練するために適切に注釈付けされた音声コーパスがないことである。
ミスマッチは、テキスト文書と音声応答、非ネイティブな音声文法と書かれた文法の間で考慮されなければならない。
- 参考スコア(独自算出の注目度): 36.89541375786233
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Text-based machine comprehension (MC) systems have a wide-range of
applications, and standard corpora exist for developing and evaluating
approaches. There has been far less research on spoken question answering (SQA)
systems. The SQA task considered in this paper is to extract the answer from a
candidate$\text{'}$s spoken response to a question in a prompt-response style
language assessment test. Applying these MC approaches to this SQA task rather
than, for example, off-topic response detection provides far more detailed
information that can be used for further downstream processing. One significant
challenge is the lack of appropriately annotated speech corpora to train
systems for this task. Hence, a transfer-learning style approach is adopted
where a system trained on text-based MC is evaluated on an SQA task with
non-native speakers. Mismatches must be considered between text documents and
spoken responses; non-native spoken grammar and written grammar. In practical
SQA, ASR systems are used, necessitating an investigation of the impact of ASR
errors. We show that a simple text-based ELECTRA MC model trained on SQuAD2.0
transfers well for SQA. It is found that there is an approximately linear
relationship between ASR errors and the SQA assessment scores but grammar
mismatches have minimal impact.
- Abstract(参考訳): テキストベースマシン理解(mc)システムには幅広い応用があり、アプローチの開発と評価には標準コーパスが存在する。
音声質問応答 (SQA) システムの研究は, はるかに少ない。
本論文で検討されているsqaタスクは,質問に対する質問応答の候補$\text{'}$sから,即応型言語アセスメントテストで回答を抽出することである。
例えば、このSQAタスクにこれらのMCアプローチを適用することで、例えば、オフトピー応答検出は、さらに下流処理に使用できるはるかに詳細な情報を提供する。
重要な課題の1つは、このタスクのためにシステムを訓練するために適切に注釈付けされた音声コーパスがないことである。
したがって、非ネイティブ話者によるSQAタスクにおいて、テキストベースのMCで訓練されたシステムを評価できるトランスファーラーニング方式を採用する。
ミスマッチは、テキスト文書と音声応答、非ネイティブな文法と文法の間で考慮されなければならない。
実用的なSQAでは、ASRシステムを使用し、ASRエラーの影響を調べる必要がある。
SQAD2.0 で訓練された単純なテキストベースの ELECTRA MC モデルが,SQA に対して良好であることを示す。
その結果,asr誤差とsqa評価スコアには線形関係がみられたが,文法的ミスマッチの影響は最小限であった。
関連論文リスト
- SpeechDPR: End-to-End Spoken Passage Retrieval for Open-Domain Spoken Question Answering [76.4510005602893]
SQA(Spken Question Answering)は、機械がユーザの質問に応答するために必要である。
本稿では、最初のエンドツーエンドフレームワークであるSpeechDPR(SpeechDPR)を提案する。
教師なしASR (UASR) と高密度テキスト検索器 (TDR) のカスケードモデルから知識を抽出して文レベルの意味表現を学習する
論文 参考訳(メタデータ) (2024-01-24T14:08:38Z) - SQUARE: Automatic Question Answering Evaluation using Multiple Positive
and Negative References [73.67707138779245]
SQuArE (Sentence-level QUestion AnsweRing Evaluation) という新しい評価指標を提案する。
文レベルの抽出(回答選択)と生成(GenQA)の両方のQAシステムでSQuArEを評価する。
論文 参考訳(メタデータ) (2023-09-21T16:51:30Z) - Reinforced Question Rewriting for Conversational Question Answering [25.555372505026526]
対話型質問を自己完結型質問に書き換えるモデルを開発した。
既存のシングルターンQAシステムを使用することで、CQAモデルをスクラッチからトレーニングすることを回避することができる。
我々は、強化学習による書き換えモデルの監督にQAフィードバックを用いることを提案する。
論文 参考訳(メタデータ) (2022-10-27T21:23:36Z) - DUAL: Textless Spoken Question Answering with Speech Discrete Unit
Adaptive Learning [66.71308154398176]
SQA (Spken Question Answering) は近年注目され, 目覚ましい進歩を遂げている。
既存のSQA手法は、収集に時間と費用がかかる自動音声認識(ASR)の転写に依存している。
本研究は,未ラベルのデータを事前学習に活用し,SQAダウンストリームタスクによって微調整される離散単位適応学習(DUAL)という,ASR transcript-free SQAフレームワークを提案する。
論文 参考訳(メタデータ) (2022-03-09T17:46:22Z) - Knowledge Distillation for Improved Accuracy in Spoken Question
Answering [63.72278693825945]
我々は,音声文書や書面文書から知識蒸留を行うための訓練戦略を考案した。
我々の研究は、言語モデルから知識の抽出を監督信号として進めている。
実験により,本手法はSpken-SQuADデータセット上で,最先端の言語モデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2020-10-21T15:18:01Z) - Contextualized Attention-based Knowledge Transfer for Spoken
Conversational Question Answering [63.72278693825945]
音声対話型質問応答 (SCQA) は複雑な対話の流れをモデル化するために機械を必要とする。
本稿では,新しい文脈型注意型蒸留手法CADNetを提案する。
Spoken-CoQAデータセット上で広範な実験を行い、本手法が優れた性能を発揮することを示す。
論文 参考訳(メタデータ) (2020-10-21T15:17:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。