論文の概要: Composing Answer from Multi-spans for Reading Comprehension
- arxiv url: http://arxiv.org/abs/2009.06141v2
- Date: Mon, 23 Aug 2021 14:56:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-18 11:21:57.758920
- Title: Composing Answer from Multi-spans for Reading Comprehension
- Title(参考訳): 読解用マルチスパンからの解答
- Authors: Zhuosheng Zhang, Yiqing Zhang, Hai Zhao, Xi Zhou, Xiang Zhou
- Abstract要約: 本稿では,非抽出機械読解(MRC)タスクに対する応答を生成する新しい手法を提案する。
提案手法は,長い解答を正確に生成する性能が向上し,競合する2つの典型的な1スパンとSeq2Seqのベースラインデコーダよりも大幅に向上する。
- 参考スコア(独自算出の注目度): 77.32873012668783
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a novel method to generate answers for non-extraction
machine reading comprehension (MRC) tasks whose answers cannot be simply
extracted as one span from the given passages. Using a pointer network-style
extractive decoder for such type of MRC may result in unsatisfactory
performance when the ground-truth answers are given by human annotators or
highly re-paraphrased from parts of the passages. On the other hand, using
generative decoder cannot well guarantee the resulted answers with well-formed
syntax and semantics when encountering long sentences. Therefore, to alleviate
the obvious drawbacks of both sides, we propose an answer making-up method from
extracted multi-spans that are learned by our model as highly confident
$n$-gram candidates in the given passage. That is, the returned answers are
composed of discontinuous multi-spans but not just one consecutive span in the
given passages anymore. The proposed method is simple but effective: empirical
experiments on MS MARCO show that the proposed method has a better performance
on accurately generating long answers, and substantially outperforms two
competitive typical one-span and Seq2Seq baseline decoders.
- Abstract(参考訳): 本稿では,与えられた文から解をただ1つのスパンとして抽出できない非抽出機械読解(mrc)タスクに対して,解を生成する新しい手法を提案する。
このようなMRCに対してポインタネットワークスタイルの抽出デコーダを使用すると、人間のアノテータによって接地真実の答えが与えられる場合や、通路の一部から高度に言い換えられた場合、満足のいく性能が得られる。
一方、生成デコーダを使用すると、長い文に遭遇した場合、結果の答えをよく形づくられた構文と意味論で保証することができない。
そこで,本論文では,両陣営の明らかな欠点を解消するために,抽出されたマルチスパンからの回答作成手法を提案する。
すなわち、返された答えは不連続な多重スパンで構成されるが、与えられた節の連続するスパンはもはや1つではない。
提案手法は単純だが有効であり,MS MARCOの実証実験により,提案手法は長文を正確に生成する性能が向上し,競合する2つの典型的な1-spanとSeq2Seqのベースラインデコーダよりも大幅に優れていた。
関連論文リスト
- FastFiD: Improve Inference Efficiency of Open Domain Question Answering via Sentence Selection [61.9638234358049]
FastFiDは、エンコードされたパスで文の選択を実行する新しいアプローチである。
これにより、価値ある文を保持するのに役立ち、回答を生成するのに必要な文脈長を減らすことができる。
論文 参考訳(メタデータ) (2024-08-12T17:50:02Z) - Self-Consistent Decoding for More Factual Open Responses [28.184313177333642]
Sample & Selectは、DoLA、P-CRR、S-CRRのデコーダに対して、30%の相対的なマージンで事実性を向上する。
生成した要約の人間による検証を収集し,本手法の実際的優位性を確認する。
論文 参考訳(メタデータ) (2024-03-01T17:31:09Z) - To Answer or Not to Answer? Improving Machine Reading Comprehension
Model with Span-based Contrastive Learning [9.490758388465697]
本研究では,解答可能な質問を,解答可能で解答不能な質問と明示的に対比するスパンシブ・ラーニング(spanCL)を提案する。
SQuAD 2.0データセットの実験では、spanceCLはベースラインを大幅に改善し、0.86-2.14の絶対EM改善をもたらすことが示されている。
論文 参考訳(メタデータ) (2022-08-02T08:09:05Z) - Predict and Use Latent Patterns for Short-Text Conversation [5.757975605648179]
そこで本研究では,より詳細なセマンティックフォーム(潜時応答や部分音声シーケンスなど)を制御可能なセマンティックスとして使用し,生成を導くことを提案する。
以上の結果から,よりリッチなセマンティクスは情報的かつ多様な応答を提供するだけでなく,応答品質の全体的な性能を向上させることができることがわかった。
論文 参考訳(メタデータ) (2020-10-27T01:31:42Z) - Multi-span Style Extraction for Generative Reading Comprehension [90.6069071495214]
生成的MRCをマルチスパン抽出としてスムーズに解決できる新しいフレームワークを提案する。
より詳細な実験により、この新しいアプローチは生成モデルと単一スパンモデルの間のジレンマを緩和できることを示した。
論文 参考訳(メタデータ) (2020-09-15T23:06:48Z) - Recurrent Chunking Mechanisms for Long-Text Machine Reading
Comprehension [59.80926970481975]
機械読解(MRC)を長文で研究する。
モデルは長い文書と質問を入力として取り、回答として文書からテキストを抽出する。
我々は、モデルに強化学習を通じてより柔軟な方法でチャンクを学習させることを提案する。
論文 参考訳(メタデータ) (2020-05-16T18:08:58Z) - Document Modeling with Graph Attention Networks for Multi-grained
Machine Reading Comprehension [127.3341842928421]
Natural Questionsは、新しい挑戦的な機械読解ベンチマークである。
解答は2つあり、長解(典型的には1段落)と短解(長解の内にある1つ以上の実体)である。
既存の方法は、これらの2つのサブタスクをトレーニング中に個別に扱い、依存関係を無視します。
本稿では,文書を階層的にモデル化する多層機械読解フレームワークを提案する。
論文 参考訳(メタデータ) (2020-05-12T14:20:09Z) - Answer Generation through Unified Memories over Multiple Passages [10.965065178451104]
GUM-MP(Unified Memories over Multiple Passages)によるニューラル・ソリューション・ジェネレーション(Neural answer Generation)と呼ばれる手法
まず、文中のどのトークンが問題にマッチしているかを決定する。
特に、質問に割り当てられる正の通路のトークンと、質問に関係のない負の通路のトークンの一致を調査する。
最後に、上記2つのマッチング結果と共にトークンシーケンスをトランスファーエンコーダの統一メモリに符号化し、マルチポイントジェネレータ機構を備えたエンコーダデコーダを用いて応答シーケンスを学習する。
論文 参考訳(メタデータ) (2020-04-22T11:46:40Z) - Retrospective Reader for Machine Reading Comprehension [90.6069071495214]
機械読み取り理解(英: Machine reading comprehension、MRC)とは、機械が与えられた文節に基づいて質問に対する正しい答えを決定することを要求するAIチャレンジである。
不可解な質問が MRC タスクに関与している場合、検証モジュールと呼ばれる本質的な検証モジュールがエンコーダに加えて特に必要となる。
本稿では, MRC タスクに対して, 解答不能な質問に対して, より優れた検証器設計を提案する。
論文 参考訳(メタデータ) (2020-01-27T11:14:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。