論文の概要: Distantly-Supervised Evidence Retrieval Enables Question Answering
without Evidence Annotation
- arxiv url: http://arxiv.org/abs/2110.04889v1
- Date: Sun, 10 Oct 2021 20:01:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-14 13:04:35.638183
- Title: Distantly-Supervised Evidence Retrieval Enables Question Answering
without Evidence Annotation
- Title(参考訳): 遠隔指導型エビデンス検索は,エビデンスアノテーションなしで質問応答を可能にする
- Authors: Chen Zhao, Chenyan Xiong, Jordan Boyd-Graber, Hal Daum\'e III
- Abstract要約: オープンドメインの質問応答は、大きなコーパスから取得した証拠に基づいて質問に答える。
本稿では,大規模コーパスからモデルが証拠の発見を学べるかどうかを,モデル学習のための回答ラベルからのみ遠ざかって検討する。
我々は,最新のモデルから証拠を交互に発見し,最も可能性の高い証拠を学習するよう促すことにより,弱いレトリバーよりも反復的に改善する新しいアプローチ(DistDR)を提案する。
- 参考スコア(独自算出の注目度): 19.551623461082617
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Open-domain question answering answers a question based on evidence retrieved
from a large corpus. State-of-the-art neural approaches require intermediate
evidence annotations for training. However, such intermediate annotations are
expensive, and methods that rely on them cannot transfer to the more common
setting, where only question-answer pairs are available. This paper
investigates whether models can learn to find evidence from a large corpus,
with only distant supervision from answer labels for model training, thereby
generating no additional annotation cost. We introduce a novel approach
(DistDR) that iteratively improves over a weak retriever by alternately finding
evidence from the up-to-date model and encouraging the model to learn the most
likely evidence. Without using any evidence labels, DistDR is on par with
fully-supervised state-of-the-art methods on both multi-hop and single-hop QA
benchmarks. Our analysis confirms that DistDR finds more accurate evidence over
iterations, which leads to model improvements.
- Abstract(参考訳): オープンドメインの質問応答は、大きなコーパスから取得した証拠に基づいて質問に答える。
最先端のニューラルネットワークアプローチには、トレーニングのための中間的なエビデンスアノテーションが必要です。
しかし、このような中間アノテーションは高価であり、それらに依存するメソッドは、質問と回答のペアのみが利用できるより一般的な設定に転送できない。
本稿では,大規模なコーパスからモデルが証拠を見つけることができるかどうかを,モデル学習のための回答ラベルから遠ざかっているだけで,追加のアノテーションコストは発生しない。
我々は,最新のモデルから証拠を交互に発見し,最も可能性の高い証拠を学習するよう促すことにより,弱いレトリバーよりも反復的に改善する新しいアプローチ(DistDR)を提案する。
証拠ラベルを一切使わずに、DistDRはマルチホップとシングルホップのQAベンチマークの両方で完全に監督された最先端の手法と同等である。
我々の分析では、DistDRは反復よりも正確な証拠を見つけ、モデルの改善につながります。
関連論文リスト
- Contrastive Learning to Improve Retrieval for Real-world Fact Checking [84.57583869042791]
ファクト・チェッキング・リランカ(Contrastive Fact-Checking Reranker, CFR)を提案する。
我々はAVeriTeCデータセットを活用し、証拠文書からの人間による回答とクレームのサブクエストを注釈付けする。
データセットの精度は6%向上した。
論文 参考訳(メタデータ) (2024-10-07T00:09:50Z) - Progressive Evidence Refinement for Open-domain Multimodal Retrieval
Question Answering [20.59485758381809]
現在のマルチモーダル検索質問答えモデルは2つの大きな課題に直面している。
モデルへの入力として圧縮されたエビデンスの特徴を利用すると、エビデンス内の詳細な情報が失われる。
本稿では,これらの問題を緩和するための証拠検索と質問応答のための2段階の枠組みを提案する。
論文 参考訳(メタデータ) (2023-10-15T01:18:39Z) - HOP, UNION, GENERATE: Explainable Multi-hop Reasoning without Rationale
Supervision [118.0818807474809]
本研究は、合理的な監督なしに説明可能なマルチホップQAシステムを訓練するための原則的確率論的アプローチを提案する。
提案手法は,集合としての有理を明示的にモデル化し,文書と文間の相互作用を文書内で捉えることによって,マルチホップ推論を行う。
論文 参考訳(メタデータ) (2023-05-23T16:53:49Z) - Open-domain Question Answering via Chain of Reasoning over Heterogeneous
Knowledge [82.5582220249183]
異種知識ソース間のシングル/マルチホップ質問に応答する新しいオープンドメイン質問応答(ODQA)フレームワークを提案する。
分離された証拠を収集するためにレトリバーにのみ依存する従来の方法とは異なり、我々の仲介者は検索された集合に対する推論の連鎖を実行する。
本システムは,2つのODQAデータセットであるOTT-QAとNQに対して,Wikipediaの表や節に対する競合性能を実現する。
論文 参考訳(メタデータ) (2022-10-22T03:21:32Z) - GERE: Generative Evidence Retrieval for Fact Verification [57.78768817972026]
本稿では,ジェネレーション方式で証拠を検索する最初のシステムであるGEREを提案する。
FEVERデータセットの実験結果は、GEREが最先端のベースラインよりも大幅に改善されていることを示している。
論文 参考訳(メタデータ) (2022-04-12T03:49:35Z) - Making Document-Level Information Extraction Right for the Right Reasons [19.00249049142611]
文書レベルの情報抽出は、情報が必ずしも1つの文でローカライズされないアプリケーションと互換性のある柔軟なフレームワークである。
この研究は、文書レベルのニューラルモデルが複雑なテキストから正しい推論を行い、それらの推論を監査可能な方法で確実にする方法を研究する。
論文 参考訳(メタデータ) (2021-10-14T19:52:47Z) - Robustifying Multi-hop QA through Pseudo-Evidentiality Training [28.584236042324896]
本研究では,正解法を使わずに正しい解答を行うマルチホップ質問応答モデルのバイアス問題について検討する。
そこで本稿では, 正解が正しい証拠によって裏付けられるかどうかを判断し, 明解性を学習するための新しい手法を提案する。
論文 参考訳(メタデータ) (2021-07-07T14:15:14Z) - Weakly- and Semi-supervised Evidence Extraction [107.47661281843232]
本稿では,エビデンス抽出の課題に対して,いくつかのエビデンスアノテーションと豊富な文書レベルラベルを組み合わせた新たな手法を提案する。
私たちのアプローチは、数百のエビデンスアノテーションでかなりの利益をもたらします。
論文 参考訳(メタデータ) (2020-11-03T04:05:00Z) - Leveraging Passage Retrieval with Generative Models for Open Domain
Question Answering [61.394478670089065]
オープンドメインの質問に答えるための生成モデルは、外部の知識に頼らずに競争力があることが証明されている。
我々は、これらのモデルがテキストの文節を検索することでどれだけの恩恵を受けられるかを調査し、潜在的に証拠を含む可能性がある。
検索したパス数を増やすと,本手法の性能が著しく向上することがわかった。
論文 参考訳(メタデータ) (2020-07-02T17:44:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。