論文の概要: Using contradictions improves question answering systems
- arxiv url: http://arxiv.org/abs/2211.05598v2
- Date: Mon, 29 May 2023 13:14:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-01 02:17:29.980937
- Title: Using contradictions improves question answering systems
- Title(参考訳): 矛盾の利用は質問応答システムを改善する
- Authors: \'Etienne Fortier-Dubois and Domenic Rosati
- Abstract要約: 本研究は,自然言語推論(NLI)における矛盾点を用いた質問応答(QA)について検討する。
矛盾を組み込んだシステムは、特定のデータセット上のエンテーメントのみのシステムよりもわずかに優れていることがわかった。
これは、安全が問題となる医学や科学などの分野におけるQAシステムの展開に影響を及ぼす。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This work examines the use of contradiction in natural language inference
(NLI) for question answering (QA). Typically, NLI systems help answer questions
by determining if a potential answer is \emph{entailed} (supported) by some
background context. But is it useful to also determine if an answer contradicts
the context? We test this in two settings, multiple choice and extractive QA,
and find that systems that incorporate contradiction can do slightly better
than entailment-only systems on certain datasets. However, the best
performances come from using contradiction, entailment, and QA model confidence
scores together. This has implications for the deployment of QA systems in
domains such as medicine and science where safety is an issue.
- Abstract(参考訳): 本研究は,自然言語推論(NLI)における質問応答(QA)の矛盾について検討する。
通常、NLIシステムは、潜在的な答えが何らかの背景コンテキストで \emph{entailed} (サポート) であるかどうかを決定することで、質問に答えるのに役立つ。
しかし、答えが文脈に矛盾するかどうかを判断するのも有用だろうか?
我々は、複数の選択と抽出されたQAの2つの設定でこれをテストし、矛盾を組み込んだシステムは、特定のデータセット上のエンテーメントのみのシステムよりもわずかに優れていることを発見した。
しかしながら、最高のパフォーマンスは矛盾、エンタテインメント、QAモデルの信頼性スコアを一緒に使うことから得られます。
これは、安全が問題となる医学や科学などの分野におけるQAシステムの展開に影響を及ぼす。
関連論文リスト
- QUDSELECT: Selective Decoding for Questions Under Discussion Parsing [90.92351108691014]
Question Under Examination (QUD) は、暗黙の質問を用いて文間の会話関係を明らかにするための談話フレームワークである。
本稿では,QUD基準を考慮したQUD依存構造を選択的に復号する共同学習フレームワークであるQUDSELECTを紹介する。
提案手法は,人的評価において9%,自動評価において4%,最先端のベースラインモデルよりも優れていた。
論文 参考訳(メタデータ) (2024-08-02T06:46:08Z) - Controllable Decontextualization of Yes/No Question and Answers into
Factual Statements [28.02936811004903]
本稿では,極性質問に対する回答の制御可能な書き直しの問題に対処する。
本稿では,ソフト制約を利用して制御可能な書き換えを実現するトランスフォーマーシーケンス to シーケンスモデルを提案する。
論文 参考訳(メタデータ) (2024-01-18T07:52:12Z) - SQUARE: Automatic Question Answering Evaluation using Multiple Positive
and Negative References [73.67707138779245]
SQuArE (Sentence-level QUestion AnsweRing Evaluation) という新しい評価指標を提案する。
文レベルの抽出(回答選択)と生成(GenQA)の両方のQAシステムでSQuArEを評価する。
論文 参考訳(メタデータ) (2023-09-21T16:51:30Z) - Evaluation of Question Answering Systems: Complexity of judging a
natural language [3.4771957347698583]
質問応答システム(QA)は、自然言語処理(NLP)において最も重要かつ急速に発展している研究課題の一つである。
本調査では,QAの枠組み,QAパラダイム,ベンチマークデータセット,およびQAシステムの定量的評価のための評価手法の体系的概要について述べる。
論文 参考訳(メタデータ) (2022-09-10T12:29:04Z) - Multifaceted Improvements for Conversational Open-Domain Question
Answering [54.913313912927045]
対話型オープンドメイン質問回答(MICQA)のための多面的改善フレームワークを提案する。
第一に、提案したKL分割に基づく正規化は、検索と解答のためのより良い質問理解をもたらすことができる。
第二に、追加されたポストランカモジュールは、より関連性の高いパスをトップにプッシュし、2アスペクトの制約で読者に選択できる。
第3に、十分に設計されたカリキュラム学習戦略は、訓練と推論の黄金の通路設定のギャップを効果的に狭め、黄金の通路支援なしで真の答えを見つけることを奨励する。
論文 参考訳(メタデータ) (2022-04-01T07:54:27Z) - Improving the Question Answering Quality using Answer Candidate
Filtering based on Natural-Language Features [117.44028458220427]
本稿では,質問応答(QA)の品質をいかに改善できるかという課題に対処する。
私たちの主な貢献は、QAシステムが提供する間違った回答を識別できるアプローチです。
特に,提案手法は誤答の大部分を除去しつつ,その可能性を示した。
論文 参考訳(メタデータ) (2021-12-10T11:09:44Z) - How to Build Robust FAQ Chatbot with Controllable Question Generator? [5.680871239968297]
本稿では, セマンティックグラフを用いて, 高い品質, 多様性, 制御可能なサンプルを生成する手法を提案する。
流動的でセマンティックに生成されたQAペアは、我々の通過検索モデルをうまく騙すことができる。
生成されたデータセットは、新しいターゲット領域へのQAモデルの一般化性を向上させる。
論文 参考訳(メタデータ) (2021-11-18T12:54:07Z) - Using Natural Language Relations between Answer Choices for Machine
Comprehension [32.45844219516005]
本論文では,機械理解の性能向上のために,包含や矛盾といった解答選択間の自然言語関係を活用する手法を提案する。
また,両タスクを共同で学習するマルチタスク学習モデルを提案する。
論文 参考訳(メタデータ) (2020-12-31T18:55:30Z) - Robust Question Answering Through Sub-part Alignment [53.94003466761305]
我々はアライメント問題として質問応答をモデル化する。
私たちは、SQuAD v1.1でモデルをトレーニングし、いくつかの逆および外ドメインデータセットでそれをテストします。
論文 参考訳(メタデータ) (2020-04-30T09:10:57Z) - Unsupervised Question Decomposition for Question Answering [102.56966847404287]
本論文では, ワンツーNアン教師付きシーケンスシーケンス(ONUS)のアルゴリズムを提案する。
当初,ドメイン外,マルチホップ開発セットのベースラインが強かったため,HotpotQAでは大きなQA改善が見られた。
論文 参考訳(メタデータ) (2020-02-22T19:40:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。