論文の概要: QUADRo: Dataset and Models for QUestion-Answer Database Retrieval
- arxiv url: http://arxiv.org/abs/2304.01003v1
- Date: Thu, 30 Mar 2023 00:42:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-04 15:02:06.481037
- Title: QUADRo: Dataset and Models for QUestion-Answer Database Retrieval
- Title(参考訳): QUADRo:QUestion-Answerデータベース検索のためのデータセットとモデル
- Authors: Stefano Campese, Ivano Lauriola, Alessandro Moschitti
- Abstract要約: 質問/回答(q/a)ペアのデータベース(DB)が与えられた場合、同じ質問に対してDBをスキャンすることで、対象の質問に答えることができる。
我々は6.3Mのq/aペアからなる大規模DBを構築し、公開質問を用いて、ニューラルIRとq/aペアリランカに基づく新しいシステムを設計する。
我々は、Bing検索エンジン上に構築されたQAシステムという、Webベースの手法とDBベースのアプローチが競合することを示す。
- 参考スコア(独自算出の注目度): 97.84448420852854
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: An effective paradigm for building Automated Question Answering systems is
the re-use of previously answered questions, e.g., for FAQs or forum
applications. Given a database (DB) of question/answer (q/a) pairs, it is
possible to answer a target question by scanning the DB for similar questions.
In this paper, we scale this approach to open domain, making it competitive
with other standard methods, e.g., unstructured document or graph based. For
this purpose, we (i) build a large scale DB of 6.3M q/a pairs, using public
questions, (ii) design a new system based on neural IR and a q/a pair reranker,
and (iii) construct training and test data to perform comparative experiments
with our models. We demonstrate that Transformer-based models using (q,a) pairs
outperform models only based on question representation, for both neural search
and reranking. Additionally, we show that our DB-based approach is competitive
with Web-based methods, i.e., a QA system built on top the BING search engine,
demonstrating the challenge of finding relevant information. Finally, we make
our data and models available for future research.
- Abstract(参考訳): 自動質問応答システムを構築するための効果的なパラダイムは、faqやフォーラムアプリケーションなど、事前に回答した質問の再使用である。
質問/回答(q/a)対のデータベース(db)が与えられると、同様の質問のためにdbをスキャンしてターゲットの質問に答えることができる。
本稿では、このアプローチをオープンドメインに拡張し、非構造化ドキュメントやグラフベースといった他の標準メソッドと競合するようにします。
この目的のために、我々は
(i)公開質問を用いて6.3M q/a対の大規模DBを構築する。
(二)ニューラルIRとq/aペアリランカに基づく新しいシステムの設計、及び
(iii)モデルとの比較実験を行うためのトレーニングおよびテストデータの構築。
我々は,(q,a)ペアを用いたトランスフォーマーモデルが,ニューラルサーチとリランクの両方において,質問表現のみに基づくモデルよりも優れていることを示した。
さらに、BING検索エンジン上に構築されたQAシステムとDBベースのアプローチが競合していることを示し、関連する情報を見つけることの課題を示す。
最後に、将来の研究のためにデータとモデルを利用可能にします。
関連論文リスト
- A Lightweight Method to Generate Unanswerable Questions in English [18.323248259867356]
本稿では,英語における疑問生成のための簡易なデータ拡張手法について検討する。
回答可能な質問に対して、Antonymとエンティティスワップを実行します。
従来の最先端技術と比較すると、トレーニング不要で軽量な戦略で生成されたデータにより、より良いモデルが得られます。
論文 参考訳(メタデータ) (2023-10-30T10:14:52Z) - UNK-VQA: A Dataset and a Probe into the Abstention Ability of Multi-modal Large Models [55.22048505787125]
本稿ではUNK-VQAと呼ばれる包括的データセットを提案する。
まず、画像または疑問について意図的に摂動することで、既存のデータを拡大する。
そこで我々は,新たなマルチモーダル大規模モデルのゼロショット性能と少数ショット性能を広範囲に評価した。
論文 参考訳(メタデータ) (2023-10-17T02:38:09Z) - An Empirical Comparison of LM-based Question and Answer Generation
Methods [79.31199020420827]
質問と回答の生成(QAG)は、コンテキストが与えられた質問と回答のペアのセットを生成することで構成される。
本稿では,シーケンス・ツー・シーケンス言語モデル(LM)を微調整する3つの異なるQAG手法を用いて,ベースラインを確立する。
実験により、学習時間と推論時間の両方で計算的に軽量なエンドツーエンドQAGモデルが一般に堅牢であり、他のより複雑なアプローチよりも優れていることが示された。
論文 参考訳(メタデータ) (2023-05-26T14:59:53Z) - Question-Answer Sentence Graph for Joint Modeling Answer Selection [122.29142965960138]
我々は,質問文,質問文,回答文のペア間のスコアを計算するための最先端(SOTA)モデルを訓練し,統合する。
オンライン推論は、目に見えないクエリのAS2タスクを解決するために実行される。
論文 参考訳(メタデータ) (2022-02-16T05:59:53Z) - Joint Models for Answer Verification in Question Answering Systems [85.93456768689404]
我々は3方向のマルチクラス化器を構築し、解答が他の解答をサポートするか、反証するか、あるいは中立かを決定する。
私たちは、WikiQA、TREC-QA、実世界のデータセットでモデルをテストしました。
論文 参考訳(メタデータ) (2021-07-09T05:34:36Z) - Harvesting and Refining Question-Answer Pairs for Unsupervised QA [95.9105154311491]
教師なし質問回答(QA)を改善するための2つのアプローチを提案する。
まず、ウィキペディアから語彙的・構文的に異なる質問を抽出し、質問応答対のコーパスを自動的に構築する(RefQAと名づけられる)。
第2に、より適切な回答を抽出するためにQAモデルを活用し、RefQA上でデータを反復的に洗練する。
論文 参考訳(メタデータ) (2020-05-06T15:56:06Z) - TCNN: Triple Convolutional Neural Network Models for Retrieval-based
Question Answering System in E-commerce [6.1786972717541895]
IRベースのモデルの鍵となる解決策は、与えられたクエリの最も類似した知識エントリをQA知識ベースから取得し、それらの知識エントリをセマンティックマッチングモデルで再参照することである。
本稿では、基本的な3つの畳み込みニューラルネットワーク(TCNN)モデルと2つの注意に基づくTCNN(ATCNN)モデルを含むテキストマッチングモデルを用いて、IRベースの電子商取引QAシステムAliMeを改善することを目的とする。
論文 参考訳(メタデータ) (2020-04-23T01:02:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。