Fugu-MT 論文翻訳(概要): Two-Step Question Retrieval for Open-Domain QA

論文の概要: Two-Step Question Retrieval for Open-Domain QA

arxiv url: http://arxiv.org/abs/2205.09393v1
Date: Thu, 19 May 2022 08:46:14 GMT
ステータス: 翻訳完了
システム内更新日: 2022-05-20 14:09:57.230757
Title: Two-Step Question Retrieval for Open-Domain QA
Title（参考訳）: オープンドメインQAのための2段階質問検索
Authors: Yeon Seonwoo, Juhee Son, Jiho Jin, Sang-Woo Lee, Ji-Hoon Kim, Jung-Woo Ha, Alice Oh
Abstract要約: retriever-readerパイプラインは、オープンドメインのQAで有望なパフォーマンスを示しているが、非常に遅い推論速度に悩まされている。近年,質問回答ペアを索引付け,類似した質問を検索することで,この問題に対処するモデルが提案されている。 SQuIDは、既存の質問検索モデルの性能を大幅に向上させ、推論速度に無視できない損失を与える。
参考スコア（独自算出の注目度）: 27.37731471419776
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: The retriever-reader pipeline has shown promising performance in open-domain QA but suffers from a very slow inference speed. Recently proposed question retrieval models tackle this problem by indexing question-answer pairs and searching for similar questions. These models have shown a significant increase in inference speed, but at the cost of lower QA performance compared to the retriever-reader models. This paper proposes a two-step question retrieval model, SQuID (Sequential Question-Indexed Dense retrieval) and distant supervision for training. SQuID uses two bi-encoders for question retrieval. The first-step retriever selects top-k similar questions, and the second-step retriever finds the most similar question from the top-k questions. We evaluate the performance and the computational efficiency of SQuID. The results show that SQuID significantly increases the performance of existing question retrieval models with a negligible loss on inference speed.
Abstract（参考訳）: retriever-readerパイプラインは、オープンドメインのQAで有望なパフォーマンスを示しているが、非常に遅い推論速度に悩まされている。近年,質問回答ペアをインデックス化し,類似した質問を検索することで,この問題に対処する。これらのモデルでは推論速度が大幅に向上するが、レトリバー・リーダーモデルと比較してQA性能が低下する。本稿では,2段階の質問検索モデルであるSQuID(Sequential Question-Indexed Dense Search)と遠隔指導によるトレーニングを提案する。 SQuIDは質問検索に2つのバイエンコーダを使用する。第1ステップ検索者はトップk類似質問を選択し、第2ステップ検索者はトップk類似質問の中から最も類似した質問を求める。我々はSQuIDの性能と計算効率を評価する。その結果,squidは推定速度を損なうことなく,既存の質問検索モデルの性能を大幅に向上させることがわかった。

関連論文リスト

FrugalRAG: Learning to retrieve and reason for multi-hop QA [10.193015391271535]
RAGメトリクスを改善するために大規模な微調整は必要ない。監督されたRLベースの微調整は、粗悪さの観点からRAGに役立つ。
論文参考訳（メタデータ） (2025-07-10T11:02:13Z)
ReSCORE: Label-free Iterative Retriever Training for Multi-hop Question Answering with Relevance-Consistency Supervision [23.80886911344813]
マルチホップ質問の回答には、複雑な質問に答えるために複数のドキュメントをまたがる推論が含まれる。センスレトリバーは通常、セマンティック埋め込みを利用してBM25のようなスパースメソッドより優れている。 ReSCOREはラベル付き文書を使わずにMHQAの高密度検索を訓練するための新しい手法である。
論文参考訳（メタデータ） (2025-05-27T14:28:24Z)
Toward Optimal Search and Retrieval for RAG [39.69494982983534]
Retrieval-augmented Generation (RAG)は、Large Language Models (LLM)に関連するメモリ関連の課題に対処するための有望な方法である。ここでは、質問回答(QA)などの共通タスクに対して、レトリバーをRAGパイプラインに最適化する方法を理解することを目的としている。
論文参考訳（メタデータ） (2024-11-11T22:06:51Z)
DEXTER: A Benchmark for open-domain Complex Question Answering using LLMs [3.24692739098077]
オープンドメイン複合質問回答 (QA) は証拠検索と推論において難しい課題である。我々は、オープンドメイン設定で、最先端の訓練済み高密度・スパース検索モデルを評価する。 BM25のような遅延相互作用モデルや驚くほど語彙的モデルは、事前訓練された高密度検索モデルと比較してよく機能する。
論文参考訳（メタデータ） (2024-06-24T22:09:50Z)
AGent: A Novel Pipeline for Automatically Creating Unanswerable Questions [10.272000561545331]
我々は、質問を正しい回答に必要な情報を持たないコンテキストで再マッチングすることで、新しい解決不可能な質問を生成する新しいパイプラインであるAGentを提案する。本稿では,SQuAD と HotpotQA の解答可能な質問から2組の解答不可能な質問を生成することにより,この AGent パイプラインの有用性を実証する。
論文参考訳（メタデータ） (2023-09-10T18:13:11Z)
ReFIT: Relevance Feedback from a Reranker during Inference [109.33278799999582]
Retrieve-and-Rerankは、ニューラル情報検索の一般的なフレームワークである。本稿では,リランカを利用してリコールを改善する手法を提案する。
論文参考訳（メタデータ） (2023-05-19T15:30:33Z)
Toward Unsupervised Realistic Visual Question Answering [70.67698100148414]
現実的なVQA(RVQA)の問題について検討し、モデルが答えられない質問(UQ)を拒絶し、答えられる質問(AQ)に答えなければならない。 1)データセットには不整合UQが多すぎること,(2)多数の注釈付きUQがトレーニングに必要とされること,の2つの欠点を最初に指摘した。我々は、既存のVQAデータセットのAQと約29万の人間の注釈付きUQを組み合わせた新しいテストデータセットRGQAを提案する。これは、画像と質問をランダムにペアリングして得られる擬似UQと、それを結合する。
論文参考訳（メタデータ） (2023-03-09T06:58:29Z)
OneStop QAMaker: Extract Question-Answer Pairs from Text in a One-Stop Approach [11.057028572260064]
本論文では,文書からQAペアを生成するOneStopというモデルを提案する。具体的には、質問と対応する回答を同時に抽出する。 OneStopは、複雑なQA生成タスクを解決するために1つのモデルしか必要としないため、産業シナリオでトレーニングやデプロイを行うのがずっと効率的です。
論文参考訳（メタデータ） (2021-02-24T08:45:00Z)
Open Question Answering over Tables and Text [55.8412170633547]
オープンな質問応答(QA)では、質問に対する回答は、質問に対する回答を含む可能性のある文書を検索して分析することによって生成される。ほとんどのオープンQAシステムは、構造化されていないテキストからのみ情報を取得することを検討している。我々は,このタスクの性能を評価するために,新しい大規模データセット Open Table-and-Text Question Answering (OTT-QA) を提案する。
論文参考訳（メタデータ） (2020-10-20T16:48:14Z)
Tradeoffs in Sentence Selection Techniques for Open-Domain Question Answering [54.541952928070344]
文選択のためのモデルの2つのグループについて述べる。QAベースのアプローチは、解答候補を特定するための完全なQAシステムを実行し、検索ベースのモデルは、各質問に特に関連する各節の一部を見つける。非常に軽量なQAモデルは、このタスクではうまく機能するが、検索ベースモデルは高速である。
論文参考訳（メタデータ） (2020-09-18T23:39:15Z)
Answering Any-hop Open-domain Questions with Iterative Document Reranking [62.76025579681472]
オープンドメインの問に答える統合QAフレームワークを提案する。提案手法は,シングルホップおよびマルチホップのオープンドメインQAデータセットにおいて,最先端技術に匹敵する性能を継続的に達成する。
論文参考訳（メタデータ） (2020-09-16T04:31:38Z)
Harvesting and Refining Question-Answer Pairs for Unsupervised QA [95.9105154311491]
教師なし質問回答(QA)を改善するための2つのアプローチを提案する。まず、ウィキペディアから語彙的・構文的に異なる質問を抽出し、質問応答対のコーパスを自動的に構築する(RefQAと名づけられる)。第2に、より適切な回答を抽出するためにQAモデルを活用し、RefQA上でデータを反復的に洗練する。
論文参考訳（メタデータ） (2020-05-06T15:56:06Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。