論文の概要: Revisiting Dense Retrieval with Unanswerable Counterfactuals
- arxiv url: http://arxiv.org/abs/2304.03031v1
- Date: Thu, 6 Apr 2023 12:42:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-07 14:18:40.663868
- Title: Revisiting Dense Retrieval with Unanswerable Counterfactuals
- Title(参考訳): 不可解な対策による難易度検索の再検討
- Authors: Yongho Song, Dahyun Lee, Kyungjae Lee, Jinyeong Yeo
- Abstract要約: オープンドメイン質問応答(ODQA)に人気があるレトリバーリーダーフレームワーク
検索者からの高関連度スコアは、読者からの高い回答可能性を示す可能性が高い。
近年のDPRに基づく高密度検索モデルでは、解答不可能な対実パスが解答可能な元のパスよりも高くランク付けされていることが多い。
- 参考スコア(独自算出の注目度): 4.175469946877106
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The retriever-reader framework is popular for open-domain question answering
(ODQA), where a retriever samples for the reader a set of relevant candidate
passages from a large corpus. A key assumption behind this method is that high
relevance scores from the retriever likely indicate high answerability from the
reader, which implies a high probability that the retrieved passages contain
answers to a given question. In this work, we empirically dispel this belief
and observe that recent dense retrieval models based on DPR often rank
unanswerable counterfactual passages higher than their answerable original
passages. To address such answer-unawareness in dense retrievers, we seek to
use counterfactual samples as additional training resources to better
synchronize the relevance measurement of DPR with the answerability of
question-passage pairs. Specifically, we present counterfactually-Pivoting
Contrastive Learning (PiCL), a novel representation learning approach for
passage retrieval that leverages counterfactual samples as pivots between
positive and negative samples in their learned embedding space. We incorporate
PiCL into the retriever training to show the effectiveness of PiCL on ODQA
benchmarks and the robustness of the learned models.
- Abstract(参考訳): retriever-readerフレームワークはopen-domain question answering(odqa)で人気があり、レトリバーが読者に対して、大きなコーパスから関連する候補パスのセットをサンプリングする。
この手法の背景にある重要な前提は、検索者からの高関連度スコアは、読者からの高い応答可能性を示す可能性があり、検索されたパスが与えられた質問に対する回答を含む確率が高いということである。
本研究では,この信念を実証的に否定し,dprに基づく近年の密集した検索モデルが,解答可能な原文よりも不都合な偽文を上位にランク付けすることが多いことを観察する。
本研究では,dprの関連度測定と質問・回答対の対応性との同期性を高めるために,非実例を付加的な学習資源として活用する。
具体的には, 逆実例を学習空間における正と負のサンプルのピボットとして活用する, 経路探索のための新しい表現学習手法PiCLを提案する。
我々は, ODQAベンチマークにおけるPiCLの有効性と学習モデルの堅牢性を示すために, 検索学習にPiCLを組み込んだ。
関連論文リスト
- Passage-specific Prompt Tuning for Passage Reranking in Question Answering with Large Language Models [11.716595438057997]
オープンドメイン質問応答(PSPT)における再ランク付けのためのパス固有プロンプトチューニングを提案する。
PSPTは、学習可能なパス固有のソフトプロンプトを微調整するパラメータ効率の手法である。
我々は,Llama-2-chat-7Bモデルを用いた3つの公開領域質問応答データセットの広範な実験を行った。
論文 参考訳(メタデータ) (2024-05-31T07:43:42Z) - Improving Zero-shot Reader by Reducing Distractions from Irrelevant
Documents in Open-Domain Question Answering [10.794156033638984]
大規模言語モデル(LLM)は、オープンドメイン質問応答(ODQA)におけるゼロショットアプローチを可能にする
本研究の目的は,計算コストの課題とラベル付きデータの必要性に対処するゼロショットリーダの実現性である。
論文 参考訳(メタデータ) (2023-10-26T15:45:12Z) - Strong and Efficient Baselines for Open Domain Conversational Question
Answering [2.773656427800412]
The State-of-the-Art (SotA) Dense Passage Retrieval (DPR) retriever and Fusion-in-Decoder (FiD) reader pipeline。
本稿では,レシーバとリーダの間に高速なリグレードコンポーネントを導入することで,強力でシンプルで効率的なベースラインを提案し,評価する。
TopiOCQA と OR-QuAC という2つの ODConvQA タスクの実験により,本手法が SotA 結果を改善するとともに,読み出し遅延を60%削減することを示した。
論文 参考訳(メタデータ) (2023-10-23T08:48:14Z) - On the Universal Adversarial Perturbations for Efficient Data-free
Adversarial Detection [55.73320979733527]
本稿では,UAPに対して正常サンプルと逆サンプルの異なる応答を誘導する,データに依存しない逆検出フレームワークを提案する。
実験結果から,本手法は様々なテキスト分類タスクにおいて,競合検出性能を実現することが示された。
論文 参考訳(メタデータ) (2023-06-27T02:54:07Z) - Passage-Mask: A Learnable Regularization Strategy for Retriever-Reader
Models [36.58955176223759]
Retriever-Readerモデルは、オープン質問応答や対話会話など、多くの異なるNLPタスク間での競合的なパフォーマンスを実現する。
学習可能なパスマスク機構を導入し、トップランクの検索パスからの影響を減らし、モデルが過度に適合しないようにする。
論文 参考訳(メタデータ) (2022-11-02T06:39:46Z) - PReGAN: Answer Oriented Passage Ranking with Weakly Supervised GAN [34.96355889356033]
本稿では,ジェネレーティブ・ディバイサル・ニューラル・ネットワークに基づくパッセージ・リグレードのためのtttPReGANという手法を提案する。
ゴールは、ジェネレータに、トポロジ的に関係があり、答えを含むパスを高くランクさせることである。
論文 参考訳(メタデータ) (2022-07-05T01:43:35Z) - A Unified End-to-End Retriever-Reader Framework for Knowledge-based VQA [67.75989848202343]
本稿では,知識に基づくVQAに向けて,エンド・ツー・エンドのレトリバー・リーダー・フレームワークを提案する。
我々は、視覚言語による事前学習モデルからの多モーダルな暗黙の知識に光を当て、知識推論の可能性を掘り下げた。
提案手法では,知識検索のガイダンスを提供するだけでなく,質問応答に対してエラーが発生しやすいケースも排除できる。
論文 参考訳(メタデータ) (2022-06-30T02:35:04Z) - Joint Passage Ranking for Diverse Multi-Answer Retrieval [56.43443577137929]
質問に対する複数の異なる回答をカバーするために、パスの取得を必要とする探索不足の問題であるマルチアンサー検索について検討する。
モデルが別の有効な答えを逃す費用で同じ答えを含む通路を繰り返すべきではないので、このタスクは、検索された通路の共同モデリングを必要とします。
本稿では,再順位に着目したジョイントパス検索モデルであるJPRを紹介する。
回収された通路の合同確率をモデル化するために、JPRは、新しい訓練および復号アルゴリズムを備えた通路のシーケンスを選択する自動回帰リタイナを利用する。
論文 参考訳(メタデータ) (2021-04-17T04:48:36Z) - A Graph-guided Multi-round Retrieval Method for Conversational
Open-domain Question Answering [52.041815783025186]
本稿では,会話のターン間の回答間の関係をモデル化するグラフ誘導検索手法を提案する。
また,検索コンテキストが現在の質問理解に与える影響を検討するために,マルチラウンド関連フィードバック手法を導入することを提案する。
論文 参考訳(メタデータ) (2021-04-17T04:39:41Z) - Complementary Evidence Identification in Open-Domain Question Answering [66.17954897343456]
オープンドメイン質問応答(QA)における補完的証拠識別の新しい問題を提案する。
この問題は、複雑な質問に答えるために、複数の側面から完全な証拠をカバーする小さな通路を効率的に見つけることを目指しています。
論文 参考訳(メタデータ) (2021-03-22T08:04:50Z) - Mining Implicit Relevance Feedback from User Behavior for Web Question
Answering [92.45607094299181]
本研究は,ユーザ行動と通過関連性との関連性を検討するための最初の研究である。
提案手法は,追加のラベル付きデータを使わずにパスランキングの精度を大幅に向上させる。
実際にこの研究は、グローバルな商用検索エンジンにおけるQAサービスの人為的ラベリングコストを大幅に削減する効果が証明されている。
論文 参考訳(メタデータ) (2020-06-13T07:02:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。