論文の概要: Synthetic Target Domain Supervision for Open Retrieval QA
- arxiv url: http://arxiv.org/abs/2204.09248v1
- Date: Wed, 20 Apr 2022 06:28:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-21 23:04:21.091962
- Title: Synthetic Target Domain Supervision for Open Retrieval QA
- Title(参考訳): オープン検索QAのための合成ターゲットドメインスーパービジョン
- Authors: Revanth Gangi Reddy, Bhavani Iyer, Md Arafat Sultan, Rong Zhang,
Avirup Sil, Vittorio Castelli, Radu Florian, Salim Roukos
- Abstract要約: Dense Passage Retriever(DPR)を、新型コロナウイルス(COVID-19)などの閉鎖的かつ特殊なターゲットドメインでストレステストする。
DPRは、この重要な現実世界設定において、標準BM25より遅れている。
実験では、このうるさいが完全に自動化されたターゲットドメインの監視により、DPRはBM25よりも大きな利点がある。
- 参考スコア(独自算出の注目度): 24.48364368847857
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Neural passage retrieval is a new and promising approach in open retrieval
question answering. In this work, we stress-test the Dense Passage Retriever
(DPR) -- a state-of-the-art (SOTA) open domain neural retrieval model -- on
closed and specialized target domains such as COVID-19, and find that it lags
behind standard BM25 in this important real-world setting. To make DPR more
robust under domain shift, we explore its fine-tuning with synthetic training
examples, which we generate from unlabeled target domain text using a
text-to-text generator. In our experiments, this noisy but fully automated
target domain supervision gives DPR a sizable advantage over BM25 in
out-of-domain settings, making it a more viable model in practice. Finally, an
ensemble of BM25 and our improved DPR model yields the best results, further
pushing the SOTA for open retrieval QA on multiple out-of-domain test sets.
- Abstract(参考訳): ニューラルパス検索はオープン検索質問応答における新しい,有望なアプローチである。
本研究では、COVID-19のような閉鎖的で特殊なターゲットドメイン上で、最先端(SOTA)オープンドメインニューラル検索モデルであるDense Passage Retriever(DPR)をストレステストし、この重要な現実の環境で標準BM25を遅れていることを確認する。
ドメインシフト下でdprをより堅牢にするために、テキストからテキストへのジェネレータを使用して、ラベルなしのターゲットドメインテキストから生成する合成トレーニング例を用いて、その微調整を探求する。
我々の実験では、この騒々しいが完全に自動化されたターゲットドメインの監視により、DPRはドメイン外の設定でBM25よりも大きなアドバンテージが得られる。
最後に、BM25のアンサンブルと改良されたDPRモデルにより、複数のドメイン外テストセット上でのオープン検索QAのためのSOTAをさらに推し進める。
関連論文リスト
- Quality > Quantity: Synthetic Corpora from Foundation Models for
Closed-Domain Extractive Question Answering [35.38140071573828]
閉領域内での抽出的質問応答について検討し,対象とする事前学習の概念を紹介する。
提案フレームワークはGalacticaを用いて,特定の書体スタイルやトピックに合わせて合成された「ターゲット」コーパスを生成する。
論文 参考訳(メタデータ) (2023-10-25T20:48:16Z) - Self-training through Classifier Disagreement for Cross-Domain Opinion
Target Extraction [62.41511766918932]
オピニオンターゲット抽出(OTE)またはアスペクト抽出(AE)は意見マイニングの基本的な課題である。
最近の研究は、現実世界のシナリオでよく見られるクロスドメインのOTEに焦点を当てている。
そこで本稿では,ドメイン固有の教師と学生のネットワークから出力されるモデルが未学習のターゲットデータと一致しない対象サンプルを選択するためのSSLアプローチを提案する。
論文 参考訳(メタデータ) (2023-02-28T16:31:17Z) - To Adapt or to Annotate: Challenges and Interventions for Domain
Adaptation in Open-Domain Question Answering [46.403929561360485]
オープンドメイン質問応答(ODQA)のエンドツーエンドモデルの性能について検討する。
モデルが一般化に失敗するだけでなく、高い検索スコアが解答予測の精度を低下させることもしばしばある。
終末回答F1のスコアを最大24ポイント改善するいくつかの介入手法を提案し,評価する。
論文 参考訳(メタデータ) (2022-12-20T16:06:09Z) - Domain-Agnostic Prior for Transfer Semantic Segmentation [197.9378107222422]
教師なしドメイン適応(UDA)はコンピュータビジョンコミュニティにおいて重要なトピックである。
ドメインに依存しない事前学習(DAP)を用いてドメイン間表現学習を規則化する機構を提案する。
我々の研究は、UDAがより良いプロキシ、おそらく他のデータモダリティの恩恵を受けていることを明らかにしている。
論文 参考訳(メタデータ) (2022-04-06T09:13:25Z) - Amplitude Spectrum Transformation for Open Compound Domain Adaptive
Semantic Segmentation [62.68759523116924]
オープン化合物ドメイン適応(OCDA)は、実用的な適応セットとして現れている。
我々は、新しい特徴空間振幅スペクトル変換(AST)を提案する。
論文 参考訳(メタデータ) (2022-02-09T05:40:34Z) - Unsupervised Domain Generalization for Person Re-identification: A
Domain-specific Adaptive Framework [50.88463458896428]
ドメイン一般化(DG)は近年,人物再同定(ReID)において注目されている。
既存のメソッドは通常、ソースドメインにラベルを付ける必要があります。
本稿では、単純で効率的なドメイン固有適応化フレームワークを提案し、適応正規化モジュールで実現する。
論文 参考訳(メタデータ) (2021-11-30T02:35:51Z) - Zero-Shot Dense Retrieval with Momentum Adversarial Domain Invariant
Representations [24.703464680511154]
我々はMoDIR(Momentum adversarial Domain Invariant Representation Learning)を提案する。
MoDIRはソースとターゲットを区別するドメイン分類器を訓練し、DRエンコーダを逆更新してドメイン不変表現を学習する。
実験の結果,MoDIR はゼロショット設定で BEIR ベンチマークから 10 以上のランキングデータセットのベースラインを頑健に上回っていることがわかった。
論文 参考訳(メタデータ) (2021-10-14T17:45:06Z) - Discover, Hallucinate, and Adapt: Open Compound Domain Adaptation for
Semantic Segmentation [91.30558794056056]
意味的セグメンテーションのための教師なしドメイン適応(UDA)が近年注目を集めている。
我々は,発見,幻覚,適応の3つの主要な設計原則に基づく新しいフレームワークを提案する。
我々は、標準ベンチマークGTAからC自動運転へのソリューションの評価を行い、新しい最先端の結果を得た。
論文 参考訳(メタデータ) (2021-10-08T13:20:09Z) - End-to-End QA on COVID-19: Domain Adaptation with Synthetic Training [13.731352294133211]
エンドツーエンドの質問応答には、情報検索と機械読解の両方が必要である。
最近の研究は、オープンドメインデータセットからの教師付き質問応答(QA)例のみを使用して、ニューラルIRシステムのトレーニングに成功した。
われわれのニューラルIRとMRCシステムを組み合わせて、CORD-19コレクションのエンドツーエンドQAを大幅に改善した。
論文 参考訳(メタデータ) (2020-12-02T18:59:59Z) - Dense Passage Retrieval for Open-Domain Question Answering [49.028342823838486]
本研究では,高密度表現のみを用いて検索を実践可能であることを示す。
我々の高密度レトリバーは、上位20経路の精度で9%-19%の絶対値で強力なルセンゼ-BM25システムより優れています。
論文 参考訳(メタデータ) (2020-04-10T04:53:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。