論文の概要: Robust Domain Adaptation for Machine Reading Comprehension
- arxiv url: http://arxiv.org/abs/2209.11615v1
- Date: Fri, 23 Sep 2022 14:38:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2022-09-26 13:35:54.520794
- Title: Robust Domain Adaptation for Machine Reading Comprehension
- Title(参考訳): 機械読取理解のためのロバスト領域適応
- Authors: Liang Jiang, Zhenyu Huang, Jia Liu, Zujie Wen, Xi Peng
- Abstract要約: 機械読解(MRC)のためのほとんどのドメイン適応手法は、事前学習された質問応答(QA)構築モデルを用いて、MRC転送のための擬似QAペアを生成する。
本稿では,文書に関する対話を付加してQAペアを構築するとともに,新たなドメイン適応手法を提案する。
具体的には、回答抽出器(AE)、質問選択器(QS)、MCCモデルからなるRMRC法を提案する。
- 参考スコア(独自算出の注目度): 24.72142135070801
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most domain adaptation methods for machine reading comprehension (MRC) use a
pre-trained question-answer (QA) construction model to generate pseudo QA pairs
for MRC transfer. Such a process will inevitably introduce mismatched pairs
(i.e., noisy correspondence) due to i) the unavailable QA pairs in target
documents, and ii) the domain shift during applying the QA construction model
to the target domain. Undoubtedly, the noisy correspondence will degenerate the
performance of MRC, which however is neglected by existing works. To solve such
an untouched problem, we propose to construct QA pairs by additionally using
the dialogue related to the documents, as well as a new domain adaptation
method for MRC. Specifically, we propose Robust Domain Adaptation for Machine
Reading Comprehension (RMRC) method which consists of an answer extractor (AE),
a question selector (QS), and an MRC model. Specifically, RMRC filters out the
irrelevant answers by estimating the correlation to the document via the AE,
and extracts the questions by fusing the candidate questions in multiple rounds
of dialogue chats via the QS. With the extracted QA pairs, MRC is fine-tuned
and provides the feedback to optimize the QS through a novel reinforced
self-training method. Thanks to the optimization of the QS, our method will
greatly alleviate the noisy correspondence problem caused by the domain shift.
To the best of our knowledge, this could be the first study to reveal the
influence of noisy correspondence in domain adaptation MRC models and show a
feasible way to achieve robustness to mismatched pairs. Extensive experiments
on three datasets demonstrate the effectiveness of our method.
- Abstract(参考訳): 機械読解(MRC)のためのほとんどのドメイン適応手法は、事前学習された質問応答(QA)構築モデルを用いて、MRC転送のための擬似QAペアを生成する。
このようなプロセスは必然的にミスマッチペア(すなわちノイズ対応)を導入する。
一 対象文書における使用不能なQA対及び
ii) 対象ドメインにqa構築モデルを適用する際のドメインシフト。
間違いなく、騒がしい対応はmrcのパフォーマンスを損なうだろうが、既存の作品では無視されている。
このような非接触問題を解決するために,文書に関連した対話とmrcの新しいドメイン適応法を用いて,qaペアを構築することを提案する。
具体的には、回答抽出器(AE)、質問セレクタ(QS)、MCCモデルからなるRMRC(Robust Domain Adaptation for Machine Reading Comprehension)手法を提案する。
具体的には、RMRCは、文書との相関をAEで推定することで、無関係な回答をフィルタリングし、QSを介して複数の対話チャットで候補者の質問を融合させて質問を抽出する。
抽出したQAペアを用いて、CRCを微調整し、新しい強化自己学習法によりQSを最適化するフィードバックを提供する。
提案手法は,QSの最適化により,ドメインシフトによるノイズ対応問題を大幅に軽減する。
我々の知る限り、この研究はドメイン適応型MRCモデルにおけるノイズ対応の影響を初めて明らかにし、ミスマッチしたペアに対して堅牢性を達成するための実現可能な方法を示すかもしれない。
3つのデータセットに対する大規模な実験により,本手法の有効性が示された。
関連論文リスト
- Uncertainty Quantification in Retrieval Augmented Question Answering [57.05827081638329]
本稿では,QAモデルが備える通路の有効性を推定することで,QAモデルの不確実性を定量化する。
我々は、目標QAモデルの通過効率を予測するために軽量ニューラルネットワークを訓練し、単純な情報理論のメトリクスが解の正しさをある程度予測できる一方で、より高価なサンプリングベースの手法を効率的に近似または上回ることを示す。
論文 参考訳(メタデータ) (2025-02-25T11:24:52Z) - Noisy Pair Corrector for Dense Retrieval [59.312376423104055]
ノイズペアコレクタ(NPC)と呼ばれる新しい手法を提案する。
NPCは検出モジュールと修正モジュールから構成される。
我々は,テキスト検索ベンチマークのNatural QuestionとTriviaQA,コード検索ベンチマークのStaQCとSO-DSで実験を行った。
論文 参考訳(メタデータ) (2023-11-07T08:27:14Z) - Merging Generated and Retrieved Knowledge for Open-Domain QA [72.42262579925911]
COMBOは、より良いオープンドメインQAフレームワークのための互換性指向の知識の融合である。
COMBOは4つのテスト済みオープンドメインQAベンチマークのうち3つで競合ベースラインを上回っていることを示す。
論文 参考訳(メタデータ) (2023-10-22T19:37:06Z) - Open-domain Question Answering via Chain of Reasoning over Heterogeneous
Knowledge [82.5582220249183]
異種知識ソース間のシングル/マルチホップ質問に応答する新しいオープンドメイン質問応答(ODQA)フレームワークを提案する。
分離された証拠を収集するためにレトリバーにのみ依存する従来の方法とは異なり、我々の仲介者は検索された集合に対する推論の連鎖を実行する。
本システムは,2つのODQAデータセットであるOTT-QAとNQに対して,Wikipediaの表や節に対する競合性能を実現する。
論文 参考訳(メタデータ) (2022-10-22T03:21:32Z) - On the Impact of Speech Recognition Errors in Passage Retrieval for
Spoken Question Answering [13.013751306590303]
合成ASR雑音に対する語彙・高密度レトリバーのロバスト性について検討した。
我々は,人間の声による質問を含む新しいデータセットを作成し,その書き起こしを用いて,合成ASRノイズの代わりに自然なASRノイズを扱う場合に,検索性能がさらに劣化することを示す。
論文 参考訳(メタデータ) (2022-09-26T18:29:36Z) - Domain Adaptation for Question Answering via Question Classification [8.828396559882954]
質問回答のための質問分類(QC4QA)という新しい枠組みを提案する。
最適化のために、ソースとターゲットドメイン間のドメイン間不一致を最大平均不一致(MMD)距離で低減する。
提案したQC4QAの有効性を,複数のデータセットの最先端ベースラインに対して一貫した改善により示す。
論文 参考訳(メタデータ) (2022-09-12T03:12:02Z) - OneStop QAMaker: Extract Question-Answer Pairs from Text in a One-Stop
Approach [11.057028572260064]
本論文では,文書からQAペアを生成するOneStopというモデルを提案する。
具体的には、質問と対応する回答を同時に抽出する。
OneStopは、複雑なQA生成タスクを解決するために1つのモデルしか必要としないため、産業シナリオでトレーニングやデプロイを行うのがずっと効率的です。
論文 参考訳(メタデータ) (2021-02-24T08:45:00Z) - Tradeoffs in Sentence Selection Techniques for Open-Domain Question
Answering [54.541952928070344]
文選択のためのモデルの2つのグループについて述べる。QAベースのアプローチは、解答候補を特定するための完全なQAシステムを実行し、検索ベースのモデルは、各質問に特に関連する各節の一部を見つける。
非常に軽量なQAモデルは、このタスクではうまく機能するが、検索ベースモデルは高速である。
論文 参考訳(メタデータ) (2020-09-18T23:39:15Z) - Answering Any-hop Open-domain Questions with Iterative Document
Reranking [62.76025579681472]
オープンドメインの問に答える統合QAフレームワークを提案する。
提案手法は,シングルホップおよびマルチホップのオープンドメインQAデータセットにおいて,最先端技術に匹敵する性能を継続的に達成する。
論文 参考訳(メタデータ) (2020-09-16T04:31:38Z) - Generating Diverse and Consistent QA pairs from Contexts with
Information-Maximizing Hierarchical Conditional VAEs [62.71505254770827]
非構造化テキストを文脈として与えられたQAペアを生成するための条件付き変分オートエンコーダ(HCVAE)を提案する。
我々のモデルは、トレーニングにわずかなデータしか使わず、両方のタスクの全てのベースラインに対して印象的なパフォーマンス向上が得られる。
論文 参考訳(メタデータ) (2020-05-28T08:26:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。