論文の概要: Contrastive Domain Adaptation for Question Answering using Limited Text
Corpora
- arxiv url: http://arxiv.org/abs/2108.13854v1
- Date: Tue, 31 Aug 2021 14:05:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-01 14:38:34.325306
- Title: Contrastive Domain Adaptation for Question Answering using Limited Text
Corpora
- Title(参考訳): 限定テキストコーパスを用いた質問応答に対するコントラスト的ドメイン適応
- Authors: Zhenrui Yue, Bernhard Kratzwald, Stefan Feuerriegel
- Abstract要約: 本稿では,QAに対するコントラッシブ・ドメイン適応という,ドメイン適応のための新しいフレームワークを提案する。
特に、CAQAは、質問生成とドメイン不変学習の技法を組み合わせて、限られたテキストコーパスでドメイン外質問に答える。
- 参考スコア(独自算出の注目度): 20.116147632481983
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Question generation has recently shown impressive results in customizing
question answering (QA) systems to new domains. These approaches circumvent the
need for manually annotated training data from the new domain and, instead,
generate synthetic question-answer pairs that are used for training. However,
existing methods for question generation rely on large amounts of synthetically
generated datasets and costly computational resources, which render these
techniques widely inaccessible when the text corpora is of limited size. This
is problematic as many niche domains rely on small text corpora, which
naturally restricts the amount of synthetic data that can be generated. In this
paper, we propose a novel framework for domain adaptation called contrastive
domain adaptation for QA (CAQA). Specifically, CAQA combines techniques from
question generation and domain-invariant learning to answer out-of-domain
questions in settings with limited text corpora. Here, we train a QA system on
both source data and generated data from the target domain with a contrastive
adaptation loss that is incorporated in the training objective. By combining
techniques from question generation and domain-invariant learning, our model
achieved considerable improvements compared to state-of-the-art baselines.
- Abstract(参考訳): 質問生成は、最近、新しいドメインに質問応答(qa)システムをカスタマイズする素晴らしい結果を示している。
これらのアプローチは、新しいドメインから手動でアノテートされたトレーニングデータの必要性を回避し、代わりにトレーニングに使用される合成質問応答ペアを生成する。
しかし、既存の質問生成手法は、大量の合成データセットとコストのかかる計算資源に依存しており、テキストコーパスが限られたサイズであれば、これらの技術は広くアクセスできない。
多くのニッチドメインが小さなテキストコーパスに依存しており、生成可能な合成データの量を自然に制限しているため、これは問題である。
本稿では,CAQA(Contrative Domain adapt for QA)という,ドメイン適応のための新しいフレームワークを提案する。
特に、CAQAは、質問生成とドメイン不変学習の技法を組み合わせて、限られたテキストコーパスでドメイン外質問に答える。
ここでは、トレーニング目的に組み込まれた対照的な適応損失で、ソースデータとターゲットドメインから生成されたデータの両方に基づいて、QAシステムをトレーニングする。
質問生成とドメイン不変学習の技法を組み合わせることで、我々のモデルは最先端のベースラインに比べて大幅に改善された。
関連論文リスト
- Improving Retrieval Augmented Open-Domain Question-Answering with Vectorized Contexts [83.57864140378035]
本稿では,オープンドメイン質問応答タスクにおいて,より長いコンテキストをカバーできる手法を提案する。
コンテキストを効果的にエンコードする小さなエンコーダ言語モデルを利用し、エンコーダは元の入力とクロスアテンションを適用する。
微調整後、2つのホールドインデータセット、4つのホールドアウトデータセット、および2つのIn Context Learning設定のパフォーマンスが改善された。
論文 参考訳(メタデータ) (2024-04-02T15:10:11Z) - Combining Data Generation and Active Learning for Low-Resource Question Answering [23.755283239897132]
低リソース環境での性能向上を図るために,質問応答生成によるデータ拡張とアクティブラーニングを組み合わせた新しい手法を提案する。
我々の新しいアプローチは、人間がデータ生成アプローチに組み込まれることで、低リソースでドメイン固有の設定のパフォーマンスが向上することを示している。
論文 参考訳(メタデータ) (2022-11-27T16:31:33Z) - QA Domain Adaptation using Hidden Space Augmentation and Self-Supervised
Contrastive Adaptation [24.39026345750824]
質問応答(QA)は、最近、カスタマイズされたドメインからの質問に答えるための印象的な結果を示している。
しかし、一般的な課題は、QAモデルを目に見えないターゲットドメインに適応させることである。
我々はQAドメイン適応のためのQADAと呼ばれる新しい自己教師型フレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-19T19:52:57Z) - Domain Adaptation for Question Answering via Question Classification [8.828396559882954]
質問回答のための質問分類(QC4QA)という新しい枠組みを提案する。
最適化のために、ソースとターゲットドメイン間のドメイン間不一致を最大平均不一致(MMD)距離で低減する。
提案したQC4QAの有効性を,複数のデータセットの最先端ベースラインに対して一貫した改善により示す。
論文 参考訳(メタデータ) (2022-09-12T03:12:02Z) - Unsupervised and self-adaptative techniques for cross-domain person
re-identification [82.54691433502335]
非重複カメラにおける人物再識別(ReID)は難しい課題である。
Unsupervised Domain Adaptation(UDA)は、ソースで訓練されたモデルから、IDラベルアノテーションなしでターゲットドメインへの機能学習適応を実行するため、有望な代替手段です。
本稿では,新しいオフライン戦略によって生成されたサンプルのトリプレットを利用する,UDAベースのReID手法を提案する。
論文 参考訳(メタデータ) (2021-03-21T23:58:39Z) - AGenT Zero: Zero-shot Automatic Multiple-Choice Question Generation for
Skill Assessments [11.355397923795488]
マルチチョイス質問(MCQ)は、仮想教育と求職の時代に最も有望なスキル評価の道を提供する。
自然言語処理の最近の進歩は、多くの複雑な質問生成手法を生み出している。
AGenT Zeroは、他のトレーニング済みメソッドよりも、流布やセマンティックな類似性が優れている。
論文 参考訳(メタデータ) (2020-11-25T04:06:57Z) - ClarQ: A large-scale and diverse dataset for Clarification Question
Generation [67.1162903046619]
そこで我々は,スタックエクスチェンジから抽出したポストコメンデーションに基づいて,多様な,大規模な明確化質問データセットの作成を支援する,新しいブートストラップフレームワークを考案した。
質問応答の下流タスクに適用することで,新たに作成したデータセットの有用性を定量的に示す。
我々はこのデータセットを公開し、ダイアログと質問応答システムの拡張という大きな目標を掲げて、質問生成の分野の研究を促進する。
論文 参考訳(メタデータ) (2020-06-10T17:56:50Z) - Generating Diverse and Consistent QA pairs from Contexts with
Information-Maximizing Hierarchical Conditional VAEs [62.71505254770827]
非構造化テキストを文脈として与えられたQAペアを生成するための条件付き変分オートエンコーダ(HCVAE)を提案する。
我々のモデルは、トレーニングにわずかなデータしか使わず、両方のタスクの全てのベースラインに対して印象的なパフォーマンス向上が得られる。
論文 参考訳(メタデータ) (2020-05-28T08:26:06Z) - Knowledge Graph Simple Question Answering for Unseen Domains [9.263766921991452]
我々は新しいドメインに適用可能なデータ中心のドメイン適応フレームワークを提案する。
遠方からの監視を用いて、未確認領域のそれぞれの関係を表すキーワードの集合を抽出する。
我々のフレームワークはゼロショットベースラインを大幅に改善し、ドメイン間で堅牢です。
論文 参考訳(メタデータ) (2020-05-25T11:34:54Z) - Robust Question Answering Through Sub-part Alignment [53.94003466761305]
我々はアライメント問題として質問応答をモデル化する。
私たちは、SQuAD v1.1でモデルをトレーニングし、いくつかの逆および外ドメインデータセットでそれをテストします。
論文 参考訳(メタデータ) (2020-04-30T09:10:57Z) - ManyModalQA: Modality Disambiguation and QA over Diverse Inputs [73.93607719921945]
本稿では, エージェントが3つの異なるモダリティを考慮し, 質問に答えなければならない, マルチモーダルな質問応答課題, ManyModalQAを提案する。
われわれはウィキペディアをスクラップしてデータを収集し、クラウドソーシングを利用して質問と回答のペアを収集する。
論文 参考訳(メタデータ) (2020-01-22T14:39:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。