論文の概要: DaNetQA: a yes/no Question Answering Dataset for the Russian Language
- arxiv url: http://arxiv.org/abs/2010.02605v2
- Date: Thu, 15 Oct 2020 10:36:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-10 07:42:13.738911
- Title: DaNetQA: a yes/no Question Answering Dataset for the Russian Language
- Title(参考訳): danetqa: ロシア語のためのyes/no質問応答データセット
- Authors: Taisia Glushkova and Alexey Machnev and Alena Fenogenova and Tatiana
Shavrina and Ekaterina Artemova and Dmitry I. Ignatov
- Abstract要約: 新しい質問回答コーパスであるDaNetQAは以下の通りである(Clarkなどの設計: 自然のイエス/ノーの質問を含む)。
各質問は、Wikipediaの段落と、その段落から派生した回答とがペアリングされる。
課題は、質問と段落の両方を入力として取り、イエス/ノーの回答、すなわちバイナリ出力を生成することである。
- 参考スコア(独自算出の注目度): 4.33757980378616
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: DaNetQA, a new question-answering corpus, follows (Clark et. al, 2019)
design: it comprises natural yes/no questions. Each question is paired with a
paragraph from Wikipedia and an answer, derived from the paragraph. The task is
to take both the question and a paragraph as input and come up with a yes/no
answer, i.e. to produce a binary output. In this paper, we present a
reproducible approach to DaNetQA creation and investigate transfer learning
methods for task and language transferring. For task transferring we leverage
three similar sentence modelling tasks: 1) a corpus of paraphrases,
Paraphraser, 2) an NLI task, for which we use the Russian part of XNLI, 3)
another question answering task, SberQUAD. For language transferring we use
English to Russian translation together with multilingual language fine-tuning.
- Abstract(参考訳): 新しい質問回答コーパスであるDaNetQAは、(Clark et. al, 2019)設計に従っている。
各質問は、Wikipediaの段落と、その段落から派生した回答とがペアリングされる。
課題は、質問と段落の両方を入力として取り、イエス/ノーの回答、すなわちバイナリ出力を生成することである。
本稿では,danetqa作成のための再現可能なアプローチを提案し,タスクと言語変換のためのトランスファー学習手法について検討する。
タスク転送には3つの類似した文モデリングタスクを利用する。
1) パラフレーズ,パラフレーズのコーパス
2) XNLI のロシア語部分を使用する NLI タスク。
3)別の質問応答タスク、SberQUAD。
言語伝達には、英語からロシア語への翻訳と、多言語言語の微調整を用いる。
関連論文リスト
- OMoS-QA: A Dataset for Cross-Lingual Extractive Question Answering in a German Migration Context [4.39796591456426]
OMoS-QAは、信頼できる文書と手動の注釈付き回答とを組み合わせた、ドイツ語と英語の質問のデータセットである。
質問はオープンソースの大言語モデル(LLM)で自動的に生成され、回答文は群衆労働者によって選択される。
回答文の選択には高精度で低中間のリコールがあり、これは誤解を招くユーザーを避けるための好都合なトレードオフである。
論文 参考訳(メタデータ) (2024-07-22T15:40:17Z) - From Multiple-Choice to Extractive QA: A Case Study for English and Arabic [51.13706104333848]
既存の多言語データセットを新しいNLPタスクに再利用する可能性について検討する。
本稿では,英語および現代標準アラビア語に対するアノテーションガイドラインと並列EQAデータセットを提案する。
我々は、残りの120のBELEBELE言語変種に対して、他の人が我々のアプローチを適用するのを助けることを目指しており、その多くがリソース不足と見なされている。
論文 参考訳(メタデータ) (2024-04-26T11:46:05Z) - Improving Question Generation with Multi-level Content Planning [70.37285816596527]
本稿では、与えられたコンテキストと回答から質問を生成する問題に対処し、特に拡張されたコンテキストをまたいだマルチホップ推論を必要とする質問に焦点をあてる。
具体的には、キーフレーズを同時に選択して完全な回答を生成するFA-modelと、生成した全回答を付加的な入力として取り込んだQ-modelの2つのコンポーネントを含む。
論文 参考訳(メタデータ) (2023-10-20T13:57:01Z) - PAXQA: Generating Cross-lingual Question Answering Examples at Training
Scale [53.92008514395125]
PAXQA(クロスリンガル(x)QAのアノテーションの計画)は、クロスリンガルQAを2段階に分解する。
本稿では、並列ビットから制約されたエンティティを抽出する語彙制約機械翻訳の新たな利用法を提案する。
これらのデータセットに基づいて微調整されたモデルは、複数の抽出されたQAデータセット上で、先行合成データ生成モデルより優れていることを示す。
論文 参考訳(メタデータ) (2023-04-24T15:46:26Z) - Bridging the Language Gap: Knowledge Injected Multilingual Question
Answering [19.768708263635176]
本稿では,異なる言語を理解するモデルの能力を高めるために,一般化された言語間移動フレームワークを提案する。
実世界のデータセット MLQA に対する実験結果から,提案手法は大きなマージンで性能を向上できることが示された。
論文 参考訳(メタデータ) (2023-04-06T15:41:25Z) - Applying Multilingual Models to Question Answering (QA) [0.0]
本研究では,英語,フィンランド語,日本語の3言語を対象とした質問応答課題(QA)に基づいて,単言語および多言語言語モデルの性能について検討する。
我々は,(1)質問が応答可能かどうかを判断するタスクのモデルを開発し,(2)IOBタグを用いたコンテキスト内の回答テキストを識別する。
論文 参考訳(メタデータ) (2022-12-04T21:58:33Z) - Automated question generation and question answering from Turkish texts
using text-to-text transformers [1.5749416770494706]
我々は、QA、QG、解答抽出タスクのためのマルチタスク設定において、多言語T5(mT5)変換器を微調整する。
これは、トルコ語のテキストからテキストからテキストへの質問の自動生成を試みている最初の学術研究である。
論文 参考訳(メタデータ) (2021-11-11T22:00:45Z) - Multilingual Answer Sentence Reranking via Automatically Translated Data [97.98885151955467]
本稿では,現代の質問応答システム(QA)のコアコンポーネントである,多言語回答文選択(AS2)モデルの設計について述べる。
主なアイデアは、あるリソースリッチ言語(英語など)から、他の言語へのデータ転送であり、リソースの観点からはよりリッチである。
論文 参考訳(メタデータ) (2021-02-20T03:52:08Z) - XOR QA: Cross-lingual Open-Retrieval Question Answering [75.20578121267411]
この作業は、言語横断的な設定に応答するオープン検索の質問を拡張します。
我々は,同じ回答を欠いた質問に基づいて,大規模なデータセットを構築した。
論文 参考訳(メタデータ) (2020-10-22T16:47:17Z) - Inquisitive Question Generation for High Level Text Comprehension [60.21497846332531]
InQUISITIVEは、文書を読みながら19K質問を抽出するデータセットである。
我々は,読者が情報を求めるための実践的な戦略に携わることを示す。
我々は, GPT-2に基づく質問生成モデルを評価し, 妥当な質問を生成することができることを示す。
論文 参考訳(メタデータ) (2020-10-04T19:03:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。