論文の概要: DTW at Qur'an QA 2022: Utilising Transfer Learning with Transformers for
Question Answering in a Low-resource Domain
- arxiv url: http://arxiv.org/abs/2205.06025v1
- Date: Thu, 12 May 2022 11:17:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-13 20:01:05.835019
- Title: DTW at Qur'an QA 2022: Utilising Transfer Learning with Transformers for
Question Answering in a Low-resource Domain
- Title(参考訳): dtw at qur'an qa 2022: 低リソースドメインにおける質問応答のためのトランスフォーマーによる転送学習の活用
- Authors: Damith Premasiri, Tharindu Ranasinghe, Wajdi Zaghouani, Ruslan Mitkov
- Abstract要約: 機械読解に関する研究は、宗教文書を含むいくつかの領域で研究されている。
QA 2022の共通課題の目標は、このギャップを埋めることである。
- 参考スコア(独自算出の注目度): 10.172732008860539
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The task of machine reading comprehension (MRC) is a useful benchmark to
evaluate the natural language understanding of machines. It has gained
popularity in the natural language processing (NLP) field mainly due to the
large number of datasets released for many languages. However, the research in
MRC has been understudied in several domains, including religious texts. The
goal of the Qur'an QA 2022 shared task is to fill this gap by producing
state-of-the-art question answering and reading comprehension research on
Qur'an. This paper describes the DTW entry to the Quran QA 2022 shared task.
Our methodology uses transfer learning to take advantage of available Arabic
MRC data. We further improve the results using various ensemble learning
strategies. Our approach provided a partial Reciprocal Rank (pRR) score of 0.49
on the test set, proving its strong performance on the task.
- Abstract(参考訳): 機械読解(MRC)の課題は,機械の自然言語理解を評価する上で有用なベンチマークである。
自然言語処理(NLP)分野では、主に多くの言語でリリースされた大量のデータセットのために人気を集めている。
しかし、mrcの研究は宗教文献を含むいくつかの領域で研究されている。
qur'an qa 2022の共通タスクの目的は、qur'anに関する最先端の質問応答と理解研究を提供することで、このギャップを埋めることである。
本稿では,Quran QA 2022共有タスクのDTWエントリについて述べる。
提案手法は移動学習を用いてアラビアMRCデータの活用を行う。
さらに,様々なアンサンブル学習戦略を用いて,結果をさらに改善する。
提案手法は,テストセットにおいて,部分的相互ランク(pRR)スコアが0.49であり,タスク上での強い性能が証明された。
関連論文リスト
- Can a Multichoice Dataset be Repurposed for Extractive Question Answering? [52.28197971066953]
我々は,Multiple-choice Question answering (MCQA)のために設計されたBandarkar et al.(Bandarkar et al., 2023)を再利用した。
本稿では,英語と現代標準アラビア語(MSA)のためのガイドラインと並列EQAデータセットを提案する。
私たちの目標は、ベレベレにおける120以上の言語変異に対して、他者が私たちのアプローチを適応できるようにすることです。
論文 参考訳(メタデータ) (2024-04-26T11:46:05Z) - TCE at Qur'an QA 2023 Shared Task: Low Resource Enhanced
Transformer-based Ensemble Approach for Qur'anic QA [0.0]
我々は,Qur'an QA 2023共有タスクA,Bに取り組むためのアプローチを提案する。
低リソースのトレーニングデータの課題に対処するため、我々は投票アンサンブルとともにトランスファーラーニングに頼っている。
我々は、さまざまなアーキテクチャと学習メカニズムを、アラビア語で事前訓練されたトランスフォーマーベースのモデルに採用しています。
論文 参考訳(メタデータ) (2024-01-23T19:32:54Z) - Building Efficient and Effective OpenQA Systems for Low-Resource Languages [17.64851283209797]
低コストで効率的な OpenQA システムを低リソース環境向けに開発できることを示す。
主な要素は、機械翻訳されたラベル付きデータセットと関連する非構造化知識ソースを用いた、弱い監視である。
我々は,SQuAD2.0の機械翻訳であるSQuAD-TRを提案する。
論文 参考訳(メタデータ) (2024-01-07T22:11:36Z) - Rethinking and Improving Multi-task Learning for End-to-end Speech
Translation [51.713683037303035]
異なる時間とモジュールを考慮したタスク間の整合性について検討する。
テキストエンコーダは、主にクロスモーダル変換を容易にするが、音声におけるノイズの存在は、テキストと音声表現の一貫性を妨げる。
長さと表現の差を軽減し,モーダルギャップを橋渡しする,STタスクのための改良型マルチタスク学習(IMTL)手法を提案する。
論文 参考訳(メタデータ) (2023-11-07T08:48:46Z) - Unify word-level and span-level tasks: NJUNLP's Participation for the
WMT2023 Quality Estimation Shared Task [59.46906545506715]
我々は、WMT 2023 Quality Estimation (QE)共有タスクにNJUNLPチームを紹介する。
私たちのチームは2つのサブタスクすべてで英語とドイツ語のペアの予測を提出しました。
我々のモデルは、単語レベルと細粒度エラースパン検出サブタスクの両方において、英語とドイツ語で最高の結果を得た。
論文 参考訳(メタデータ) (2023-09-23T01:52:14Z) - Quran Recitation Recognition using End-to-End Deep Learning [0.0]
クルランはイスラム教の聖典であり、その引用は宗教の重要な側面である。
聖クラーンの朗読が自動的に認められることは、その独特の規則のために難しい課題である。
本稿では,神聖クラーンの朗読を認識するための新しいエンド・ツー・エンド深層学習モデルを提案する。
論文 参考訳(メタデータ) (2023-05-10T18:40:01Z) - MIA 2022 Shared Task: Evaluating Cross-lingual Open-Retrieval Question
Answering for 16 Diverse Languages [54.002969723086075]
16言語に類型的に多様である言語における言語横断的オープン-検索型問合せシステムの評価を行った。
反復的にマイニングされた多様な負の例を利用する最良のシステムは32.2 F1となり、ベースラインを4.5ポイント上回る。
第2のベストシステムは文書検索にエンティティを意識した文脈表現を使用し、タミル(20.8 F1)の大幅な改善を実現している。
論文 参考訳(メタデータ) (2022-07-02T06:54:10Z) - TCE at Qur'an QA 2022: Arabic Language Question Answering Over Holy
Qur'an Using a Post-Processed Ensemble of BERT-based Models [0.0]
アラビア語は神聖なクルアーンの言語であり、世界中の18億人の人々の神聖なテキストである。
本稿では,BERTモデルのアラビア変種に基づくアンサンブル学習モデルを提案する。
本システムでは,公式テストセットでPRR(Partial Reciprocal Rank)スコアが56.6%に達する。
論文 参考訳(メタデータ) (2022-06-03T13:00:48Z) - XLMRQA: Open-Domain Question Answering on Vietnamese Wikipedia-based
Textual Knowledge Source [2.348805691644086]
本稿では,ウィキペディアベースのテキスト知識ソースに教師付きトランスフォーマーを用いたベトナム初のQAシステムであるXLMRQAを提案する。
3つのシステムで得られた結果から,質問タイプがQAシステムの性能に与える影響を解析した。
論文 参考訳(メタデータ) (2022-04-14T14:54:33Z) - Enhancing Answer Boundary Detection for Multilingual Machine Reading
Comprehension [86.1617182312817]
そこで我々は,句境界管理を付加するために,微調整段階における2つの補助的タスクを提案する。
混合機械読解タスクは、質問または通過を他の言語に翻訳し、言語横断の問合せペアを構築する。
Webから抽出した知識フレーズを活用する言語に依存しない知識マスキングタスク。
論文 参考訳(メタデータ) (2020-04-29T10:44:00Z) - A Sentence Cloze Dataset for Chinese Machine Reading Comprehension [64.07894249743767]
我々はSentence Cloze-style Machine Reading (SC-MRC)と呼ばれる新しいタスクを提案する。
提案課題は,複数の空白を持つ文に適切な候補文を埋めることである。
私たちは、SC-MRCタスクの難しさを評価するためにCMRC 2019という中国のデータセットを構築しました。
論文 参考訳(メタデータ) (2020-04-07T04:09:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。