Fugu-MT 論文翻訳(概要): AmaSQuAD: A Benchmark for Amharic Extractive Question Answering

論文の概要: AmaSQuAD: A Benchmark for Amharic Extractive Question Answering

arxiv url: http://arxiv.org/abs/2502.02047v1
Date: Tue, 04 Feb 2025 06:27:39 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-05 15:21:55.949412
Title: AmaSQuAD: A Benchmark for Amharic Extractive Question Answering
Title（参考訳）: Amharic Extractive Question AnsweringのためのベンチマークAmaSQuAD
Authors: Nebiyou Daniel Hailemariam, Blessed Guda, Tsegazeab Tefferi,
Abstract要約: 本研究では,抽出された問合せデータセットを低リソース言語に翻訳するための新しい枠組みを提案する。この方法論は、翻訳された質問と回答のミスアライメントに関連する課題に対処する。我々は、AmaSQuAD合成データセット上でXLM-Rモデルを微調整し、Amharic Question-Answeringを行う。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: This research presents a novel framework for translating extractive question-answering datasets into low-resource languages, as demonstrated by the creation of the AmaSQuAD dataset, a translation of SQuAD 2.0 into Amharic. The methodology addresses challenges related to misalignment between translated questions and answers, as well as the presence of multiple answer instances in the translated context. For this purpose, we used cosine similarity utilizing embeddings from a fine-tuned BERT-based model for Amharic and Longest Common Subsequence (LCS). Additionally, we fine-tune the XLM-R model on the AmaSQuAD synthetic dataset for Amharic Question-Answering. The results show an improvement in baseline performance, with the fine-tuned model achieving an increase in the F1 score from 36.55% to 44.41% and 50.01% to 57.5% on the AmaSQuAD development dataset. Moreover, the model demonstrates improvement on the human-curated AmQA dataset, increasing the F1 score from 67.80% to 68.80% and the exact match score from 52.50% to 52.66%.The AmaSQuAD dataset is publicly available Datasets
Abstract（参考訳）: 本研究では,SQuAD 2.0をアムハラ語に翻訳したAmaSQuADデータセットの作成により,抽出された質問応答データセットを低リソース言語に翻訳する新しい枠組みを提案する。この方法論は、翻訳された質問と回答のミスアライメントや、翻訳された文脈における複数の回答インスタンスの存在に関連する課題に対処する。そこで我々は,Amharic and Longest Common Subsequence (LCS) のための細調整BERTモデルからの埋め込みを利用したコサイン類似性を用いた。さらに,AmaSQuAD合成データセットにXLM-Rモデルを微調整し,AmaSQuADを用いたAmaharic Question-Answeringを行った。その結果,細調整モデルによりF1スコアが36.55%から44.41%,50.01%から57.5%に向上した。さらに、このモデルは人間の計算したAmQAデータセットの改善を示し、F1スコアは67.80%から68.80%に増加し、正確なマッチスコアは52.50%から52.66%に増加した。 AmaSQuADデータセットが公開データセットに

関連論文リスト

Optimized Quran Passage Retrieval Using an Expanded QA Dataset and Fine-Tuned Language Models [0.0]
Qur'an QA 2023の共有タスクデータセットには、弱いモデル検索を伴う限られた数の質問があった。 251の質問を含む最初のデータセットをレビューし、629の質問に拡張し、質問の多様化と修正を行った。 AraBERT、RoBERTa、CAMeLBERT、AraELECTRA、BERTなど、微調整されたトランスモデルを実験する。
論文参考訳（メタデータ） (2024-12-16T04:03:58Z)
Multilingual Non-Factoid Question Answering with Answer Paragraph Selection [36.31301773167754]
この研究は、非ファクトイデアルな質問を持つ多言語QuADであるMuNfQuADを提示する。データセットは38言語にまたがる578KのQAペアで構成されている。
論文参考訳（メタデータ） (2024-08-20T07:37:06Z)
KET-QA: A Dataset for Knowledge Enhanced Table Question Answering [63.56707527868466]
本研究では,TableQAの外部知識源として知識ベース(KB)を用いることを提案する。すべての質問は、答えるテーブルとサブグラフの両方からの情報を統合する必要がある。我々は,膨大な知識サブグラフから関連する情報を抽出するために,レトリバー・レゾナー構造パイプラインモデルを設計する。
論文参考訳（メタデータ） (2024-05-13T18:26:32Z)
UQA: Corpus for Urdu Question Answering [3.979019316355144]
本稿では,ウルドゥー語における質問応答とテキスト理解のための新しいデータセットであるUQAを紹介する。 UQAは、大規模な英語QAデータセットであるSQuAD2.0(Stanford Question Answering dataset)を翻訳することによって生成される。本稿では,Google TranslatorとSeamless M4Tの2つの候補の中から,最適な翻訳モデルを選択し,評価するプロセスについて述べる。
論文参考訳（メタデータ） (2024-05-02T16:44:31Z)
Synthetic Dataset Creation and Fine-Tuning of Transformer Models for Question Answering in Serbian [0.0]
我々は、SQuAD-srという名前の87K以上のサンプルからなるセルビア最大のQAデータセットを作成します。セルビア語でスクリプトの双対性を認めるために、我々はデータセットのキリル文字版とラテン文字版の両方を生成した。最高の結果は、私たちのラテンSQuAD-srデータセット上でBERTi'cモデルを微調整し、73.91%のExact Matchと82.97%のF1スコアを得たことである。
論文参考訳（メタデータ） (2024-04-12T17:27:54Z)
GSQA: An End-to-End Model for Generative Spoken Question Answering [54.418723701886115]
本稿では,システムに抽象的推論を強制するGSQA(Generative Spoken Question Answering)モデルを提案する。本モデルでは, 抽出QAデータセットにおいて, 従来の抽出モデルよりも3%上回っている。我々のGSQAモデルは、幅広い質問に一般化する可能性を示し、それによって、抽象的QAの音声質問応答能力をさらに拡張する。
論文参考訳（メタデータ） (2023-12-15T13:33:18Z)
UNK-VQA: A Dataset and a Probe into the Abstention Ability of Multi-modal Large Models [55.22048505787125]
本稿ではUNK-VQAと呼ばれる包括的データセットを提案する。まず、画像または疑問について意図的に摂動することで、既存のデータを拡大する。そこで我々は,新たなマルチモーダル大規模モデルのゼロショット性能と少数ショット性能を広範囲に評価した。
論文参考訳（メタデータ） (2023-10-17T02:38:09Z)
PAXQA: Generating Cross-lingual Question Answering Examples at Training Scale [53.92008514395125]
PAXQA(クロスリンガル(x)QAのアノテーションの計画)は、クロスリンガルQAを2段階に分解する。本稿では、並列ビットから制約されたエンティティを抽出する語彙制約機械翻訳の新たな利用法を提案する。これらのデータセットに基づいて微調整されたモデルは、複数の抽出されたQAデータセット上で、先行合成データ生成モデルより優れていることを示す。
論文参考訳（メタデータ） (2023-04-24T15:46:26Z)
TAT-QA: A Question Answering Benchmark on a Hybrid of Tabular and Textual Content in Finance [71.76018597965378]
TAT-QAと呼ばれるタブラデータとテクスチャデータの両方を含む新しい大規模な質問応答データセットを構築します。本稿では,テーブルとテキストの両方を推論可能な新しいQAモデルであるTAGOPを提案する。
論文参考訳（メタデータ） (2021-05-17T06:12:06Z)
When in Doubt, Ask: Generating Answerable and Unanswerable Questions, Unsupervised [0.0]
質問回答(QA)は、人と機械間の堅牢なコミュニケーションを可能にするための鍵である。現代のQAで使用される言語モデルは、いくつかの重要なタスクにおいて人間のパフォーマンスを上回っている。本稿では,この問題を克服する手段として,人工データを用いた人為的データセットの強化について検討する。
論文参考訳（メタデータ） (2020-10-04T15:56:44Z)
Template-Based Question Generation from Retrieved Sentences for Improved Unsupervised Question Answering [98.48363619128108]
擬似学習データを用いてQAモデルを訓練するための教師なしアプローチを提案する。関連した検索文に簡単なテンプレートを適用してQA学習のための質問を生成すると、元の文脈文よりも、下流QAのパフォーマンスが向上することを示す。
論文参考訳（メタデータ） (2020-04-24T17:57:45Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。