論文の概要: Sequence-to-Sequence Learning for Indonesian Automatic Question
Generator
- arxiv url: http://arxiv.org/abs/2009.13889v1
- Date: Tue, 29 Sep 2020 09:25:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-13 06:09:37.136116
- Title: Sequence-to-Sequence Learning for Indonesian Automatic Question
Generator
- Title(参考訳): インドネシア語自動質問生成装置のシーケンス・ツー・シーケンス学習
- Authors: Ferdiant Joshua Muis (1) and Ayu Purwarianti (1 and 2) ((1) Institut
Teknologi Bandung, (2) U-CoE AI-VLB)
- Abstract要約: インドネシア語の自動質問生成装置を構築し、以前の研究からアーキテクチャを適用した。
BLEU1, BLEU2, BLEU3, BLEU4, ROUGE-Lスコアは38,35, 2096, 10,68, 5,78, 43,4であり、TyDiQAは39.9, 20.78, 10.26, 6.31, 44.13であった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automatic question generation is defined as the task of automating the
creation of question given a various of textual data. Research in automatic
question generator (AQG) has been conducted for more than 10 years, mainly
focused on factoid question. In all these studies, the state-of-the-art is
attained using sequence-to-sequence approach. However, AQG system for
Indonesian has not ever been researched intensely. In this work we construct an
Indonesian automatic question generator, adapting the architecture from some
previous works. In summary, we used sequence-to-sequence approach using BiGRU,
BiLSTM, and Transformer with additional linguistic features, copy mechanism,
and coverage mechanism. Since there is no public large dan popular Indonesian
dataset for question generation, we translated SQuAD v2.0 factoid question
answering dataset, with additional Indonesian TyDiQA dev set for testing. The
system achieved BLEU1, BLEU2, BLEU3, BLEU4, and ROUGE-L score at 38,35, 20,96,
10,68, 5,78, and 43,4 for SQuAD, and 39.9, 20.78, 10.26, 6.31, 44.13 for
TyDiQA, respectively. The system performed well when the expected answers are
named entities and are syntactically close with the context explaining them.
Additionally, from native Indonesian perspective, the best questions generated
by our best models on their best cases are acceptable and reasonably useful.
- Abstract(参考訳): 自動質問生成は、様々なテキストデータから与えられた質問の自動生成タスクとして定義される。
自動質問生成装置(AQG)の研究は10年以上にわたって行われ、主にファクトイドの問題に焦点を当てている。
これらすべての研究において、最先端技術はシーケンシャル・ツー・シーケンス・アプローチを用いて達成される。
しかし、インドネシアのaqgシステムの研究は行われていない。
この作業ではインドネシアの自動質問生成装置を構築し、以前の作業からアーキテクチャを適用した。
要約すると、BiGRU, BiLSTM, Transformer を用いたシーケンス・ツー・シーケンス・アプローチにより、言語的特徴、コピー機構、カバレッジ機構を付加した。
質問生成のための一般的なインドネシアのデータセットは公開されていないので、テスト用にインドネシアのtydiqa開発セットを追加して、s squad v2.0 factoid question answering datasetを翻訳しました。
BLEU1、BLEU2、BLEU3、BLEU4、ROUGE-Lのスコアはそれぞれ38,35、2096、10,68、5,78、43,4でSQuAD、39.9、20.78、10.26、6.31、44.13で達成された。
システムは、期待される回答が名前付きエンティティであり、それらを説明する文脈と構文的に近い場合にうまく機能する。
さらに、インドネシアのネイティブの観点からは、最高のケースで最高のモデルが生成する最良の質問は受け入れられ、合理的に有用です。
関連論文リスト
- Diversity Enhanced Narrative Question Generation for Storybooks [4.043005183192124]
マルチクエスト生成モデル(mQG)を導入し,複数の,多様な,回答可能な質問を生成する。
生成した質問の応答性を検証するために,SQuAD2.0の微調整された質問応答モデルを用いる。
mQGは、強力なベースラインの中で、様々な評価指標で有望な結果を示している。
論文 参考訳(メタデータ) (2023-10-25T08:10:04Z) - An Empirical Comparison of LM-based Question and Answer Generation
Methods [79.31199020420827]
質問と回答の生成(QAG)は、コンテキストが与えられた質問と回答のペアのセットを生成することで構成される。
本稿では,シーケンス・ツー・シーケンス言語モデル(LM)を微調整する3つの異なるQAG手法を用いて,ベースラインを確立する。
実験により、学習時間と推論時間の両方で計算的に軽量なエンドツーエンドQAGモデルが一般に堅牢であり、他のより複雑なアプローチよりも優れていることが示された。
論文 参考訳(メタデータ) (2023-05-26T14:59:53Z) - Using Implicit Feedback to Improve Question Generation [4.4250613854221905]
質問生成(QG)は、テキストから質問を自動的に生成することを目的とした自然言語処理(NLP)のタスクである。
本研究では,そのような(単純な)フィードバックから学習するシステム GEN を提案する。
その結果、GENは学習のないバージョンと比較して暗黙のフィードバックの両レベルから学習することで改善できることがわかった。
論文 参考訳(メタデータ) (2023-04-26T16:37:47Z) - PAXQA: Generating Cross-lingual Question Answering Examples at Training
Scale [53.92008514395125]
PAXQA(クロスリンガル(x)QAのアノテーションの計画)は、クロスリンガルQAを2段階に分解する。
本稿では、並列ビットから制約されたエンティティを抽出する語彙制約機械翻訳の新たな利用法を提案する。
これらのデータセットに基づいて微調整されたモデルは、複数の抽出されたQAデータセット上で、先行合成データ生成モデルより優れていることを示す。
論文 参考訳(メタデータ) (2023-04-24T15:46:26Z) - Improving Complex Knowledge Base Question Answering via
Question-to-Action and Question-to-Question Alignment [6.646646618666681]
ALCQAと呼ばれるアライメント強化複雑な質問応答フレームワークを導入する。
質問と各アクションを調整するために質問書き換えモデルをトレーニングし、事前訓練された言語モデルを使用して質問とKGアーティファクトを暗黙的に調整する。
提案手法は,質問と質問のアライメントを通じて,推論段階でトップkに類似した質問応答ペアを検索し,新たな報酬誘導行動列選択戦略を提案する。
論文 参考訳(メタデータ) (2022-12-26T08:12:41Z) - Generative Language Models for Paragraph-Level Question Generation [79.31199020420827]
強力な生成モデルが質問生成(QG)の最近の進歩につながっている
標準化された資源が存在しないため,QG研究の進歩を測定することは困難である。
我々はQGのベンチマークであるQG-Benchを導入し、既存のQGデータセットを標準QG設定に変換することで、既存の質問応答データセットを統一する。
論文 参考訳(メタデータ) (2022-10-08T10:24:39Z) - Natural Answer Generation: From Factoid Answer to Full-length Answer
using Grammar Correction [39.40116590327074]
本稿では,与えられた質問と抽出されたファクトイド回答を入力として出力するシステムを提案する。
トランスフォーマーベースのGrammar Error Correction Model GECToR (2020) は、処理後のステップとして、流速を改善するために使用される。
本システムと (i) 修正ポインタジェネレータ (SOTA) と (ii) ファインチューニングダイアロGPT との比較を行った。
論文 参考訳(メタデータ) (2021-12-07T17:39:21Z) - Cross-Lingual GenQA: A Language-Agnostic Generative Question Answering
Approach for Open-Domain Question Answering [76.99585451345702]
オープン検索生成質問回答(GenQA)は、高品質で自然な回答を英語で提供することが証明されている。
我々は多言語環境に対するGenQAアプローチの最初の一般化について述べる。
論文 参考訳(メタデータ) (2021-10-14T04:36:29Z) - Tell Me How to Ask Again: Question Data Augmentation with Controllable
Rewriting in Continuous Space [94.8320535537798]
機械読解(MRC)、質問生成、質問答え自然言語推論タスクのための制御可能な書き換えベースの質問データ拡張(CRQDA)。
質問データ拡張タスクを制約付き質問書き換え問題として扱い、コンテキスト関連、高品質、多様な質問データサンプルを生成する。
論文 参考訳(メタデータ) (2020-10-04T03:13:46Z) - ClarQ: A large-scale and diverse dataset for Clarification Question
Generation [67.1162903046619]
そこで我々は,スタックエクスチェンジから抽出したポストコメンデーションに基づいて,多様な,大規模な明確化質問データセットの作成を支援する,新しいブートストラップフレームワークを考案した。
質問応答の下流タスクに適用することで,新たに作成したデータセットの有用性を定量的に示す。
我々はこのデータセットを公開し、ダイアログと質問応答システムの拡張という大きな目標を掲げて、質問生成の分野の研究を促進する。
論文 参考訳(メタデータ) (2020-06-10T17:56:50Z) - Simplifying Paragraph-level Question Generation via Transformer Language
Models [0.0]
質問生成(QG)は、ある入力テキストに対応する質問をモデルに訓練する自然言語生成タスクである。
1つのTransformerベースの一方向言語モデルで、トランスファーラーニングを利用して高品質な質問を生成することができる。
我々のQGモデルは、GPT-2 Smallから微調整され、SQuADデータセット上のいくつかの段落レベルのQGベースラインを0.95 METEORポイントで上回る。
論文 参考訳(メタデータ) (2020-05-03T14:57:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。