論文の概要: Automatic Generation of Multiple-Choice Questions
- arxiv url: http://arxiv.org/abs/2303.14576v1
- Date: Sat, 25 Mar 2023 22:45:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-28 18:56:03.630111
- Title: Automatic Generation of Multiple-Choice Questions
- Title(参考訳): マルチチョイス質問の自動生成
- Authors: Cheng Zhang
- Abstract要約: 本稿では,QAP世代における課題に取り組むための2つの方法を提案する。
事前処理と後処理パイプラインを備えたT5 Transformerに基づくディープラーニングに基づくエンドツーエンド質問生成システム。
文のメタシーケンス表現を用いて適切なQAPを生成するシーケンス学習に基づくスキーム。
- 参考スコア(独自算出の注目度): 7.310488568715925
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Creating multiple-choice questions to assess reading comprehension of a given
article involves generating question-answer pairs (QAPs) and adequate
distractors. We present two methods to tackle the challenge of QAP generations:
(1) A deep-learning-based end-to-end question generation system based on T5
Transformer with Preprocessing and Postprocessing Pipelines (TP3). We use the
finetuned T5 model for our downstream task of question generation and improve
accuracy using a combination of various NLP tools and algorithms in
preprocessing and postprocessing to select appropriate answers and filter
undesirable questions. (2) A sequence-learning-based scheme to generate
adequate QAPs via meta-sequence representations of sentences. A meta-sequence
is a sequence of vectors comprising semantic and syntactic tags. we devise a
scheme called MetaQA to learn meta sequences from training data to form pairs
of a meta sequence for a declarative sentence and a corresponding interrogative
sentence. The TP3 works well on unseen data, which is complemented by MetaQA.
Both methods can generate well-formed and grammatically correct questions.
Moreover, we present a novel approach to automatically generate adequate
distractors for a given QAP. The method is a combination of part-of-speech
tagging, named-entity tagging, semantic-role labeling, regular expressions,
domain knowledge bases, word embeddings, word edit distance, WordNet, and other
algorithms.
- Abstract(参考訳): 記事の読み理解を評価するために複数の質問を作成するには、q&aペア(qap)と適切な注意をそらすことが含まれる。
本稿では,(1)前処理と後処理パイプライン(tp3)を備えたt5トランスをベースとする,ディープラーニングによるエンドツーエンド質問生成システムを提案する。
我々は、質問生成の下流タスクに微調整されたT5モデルを使用し、様々なNLPツールとアルゴリズムを組み合わせて前処理と後処理を行い、適切な回答を選択し、望ましくない質問をフィルタリングする。
2) 文のメタシーケンス表現を用いて適切なQAPを生成するシーケンス学習に基づくスキーム。
メタシーケンスはセマンティックタグと構文タグからなるベクトルのシーケンスである。
訓練データからメタシーケンスを学習し、宣言文と対応する疑問文のメタシーケンスのペアを形成するためのmetaqaと呼ばれるスキームを考案する。
TP3は、MetaQAによって補完される、見えないデータでうまく動作する。
どちらの方法も、よく形作られ、文法的に正しい質問を生成することができる。
さらに,所定のQAPに対して適切な障害を自動生成する手法を提案する。
この方法は、音声タグ付け、名前付きタグ付け、セマンティックロールラベル付け、正規表現、ドメイン知識ベース、単語埋め込み、単語編集距離、WordNetなどのアルゴリズムの組み合わせである。
関連論文リスト
- Constructing Cloze Questions Generatively [2.2719421441459406]
本稿では,ニューラルネットワークとWordNetを用いた記事からクローゼ質問を生成する手法を提案する。
CQGは与えられた文に対する応答キーを選択し、それを一連のインスタンスに分割し、トランスフォーマーとシリングシンセットを使用してインスタンスレベルのイントラクタ候補(IDC)を生成する。
その後、不適切なIDCを除去し、文脈的埋め込み類似性に基づいて残りのIDCをランク付けし、シンセセットや語彙的関連性に基づき、インスタンスを対応する上位IDCに置き換え、適切なフレーズかどうかを判定する。
論文 参考訳(メタデータ) (2024-10-05T18:55:38Z) - Automated Generation of Multiple-Choice Cloze Questions for Assessing
English Vocabulary Using GPT-turbo 3.5 [5.525336037820985]
大規模言語モデル(LLM)を用いた複数質問の自動生成手法の評価を行った。
VocaTTエンジンはPythonで記述されており、ターゲット単語リストの事前処理、文と候補単語オプションの生成、最後に適切な単語オプションの選択という3つの基本的なステップで構成されている。
その結果、文が75%、単語が66.85%であることがわかった。
論文 参考訳(メタデータ) (2024-03-04T14:24:47Z) - Learning to Filter Context for Retrieval-Augmented Generation [75.18946584853316]
生成モデルは、部分的にまたは完全に無関係な経路が与えられた出力を生成するために要求される。
FILCOは、語彙と情報理論のアプローチに基づいて有用なコンテキストを特定する。
テスト時に検索したコンテキストをフィルタリングできるコンテキストフィルタリングモデルをトレーニングする。
論文 参考訳(メタデータ) (2023-11-14T18:41:54Z) - Improving Question Generation with Multi-level Content Planning [70.37285816596527]
本稿では、与えられたコンテキストと回答から質問を生成する問題に対処し、特に拡張されたコンテキストをまたいだマルチホップ推論を必要とする質問に焦点をあてる。
具体的には、キーフレーズを同時に選択して完全な回答を生成するFA-modelと、生成した全回答を付加的な入力として取り込んだQ-modelの2つのコンポーネントを含む。
論文 参考訳(メタデータ) (2023-10-20T13:57:01Z) - HPE:Answering Complex Questions over Text by Hybrid Question Parsing and
Execution [92.69684305578957]
テキストQAにおける質問解析と実行の枠組みを提案する。
提案したフレームワークは、トップダウンの質問パースとして、ボトムアップの回答バックトラックとみなすことができる。
MuSiQue,2WikiQA,HotpotQA,およびNQに関する実験により,提案した解析およびハイブリッド実行フレームワークが,教師付き,少数ショット,ゼロショット設定における既存のアプローチより優れていることを示す。
論文 参考訳(メタデータ) (2023-05-12T22:37:06Z) - Tag-Set-Sequence Learning for Generating Question-Answer Pairs [10.48660454637293]
テキストに対する愚かな質問を生成する問題に対処するために,タグセットシーケンス学習と呼ばれる新しい手法を提案する。
我々は,与えられた宣言文と対応する疑問文からタグセットシーケンスを学習するTSS-Learnerというシステムを構築した。
TSS-Learnerは、トランスフォーマーベースのモデルでは不十分な特定のテキストに対して適切なQAPを生成することができることを示す。
論文 参考訳(メタデータ) (2022-10-20T21:51:00Z) - Paragraph-based Transformer Pre-training for Multi-Sentence Inference [99.59693674455582]
マルチ候補推論タスクの微調整に使用する場合,一般的な事前学習型トランスフォーマーは性能が良くないことを示す。
次に、複数の入力文にまたがる段落レベルの意味をモデル化する新しい事前学習目標を提案する。
論文 参考訳(メタデータ) (2022-05-02T21:41:14Z) - Discovering Non-monotonic Autoregressive Orderings with Variational
Inference [67.27561153666211]
我々は、訓練データから高品質な生成順序を純粋に検出する、教師なし並列化可能な学習装置を開発した。
エンコーダを非因果的注意を持つトランスフォーマーとして実装し、1つのフォワードパスで置換を出力する。
言語モデリングタスクにおける経験的結果から,我々の手法は文脈認識であり,一定の順序と競合する,あるいはより優れた順序を見つけることができる。
論文 参考訳(メタデータ) (2021-10-27T16:08:09Z) - Generating Adequate Distractors for Multiple-Choice Questions [7.966913971277812]
本手法は, 音声タグ付け, 名前付きタグ付け, セマンティックロールラベル付け, 正規表現, ドメイン知識ベース, 単語埋め込み, 単語編集距離, ワードネット, その他のアルゴリズムの組み合わせである。
実験と人的判断により,各MCQは少なくとも1つの適切な注意障害を有し,評価の84%は3つの適切な注意障害を有することを示した。
論文 参考訳(メタデータ) (2020-10-23T20:47:58Z) - Meta Sequence Learning for Generating Adequate Question-Answer Pairs [10.48660454637293]
本稿では,文のメタシーケンス表現を用いて適切なQAPを生成する学習手法を提案する。
与えられた宣言文上で、訓練されたメタQAモデルは、それをメタシーケンスに変換し、マッチしたMDを見つけ、対応するMIと入力文を使用してQAPを生成する。
その結果,MetaQA は SAT の練習読解テストで効率よく生成し,その精度は 97% 以上であることがわかった。
論文 参考訳(メタデータ) (2020-10-04T16:28:13Z) - Multi-level Head-wise Match and Aggregation in Transformer for Textual
Sequence Matching [87.97265483696613]
そこで本研究では,複数のレベルにおける頭部のマッチング表現を学習することで,Transformerとのシーケンスペアマッチングを新たに提案する。
実験の結果,提案手法は複数のタスクにおいて新しい最先端性能を実現することができることがわかった。
論文 参考訳(メタデータ) (2020-01-20T20:02:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。