論文の概要: Constructing Cloze Questions Generatively
- arxiv url: http://arxiv.org/abs/2410.04266v1
- Date: Sat, 5 Oct 2024 18:55:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-02 08:49:52.168124
- Title: Constructing Cloze Questions Generatively
- Title(参考訳): クローズ質問の生成
- Authors: Yicheng Sun, Jie Wang,
- Abstract要約: 本稿では,ニューラルネットワークとWordNetを用いた記事からクローゼ質問を生成する手法を提案する。
CQGは与えられた文に対する応答キーを選択し、それを一連のインスタンスに分割し、トランスフォーマーとシリングシンセットを使用してインスタンスレベルのイントラクタ候補(IDC)を生成する。
その後、不適切なIDCを除去し、文脈的埋め込み類似性に基づいて残りのIDCをランク付けし、シンセセットや語彙的関連性に基づき、インスタンスを対応する上位IDCに置き換え、適切なフレーズかどうかを判定する。
- 参考スコア(独自算出の注目度): 2.2719421441459406
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a generative method called CQG for constructing cloze questions from a given article using neural networks and WordNet, with an emphasis on generating multigram distractors. Built on sense disambiguation, text-to-text transformation, WordNet's synset taxonomies and lexical labels, CQG selects an answer key for a given sentence, segments it into a sequence of instances, generates instance-level distractor candidates (IDCs) using a transformer and sibling synsets.It then removes inappropriate IDCs, ranks the remaining IDCs based on contextual embedding similarities, as well as synset and lexical relatedness, forms distractor candidates by combinatorially replacing instances with the corresponding top-ranked IDCs, and checks if they are legitimate phrases. Finally, it selects top-ranked distractor candidates based on contextual semantic similarities to the answer key. Experiments show that this method significantly outperforms SOTA results. Human judges also confirm the high qualities of the generated distractors.
- Abstract(参考訳): 本稿では,ニューラルネットワークとWordNetを用いた記事からクローゼ質問を生成するCQGという生成手法を提案する。
意味の曖昧さ、テキストからテキストへの変換、WordNetの構文分類、語彙ラベルに基づいて、CQGは与えられた文に対する応答キーを選択し、それをインスタンスのシーケンスに分割し、トランスフォーマーとシリングシンセットを使用してインスタンスレベルのイントラクタ候補(IDC)を生成する。
最後に、応答キーに対する文脈的セマンティックな類似性に基づいて、トップランクのインタプリタ候補を選択する。
実験の結果,SOTA法はSOTA法よりも有意に優れていた。
人間の裁判官は、生成された散逸器の質の高さも確認する。
関連論文リスト
- Learning Robust Named Entity Recognizers From Noisy Data With Retrieval Augmentation [67.89838237013078]
名前付きエンティティ認識(NER)モデルは、しばしばノイズの多い入力に悩まされる。
ノイズの多いテキストとそのNERラベルのみを利用できる、より現実的な設定を提案する。
我々は、推論中にテキストを取得することなく、堅牢なNERを改善するマルチビュートレーニングフレームワークを採用している。
論文 参考訳(メタデータ) (2024-07-26T07:30:41Z) - GEC-DePenD: Non-Autoregressive Grammatical Error Correction with
Decoupled Permutation and Decoding [52.14832976759585]
文法的誤り訂正(GEC)は、通常自己回帰的なシーケンス・ツー・シーケンスモデルで解決される重要なNLPタスクである。
本稿では, アーキテクチャを置換ネットワークに分離する, GEC に対する非自己回帰的アプローチを提案する。
GECの既知の非自己回帰手法よりもネットワークが向上することを示す。
論文 参考訳(メタデータ) (2023-11-14T14:24:36Z) - Automatic Generation of Multiple-Choice Questions [7.310488568715925]
本稿では,QAP世代における課題に取り組むための2つの方法を提案する。
事前処理と後処理パイプラインを備えたT5 Transformerに基づくディープラーニングに基づくエンドツーエンド質問生成システム。
文のメタシーケンス表現を用いて適切なQAPを生成するシーケンス学習に基づくスキーム。
論文 参考訳(メタデータ) (2023-03-25T22:45:54Z) - Tag-Set-Sequence Learning for Generating Question-Answer Pairs [10.48660454637293]
テキストに対する愚かな質問を生成する問題に対処するために,タグセットシーケンス学習と呼ばれる新しい手法を提案する。
我々は,与えられた宣言文と対応する疑問文からタグセットシーケンスを学習するTSS-Learnerというシステムを構築した。
TSS-Learnerは、トランスフォーマーベースのモデルでは不十分な特定のテキストに対して適切なQAPを生成することができることを示す。
論文 参考訳(メタデータ) (2022-10-20T21:51:00Z) - Hierarchical Sketch Induction for Paraphrase Generation [79.87892048285819]
本稿では、高密度符号化の分解を学習するHRQ-VAE(Hierarchical Refinement Quantized Variational Autoencoders)を紹介する。
HRQ-VAEを用いて、入力文の構文形式を階層化の経路としてエンコードすることで、テスト時の構文スケッチをより容易に予測できる。
論文 参考訳(メタデータ) (2022-03-07T15:28:36Z) - Towards Document-Level Paraphrase Generation with Sentence Rewriting and
Reordering [88.08581016329398]
文書レベルのパラフレーズ生成のためのCoRPG(Coherence Relation Guided Paraphrase Generation)を提案する。
グラフGRUを用いて、コヒーレンス関係グラフを符号化し、各文のコヒーレンス対応表現を得る。
我々のモデルは、より多様性とセマンティックな保存を伴う文書パラフレーズを生成することができる。
論文 参考訳(メタデータ) (2021-09-15T05:53:40Z) - Tree-constrained Pointer Generator for End-to-end Contextual Speech
Recognition [16.160767678589895]
TCPGenは、アテンションベースのエンコーダデコーダとトランスデューサエンドツーエンドのASRモデルの両方に偏りのある単語のリストのような知識を組み込む。
TCPGenは、バイアスワードを効率的なプレフィックスツリーに構造化し、そのシンボル入力として機能し、デコード中のバイアスワードの認識を容易にするニューラルネットワークショートカットを生成する。
論文 参考訳(メタデータ) (2021-09-01T21:41:59Z) - More Than Words: Collocation Tokenization for Latent Dirichlet
Allocation Models [71.42030830910227]
モデルが異なる環境でクラスタリングの品質を測定するための新しい指標を提案する。
マージトークンでトレーニングされたトピックは、マージされていないモデルよりも、より明確で、一貫性があり、トピックを区別する効果が高いトピックキーをもたらすことを示す。
論文 参考訳(メタデータ) (2021-08-24T14:08:19Z) - Detecting and Classifying Malevolent Dialogue Responses: Taxonomy, Data
and Methodology [68.8836704199096]
コーパスベースの会話インタフェースは、テンプレートベースのエージェントや検索ベースのエージェントよりも多様な自然なレスポンスを生成することができる。
コーパスベースの会話エージェントの生成能力が増大すると、マレヴォレントな反応を分類し、フィルタリングする必要性が生じる。
不適切な内容の認識と分類に関するこれまでの研究は、主にある種のマレヴォレンスに焦点を絞っている。
論文 参考訳(メタデータ) (2020-08-21T22:43:27Z) - IIT Gandhinagar at SemEval-2020 Task 9: Code-Mixed Sentiment
Classification Using Candidate Sentence Generation and Selection [1.2301855531996841]
コードミキシングは、非標準の書き込みスタイルのためにテキストの感情を分析することの難しさを増す。
本稿では,Bi-LSTMに基づくニューラル分類器上での文生成と選択に基づく提案手法を提案する。
提案手法は,Bi-LSTMに基づくニューラル分類器と比較して,システム性能の向上を示す。
論文 参考訳(メタデータ) (2020-06-25T14:59:47Z) - Keyword-Attentive Deep Semantic Matching [1.8416014644193064]
本稿では,深いセマンティックマッチングを改善するためのキーワード付きアプローチを提案する。
まず、大きなコーパスからのドメインタグを利用して、ドメインを拡張したキーワード辞書を生成する。
モデル学習中,入力ペア間のキーワードカバレッジに基づく新しいネガティブサンプリング手法を提案する。
論文 参考訳(メタデータ) (2020-03-11T10:18:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。