Fugu-MT 論文翻訳(概要): CDGP: Automatic Cloze Distractor Generation based on Pre-trained Language Model

論文の概要: CDGP: Automatic Cloze Distractor Generation based on Pre-trained Language Model

arxiv url: http://arxiv.org/abs/2403.10326v1
Date: Fri, 15 Mar 2024 14:14:26 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-18 16:51:41.577886
Title: CDGP: Automatic Cloze Distractor Generation based on Pre-trained Language Model
Title（参考訳）: CDGP:事前学習言語モデルに基づく自動クローゼディトラクタ生成
Authors: Shang-Hsuan Chiang, Ssu-Cheng Wang, Yao-Chung Fan,
Abstract要約: 本稿では,事前学習型言語モデル (PLM) の代替案としての利用について検討する。実験により、PLM強化モデルは大幅な性能改善をもたらすことが示された。
参考スコア（独自算出の注目度）: 2.2169618382995764
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Manually designing cloze test consumes enormous time and efforts. The major challenge lies in wrong option (distractor) selection. Having carefully-design distractors improves the effectiveness of learner ability assessment. As a result, the idea of automatically generating cloze distractor is motivated. In this paper, we investigate cloze distractor generation by exploring the employment of pre-trained language models (PLMs) as an alternative for candidate distractor generation. Experiments show that the PLM-enhanced model brings a substantial performance improvement. Our best performing model advances the state-of-the-art result from 14.94 to 34.17 (NDCG@10 score). Our code and dataset is available at https://github.com/AndyChiangSH/CDGP.
Abstract（参考訳）: 手動でクローズテストを設計することは、膨大な時間と労力を消費します。最大の課題は、間違った選択肢(デストラクタ)の選択です。注意深い設計の気を散らすことで、学習者の能力評価の有効性が向上する。その結果、クローズイントラクタを自動生成するアイデアが動機付けられる。本稿では,事前学習型言語モデル (PLM) の代替として, クローゼイントラクタ生成を探索し, クローゼイントラクタ生成について検討する。実験により、PLM強化モデルは大幅な性能改善をもたらすことが示された。私たちの最高のパフォーマンスモデルは、14.94から34.17(NDCG@10スコア)まで、最先端の結果を前進させます。私たちのコードとデータセットはhttps://github.com/AndyChiangSH/CDGPで公開されています。

関連論文リスト

Fake it till You Make it: Reward Modeling as Discriminative Prediction [49.31309674007382]
GAN-RMは、手動の嗜好アノテーションと明示的な品質次元工学を排除した効率的な報酬モデリングフレームワークである。提案手法は,少数の対象サンプルを識別し,報酬モデルを訓練する。実験では、GAN-RMが複数の主要なアプリケーションにまたがって有効であることを実証した。
論文参考訳（メタデータ） (2025-06-16T17:59:40Z)
Dream to Generalize: Zero-Shot Model-Based Reinforcement Learning for Unseen Visual Distractions [14.137070712516005]
ゼロショットモデルに基づく強化学習(MBRL)のための新しい自己教師型手法Dream to Generalize(Dr.G)を提案する。 G博士はそのエンコーダと世界モデルを2つのコントラスト学習で訓練し、多視点データ拡張におけるタスク関連特徴を効率的に捉える。我々はまた、世界モデルが時間構造をよりよく理解するのに役立つリカレント状態逆ダイナミクスモデルも導入する。
論文参考訳（メタデータ） (2025-06-05T00:39:03Z)
Learning to Solve and Verify: A Self-Play Framework for Code and Test Generation [69.62857948698436]
大規模言語モデル(LLM)の最近の進歩は、コーディングベンチマークのパフォーマンスを改善している。しかし、手軽に利用できる高品質なデータの枯渇により、改善は停滞している。本稿では,単一モデルのコードとテスト生成能力を共同で改善するセルフプレイ・ソルバ検証フレームワークであるSol-Verを提案する。
論文参考訳（メタデータ） (2025-02-20T18:32:19Z)
Enhancing LLM Reasoning via Critique Models with Test-Time and Training-Time Supervision [120.40788744292739]
本稿では、推論と批判モデルの役割を分離する2人プレイヤパラダイムを提案する。まず、批判データを収集する自動化およびスケーラブルなフレームワークであるAutoMathCritiqueを提案する。テスト時間における難解なクエリに対するアクターのパフォーマンスを,批判モデルが一貫して改善することが実証された。
論文参考訳（メタデータ） (2024-11-25T17:11:54Z)
Fluid: Scaling Autoregressive Text-to-image Generative Models with Continuous Tokens [53.99177152562075]
視覚における自己回帰モデルのスケールアップは、大きな言語モデルほど有益でないことが証明されている。モデルが離散トークンを使用するか、連続トークンを使用するか、BERTやGPTのようなトランスフォーマーアーキテクチャを用いてランダムまたは固定順序でトークンを生成するか、という2つの重要な要素に焦点を当てる。その結果,すべてのモデルが検証損失の点で効果的にスケールしているのに対して,評価性能はFID,GenEvalスコア,視覚的品質などによって異なる傾向を呈することがわかった。
論文参考訳（メタデータ） (2024-10-17T17:59:59Z)
Just Say What You Want: Only-prompting Self-rewarding Online Preference Optimization [64.34767799614328]
現在の自己回帰アプローチは、差別者の判断能力に大きく依存している。本稿では,判断能力に頼らずに嗜好データセットを生成する,新たな自己回帰型オンラインアルゴリズムを提案する。
論文参考訳（メタデータ） (2024-09-26T04:41:08Z)
Improving Automated Distractor Generation for Math Multiple-choice Questions with Overgenerate-and-rank [44.04217284677347]
本稿では,過剰生成・ランク化により生成したトラクタの品質を向上する新しい手法を提案する。我々のランキングモデルでは、人間が作成したものよりも、人間の権威のあるものの方が好まれるが、人間の権威のあるトラクタとのアライメントが向上する。
論文参考訳（メタデータ） (2024-04-19T00:25:44Z)
Challenging Forgets: Unveiling the Worst-Case Forget Sets in Machine Unlearning [9.998859702421417]
マシン・アンラーニング(MU)は、選択したデータポイントがモデルの性能に与える影響を排除することを目的としている。データ影響消去のための様々なMU手法にもかかわらず、評価は主にランダムなデータの忘れ方に焦点を当てている。本稿では,影響消去の最も重要な課題を示すデータサブセットの同定を提案する。
論文参考訳（メタデータ） (2024-03-12T06:50:32Z)
Adapt then Unlearn: Exploring Parameter Space Semantics for Unlearning in Generative Adversarial Networks [5.107720313575234]
本研究は,事前学習されたGAN(Generative Adversarial Network)から不要な特徴を含む出力の発生を防止することを目的とする。提案手法は「Adapt-then-Unlearn」と呼ばれ、望ましくない特徴を学習すると同時に、生成したサンプルの品質も維持する。我々の知識を最大限に活用するために、我々のアプローチは、高忠実なGANの領域内での未学習に対処する最初の方法である。
論文参考訳（メタデータ） (2023-09-25T11:36:20Z)
Robust Preference Learning for Storytelling via Contrastive Reinforcement Learning [53.92465205531759]
制御された自動ストーリ生成は、自然言語批判や嗜好から制約を満たす自然言語ストーリを生成することを目指している。対照的なバイエンコーダモデルをトレーニングし、ストーリーを人間の批評と整合させ、汎用的な嗜好モデルを構築する。我々はさらに、ストーリー生成の堅牢性を高めるために、プロンプトラーニング技術を用いて、対照的な報酬モデルを微調整する。
論文参考訳（メタデータ） (2022-10-14T13:21:33Z)
Ensembling Off-the-shelf Models for GAN Training [55.34705213104182]
事前学習されたコンピュータビジョンモデルは、識別器のアンサンブルで使用する場合、性能を著しく向上させることができる。本研究では,事前学習したモデル埋め込みにおける実検体と偽検体間の線形分離性を検証し,効率的な選択機構を提案する。本手法は, 限られたデータと大規模設定の両方において, GAN トレーニングを改善することができる。
論文参考訳（メタデータ） (2021-12-16T18:59:50Z)
Utilizing Self-supervised Representations for MOS Prediction [51.09985767946843]
既存の評価は通常、クリーンな参照または平行な地上真実データを必要とする。一方、主観的テストは、追加のクリーンデータや並列データを必要としず、人間の知覚とよりよく相関する。基礎的真理データを必要とせず,人間の知覚とよく相関する自動評価手法を開発した。
論文参考訳（メタデータ） (2021-04-07T09:44:36Z)
Controllable Generation from Pre-trained Language Models via Inverse Prompting [47.23315683944257]
テキスト生成をよりよく制御する革新的な手法である逆プロンプトを提案する。逆プロンプトは生成されたテキストを使用してビーム探索中に逆プロンプトを予測する。その結果,提案手法はベースラインを大きく上回ることがわかった。
論文参考訳（メタデータ） (2021-03-19T08:36:52Z)
EnD: Entangling and Disentangling deep representations for bias correction [7.219077740523682]
本稿では,深層モデルが望ましくないバイアスを学習することを防止するための正規化戦略であるEnDを提案する。特に、深層ニューラルネットワークの特定のポイントに「情報のボトルネック」を挿入し、バイアスに関する情報を分離する。実験によると、EnDは偏りのないテストセットの一般化を効果的に改善する。
論文参考訳（メタデータ） (2021-03-02T20:55:42Z)
Better Distractions: Transformer-based Distractor Generation and Multiple Choice Question Filtering [4.168157981135697]
我々はGPT-2言語モデルをトレーニングし、与えられた質問とテキストコンテキストに対して3つの気晴らしを生成する。次に、複数の選択質問(MCQ)に答えるためにBERT言語モデルをトレーニングし、このモデルをフィルタとして使用する。
論文参考訳（メタデータ） (2020-10-19T15:23:24Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。