論文の概要: 'John ate 5 apples' != 'John ate some apples': Self-Supervised
Paraphrase Quality Detection for Algebraic Word Problems
- arxiv url: http://arxiv.org/abs/2206.08263v1
- Date: Thu, 16 Jun 2022 16:01:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-17 14:06:40.934884
- Title: 'John ate 5 apples' != 'John ate some apples': Self-Supervised
Paraphrase Quality Detection for Algebraic Word Problems
- Title(参考訳): ジョンは5つのリンゴを食べました!
john ate some apples': 代数的単語問題に対する自己教師付きパラフレーズ品質検出
- Authors: Rishabh Gupta, Venktesh V, Mukesh Mohania, Vikram Goyal
- Abstract要約: 本稿では,代数的単語問題(AWP)のための新しいパラフレーズ作成タスクについて紹介する。
本稿では,新しいデータ拡張を用いた自己教師付きパラフレーズ品質検出手法であるParaQDを提案する。
提案手法は,既存の最先端の自己監督手法を最大32%向上させると同時に,印象的なゼロショット性能を誇示する。
- 参考スコア(独自算出の注目度): 5.682665111938764
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces the novel task of scoring paraphrases for Algebraic
Word Problems (AWP) and presents a self-supervised method for doing so. In the
current online pedagogical setting, paraphrasing these problems is helpful for
academicians to generate multiple syntactically diverse questions for
assessments. It also helps induce variation to ensure that the student has
understood the problem instead of just memorizing it or using unfair means to
solve it. The current state-of-the-art paraphrase generation models often
cannot effectively paraphrase word problems, losing a critical piece of
information (such as numbers or units) which renders the question unsolvable.
There is a need for paraphrase scoring methods in the context of AWP to enable
the training of good paraphrasers. Thus, we propose ParaQD, a self-supervised
paraphrase quality detection method using novel data augmentations that can
learn latent representations to separate a high-quality paraphrase of an
algebraic question from a poor one by a wide margin. Through extensive
experimentation, we demonstrate that our method outperforms existing
state-of-the-art self-supervised methods by up to 32% while also demonstrating
impressive zero-shot performance.
- Abstract(参考訳): 本稿では,代数的単語問題 (AWP) のための言い回しを新しい課題として紹介し,それを行う自己指導手法を提案する。
現在のオンライン教育環境では、これらの問題を言い換えると、学者が複数の構文的に多様な質問をアセスメントのために生成するのに役立ちます。
また、学習者がそれを記憶したり、不公平な手段を使って解決するのではなく、問題を理解したことを確実にするために変化を誘発する。
現在の最先端のパラフレーズ生成モデルは、しばしば単語問題を効果的に言い表すことができず、問題に解けない重要な情報(数や単位など)を失う。
優れたパラフレーズの訓練を可能にするために, AWP の文脈において, パラフレーズスコアリング手法が必要である。
そこで本研究では,潜在表現を学習し,代数的質問の質の高い言い換えを,貧弱な問題から広いマージンで分離できる,新しいデータ拡張を用いた自己教師付き言い換え品質検出手法であるparaqdを提案する。
実験により,提案手法は既存の最先端の自己監督手法を最大32%向上させるとともに,印象的なゼロショット性能を示した。
関連論文リスト
- Learning by Analogy: Enhancing Few-Shot Prompting for Math Word Problem Solving with Computational Graph-Based Retrieval [22.865124583257987]
同様に構造化された質問の類似性によって,大規模言語モデルの問題解決能力が向上することを示す。
具体的には、与えられた質問に類似した計算グラフを持つ問題の検索を頼りに、プロンプトの見本として機能する。
6つの数学単語問題データセットに対する実験結果から,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2024-11-25T15:01:25Z) - Large Language Models as Analogical Reasoners [155.9617224350088]
CoT(Chain-of- Thought)は、言語モデルのプロンプトとして、推論タスク全体で素晴らしいパフォーマンスを示す。
そこで本稿では,大規模言語モデルの推論プロセスを自動的にガイドする,新たなプロンプト手法であるアナログプロンプトを導入する。
論文 参考訳(メタデータ) (2023-10-03T00:57:26Z) - Self-Polish: Enhance Reasoning in Large Language Models via Problem Refinement [50.62461749446111]
Self-Polish(SP)は、与えられた問題を徐々に洗練し、より理解しやすく解けるように誘導することによって、モデルの推論を促進する新しい方法である。
SPは、CoTのような答え/推論サイドの他のすべてのプロンプトメソッドであり、最先端の技術とのシームレスな統合を可能にし、さらなる改善を可能にします。
論文 参考訳(メタデータ) (2023-05-23T19:58:30Z) - Coherence and Diversity through Noise: Self-Supervised Paraphrase
Generation via Structure-Aware Denoising [5.682665111938764]
制御ノイズ注入によるパラフレーズ処理のための教師なしフレームワークであるSCANINGを提案する。
本稿では,オンライン教育に実践的な応用を持つ代数的単語問題を言い換える新しい課題に焦点をあてる。
我々はSCANingが意味保存と多種多様なパラフレーズの生成の両方の観点から性能を著しく向上させることを示した。
論文 参考訳(メタデータ) (2023-02-06T13:50:57Z) - Automatic Generation of Socratic Subquestions for Teaching Math Word
Problems [16.97827669744673]
本稿では,大言語モデル (LM) が数学用語の問題解決を導くためのシーケンシャルな質問を生成する能力について検討する。
自動品質評価と人的品質評価の両方において,所望の質問特性に制約されたLMが優れた質問を生成することがわかった。
その結果,課題の難易度は,質問が人間のパフォーマンスを損なうか否かを判断する上で重要な役割を担っていることが示唆された。
論文 参考訳(メタデータ) (2022-11-23T10:40:22Z) - Learning to Selectively Learn for Weakly-supervised Paraphrase
Generation [81.65399115750054]
弱監督データを用いた高品質なパラフレーズを生成するための新しい手法を提案する。
具体的には、弱制御されたパラフレーズ生成問題に以下のように取り組む。
検索に基づく擬似パラフレーズ展開により、豊富なラベル付き並列文を得る。
提案手法は,既存の教師なしアプローチよりも大幅に改善され,教師付き最先端技術と同等の性能を示す。
論文 参考訳(メタデータ) (2021-09-25T23:31:13Z) - Phrase Retrieval Learns Passage Retrieval, Too [77.57208968326422]
文節検索が,文節や文書を含む粗いレベルの検索の基盤となるかを検討する。
句検索システムでは,句検索の精度が向上し,句検索の精度が向上していることを示す。
また,句のフィルタリングやベクトル量子化により,インデックスのサイズを4~10倍に削減できることを示す。
論文 参考訳(メタデータ) (2021-09-16T17:42:45Z) - Dealing with Missing Modalities in the Visual Question Answer-Difference
Prediction Task through Knowledge Distillation [75.1682163844354]
我々は,視覚的質問応答拡散予測タスクから生じる欠落モダリティの問題に対処する。
本稿では,イメージ/質問/回答トリプレットを入力として,ベースラインを上回る「大きな」教師モデルを紹介する。
論文 参考訳(メタデータ) (2021-04-13T06:41:11Z) - My Teacher Thinks The World Is Flat! Interpreting Automatic Essay
Scoring Mechanism [71.34160809068996]
最近の研究では、自動スコアリングシステムが常識的な敵対的サンプルになりやすいことが示されています。
近年の解釈能力の進歩を活かし,コヒーレンスやコンテント,関連性といった特徴がスコアリングの自動化にどの程度重要であるかを見出す。
また、モデルが意味的に世界知識や常識に基づかないことから、世界のような虚偽の事実を追加することは、それを減らすよりもむしろスコアを増加させる。
論文 参考訳(メタデータ) (2020-12-27T06:19:20Z) - Automated Utterance Generation [5.220940151628735]
質問応答の特徴として関連する発話を用いることで、会話アシスタントによる正しい回答を検索するための精度とリコールが向上することが示されている。
本稿では,1)抽出要約を用いて記述から重要な文を抽出し,2)複数のパラフレーズを用いてタイトルと要約文の多種多様なパラフレーズを生成し,3)新しい候補選択アルゴリズムの助けを借りて優れた候補パラフレーズを選択する発話生成システムを提案する。
論文 参考訳(メタデータ) (2020-04-07T15:35:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。