論文の概要: Generalizing Math Word Problem Solvers via Solution Diversification
- arxiv url: http://arxiv.org/abs/2212.00833v1
- Date: Thu, 1 Dec 2022 19:34:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-05 15:36:08.387161
- Title: Generalizing Math Word Problem Solvers via Solution Diversification
- Title(参考訳): 解の多様化による数学単語問題解の一般化
- Authors: Zhenwen Liang, Jipeng Zhang, Lei Wang, Yan Wang, Jie Shao, Xiangliang
Zhang
- Abstract要約: 我々は,解バッファと解判別器を導入することで,MWPソルバの新しいトレーニングフレームワークを設計する。
本フレームワークは,全Seq2Seq MWPソルバの完全・半弱・弱教師付きトレーニングに柔軟に適用可能である。
- 参考スコア(独自算出の注目度): 56.2690023011738
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Current math word problem (MWP) solvers are usually Seq2Seq models trained by
the (one-problem; one-solution) pairs, each of which is made of a problem
description and a solution showing reasoning flow to get the correct answer.
However, one MWP problem naturally has multiple solution equations. The
training of an MWP solver with (one-problem; one-solution) pairs excludes other
correct solutions, and thus limits the generalizability of the MWP solver. One
feasible solution to this limitation is to augment multiple solutions to a
given problem. However, it is difficult to collect diverse and accurate augment
solutions through human efforts. In this paper, we design a new training
framework for an MWP solver by introducing a solution buffer and a solution
discriminator. The buffer includes solutions generated by an MWP solver to
encourage the training data diversity. The discriminator controls the quality
of buffered solutions to participate in training. Our framework is flexibly
applicable to a wide setting of fully, semi-weakly and weakly supervised
training for all Seq2Seq MWP solvers. We conduct extensive experiments on a
benchmark dataset Math23k and a new dataset named Weak12k, and show that our
framework improves the performance of various MWP solvers under different
settings by generating correct and diverse solutions.
- Abstract(参考訳): 現在の数学語問題(MWP)の解法は通常セック2Seqモデルであり、それぞれが問題記述と正しい解を得るための推論フローを示す解で構成されている。
しかし、1つのMWP問題は自然に複数の解方程式を持つ。
MWPソルバの (1-problem; 1-solution) ペアによるトレーニングは、他の正しい解を除外し、MWPソルバの一般化性を制限する。
この制限に対する実現可能な解決策の1つは、与えられた問題に対する複数のソリューションを強化することである。
しかし、人間の努力によって多様で正確な拡張ソリューションを収集することは困難である。
本稿では,解バッファと解判別器を導入することで,MWPソルバの新しいトレーニングフレームワークを設計する。
バッファは、トレーニングデータの多様性を促進するためにMWPソルバによって生成されるソリューションを含む。
判別器は、訓練に参加するための緩衝液の品質を制御する。
本フレームワークは,全Seq2Seq MWPソルバの完全・半弱・弱教師付きトレーニングに柔軟に適用可能である。
我々はベンチマークデータセットMath23kとWeak12kという新しいデータセットについて広範な実験を行い、そのフレームワークが正しい解を生成することで様々なMWPソルバの性能を向上させることを示す。
関連論文リスト
- Solving Math Word Problem with Problem Type Classification [12.700472956406005]
数学語問題(MWP)は、解を導出するためにテキスト記述を分析し、数学的方程式を生成する必要がある。
既存の研究は、木ベースの解法と大規模言語モデル(LLM)の2種類の解法でMWPを解くことに重点を置いている。
本稿では,MWP解決能力の向上に複数のアンサンブル手法を用いる。
論文 参考訳(メタデータ) (2023-08-26T10:35:16Z) - Learning by Analogy: Diverse Questions Generation in Math Word Problem [21.211970350827183]
AI技術を用いた数学語問題(MWP)の解法は、最近ディープニューラルネットワーク(DNN)の成功で大きな進歩を遂げた。
我々は、MWPソルバが様々な方法で定式化されるのと同じ問題をよりよく理解するために、類推による学習能力が不可欠であると主張する。
本稿では,MWPを多様だが一貫した問合せ/解法を生成することで,MWPの解法を初めて試みる。
論文 参考訳(メタデータ) (2023-06-15T11:47:07Z) - LogicSolver: Towards Interpretable Math Word Problem Solving with
Logical Prompt-enhanced Learning [135.8654475934613]
我々はまず,11,495MWPからなる高品質MWPデータセットInterMWPを構築した。
本稿では論理的プロンプトと解釈を用いた新しい手法であるLogicrを提案する。
これらの改良されたセマンティック表現により、我々のLogicrは、生成された解表現に従って対応する解表現と解釈可能な知識を生成する。
論文 参考訳(メタデータ) (2022-05-17T11:01:52Z) - A Mutual Information Maximization Approach for the Spurious Solution
Problem in Weakly Supervised Question Answering [60.768146126094955]
弱々しい教師付き質問応答は通常、最終的な答えのみを監督信号として持つ。
偶然に正解を導出する刺激的な解が多数存在するかもしれないが、そのような解の訓練はモデルの性能を損なう可能性がある。
本稿では,質問応答対と予測解間の相互情報の最大化により,このような意味的相関を明示的に活用することを提案する。
論文 参考訳(メタデータ) (2021-06-14T05:47:41Z) - WARM: A Weakly (+Semi) Supervised Model for Solving Math word Problems [21.501567886241087]
数学語問題(MWP)の解法は自然言語処理において重要かつ困難な問題である。
本稿では,MWPを監督する上で最終回答のみを必要とすることにより,MWPを解くための弱教師付きモデルを提案する。
提案手法は,最先端の弱教師付きアプローチに比べて精度が4.5%,32%向上することが実証された。
論文 参考訳(メタデータ) (2021-04-14T09:25:38Z) - Discovering Diverse Solutions in Deep Reinforcement Learning [84.45686627019408]
強化学習アルゴリズムは通常、特定のタスクの単一のソリューションを学ぶことに限定される。
連続的あるいは離散的な低次元潜在変数に条件付きポリシーを訓練することにより、無限に多くの解を学習できるRL法を提案する。
論文 参考訳(メタデータ) (2021-03-12T04:54:31Z) - Learning by Fixing: Solving Math Word Problems with Weak Supervision [70.62896781438694]
数学用語問題(mwps)の従来のニューラルネットワークソルバは、完全な監視によって学習され、多様なソリューションを生み出すことができない。
MWPを学習するためのテキスト弱教師付きパラダイムを提案する。
この手法は最終回答のアノテーションのみを必要とし、単一の問題に対して様々な解決策を生成できる。
論文 参考訳(メタデータ) (2020-12-19T03:10:21Z) - Neural Learning of One-of-Many Solutions for Combinatorial Problems in
Structured Output Spaces [20.101005623256626]
複数のソリューションの存在に消極的であることは、トレーニング能力を著しく損なう可能性がある、と私たちは主張する。
本稿では、既存の予測ネットワークをRL問題に適用し、解乗法を扱う汎用学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-08-27T08:37:01Z) - Pareto Multi-Task Learning [53.90732663046125]
マルチタスク学習は複数の相関タスクを同時に解くための強力な方法である。
異なるタスクが互いに衝突する可能性があるため、すべてのタスクを最適化するひとつのソリューションを見つけることは、しばしば不可能である。
近年,マルチタスク学習を多目的最適化として活用することにより,タスク間のトレードオフが良好である1つのパレート最適解を求める方法が提案されている。
論文 参考訳(メタデータ) (2019-12-30T08:58:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。