論文の概要: Interpretable Math Word Problem Solution Generation Via Step-by-step
Planning
- arxiv url: http://arxiv.org/abs/2306.00784v1
- Date: Thu, 1 Jun 2023 15:16:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-02 15:15:55.117518
- Title: Interpretable Math Word Problem Solution Generation Via Step-by-step
Planning
- Title(参考訳): ステップバイステップ計画による解釈可能な数学単語問題解生成
- Authors: Mengxue Zhang and Zichao Wang and Zhichao Yang and Weiqi Feng and
Andrew Lan
- Abstract要約: 中間解生成のためのステップバイステップ計画手法を提案する。
提案手法はまず,必要な算術演算の進行を予測し,次のステップを計画する。
GSM8Kデータセットの実験により,本手法が解の精度と解釈可能性を向上させることが示された。
- 参考スコア(独自算出の注目度): 6.232269207752905
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Solutions to math word problems (MWPs) with step-by-step explanations are
valuable, especially in education, to help students better comprehend
problem-solving strategies. Most existing approaches only focus on obtaining
the final correct answer. A few recent approaches leverage intermediate
solution steps to improve final answer correctness but often cannot generate
coherent steps with a clear solution strategy. Contrary to existing work, we
focus on improving the correctness and coherence of the intermediate solutions
steps. We propose a step-by-step planning approach for intermediate solution
generation, which strategically plans the generation of the next solution step
based on the MWP and the previous solution steps. Our approach first plans the
next step by predicting the necessary math operation needed to proceed, given
history steps, then generates the next step, token-by-token, by prompting a
language model with the predicted math operation. Experiments on the GSM8K
dataset demonstrate that our approach improves the accuracy and
interpretability of the solution on both automatic metrics and human
evaluation.
- Abstract(参考訳): ステップバイステップの説明を伴う数学用語問題(mwp)に対する解決策は、特に教育において、学生の問題解決戦略の理解を深めるために有用である。
既存のアプローチのほとんどは、最終的な正解を得ることだけに焦点を当てている。
最近のいくつかのアプローチでは、最終回答の正しさを改善するために中間解ステップを利用するが、明確な解戦略で一貫性のあるステップを生成することはできない。
既存の作業とは対照的に、中間解ステップの正しさと整合性の改善に注力する。
本稿では,MWPとそれ以前のソリューションステップに基づいて,次のソリューションステップの生成を戦略的に計画する,中間ソリューション生成のためのステップバイステップ計画手法を提案する。
提案手法はまず,まず履歴段階の計算に必要な演算を予測して次のステップを計画し,次に予測された演算で言語モデルに促すことでトークン・バイ・トークンを生成する。
GSM8Kデータセットの実験は、我々の手法が自動測定と人的評価の両方で解の精度と解釈性を向上させることを示した。
関連論文リスト
- Learning to Optimize for Mixed-Integer Non-linear Programming [20.469394148261838]
混合整数非NLPプログラム(MINLP)はエネルギーシステムや輸送など様々な領域で発生するが、解決は困難である。
機械学習の最近の進歩は、最適化のための学習として知られる領域において、顕著な成功をもたらしている。
勾配を保ちながら整数出力を生成する2つの異なる補正層を提案する。
論文 参考訳(メタデータ) (2024-10-14T20:14:39Z) - Do Language Models Exhibit the Same Cognitive Biases in Problem Solving as Human Learners? [140.9751389452011]
本研究では,大言語モデル(LLM)の偏りを,算術語問題を解く際に,子どもに知られているものと関連づけて検討する。
我々は,これらの各テストに対して,問題特徴のきめ細かい制御を可能にするニューロシンボリックアプローチを用いて,新しい単語問題を生成する。
論文 参考訳(メタデータ) (2024-01-31T18:48:20Z) - SEGO: Sequential Subgoal Optimization for Mathematical Problem-Solving [64.38649623473626]
大規模言語モデル(LLM)は人工知能の大幅な進歩を導いた。
数学的問題を解く能力を高めるために,textbfSEquential subtextbfGoal textbfOptimization (SEGO) という新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-19T17:56:40Z) - Thought Propagation: An Analogical Approach to Complex Reasoning with Large Language Models [62.96551299003463]
大規模言語モデルの複雑な推論能力を高めるために,textbftextitThought Propagation (TP)を提案する。
TP はまず LLM に対して,入力問題に関連する類似問題の集合を提案し,解決するよう促す。
TPは、類似問題の結果を再利用して、新しいソリューションを直接生成したり、スクラッチから得られた初期ソリューションを修正するための知識集約的な実行プランを導出する。
論文 参考訳(メタデータ) (2023-10-06T01:40:09Z) - Evaluating and Improving Tool-Augmented Computation-Intensive Math
Reasoning [75.74103236299477]
CoT(Chain-of- Thought prompting)とツール拡張は、大きな言語モデルを改善するための効果的なプラクティスとして検証されている。
ツールインターフェース,すなわち textbfDELI を用いた推論ステップを考慮に入れた新しい手法を提案する。
CARPと他の6つのデータセットの実験結果から、提案されたDELIは、主に競合ベースラインを上回っていることが示された。
論文 参考訳(メタデータ) (2023-06-04T17:02:59Z) - Learning Proximal Operators to Discover Multiple Optima [66.98045013486794]
非家族問題における近位演算子を学習するためのエンドツーエンド手法を提案する。
本手法は,弱い目的と穏やかな条件下では,世界規模で収束することを示す。
論文 参考訳(メタデータ) (2022-01-28T05:53:28Z) - Math Operation Embeddings for Open-ended Solution Analysis and Feedback [2.905751301655124]
我々は、認知チュータシステムに学生ソリューションステップを含むデータセットを使用して、算術演算の暗黙的かつ明示的な表現を学習する。
実験結果は、学習した数学操作が異なるデータ分布にわたって表現をうまく一般化することを示している。
論文 参考訳(メタデータ) (2021-04-25T02:09:17Z) - Submodular Meta-Learning [43.15332631500541]
将来的なタスクのパフォーマンス向上のために,メタラーニングフレームワークの個別版を導入する。
我々のアプローチは、事前データ、すなわち、以前に訪れたタスクを使用して、適切な初期ソリューションセットをトレーニングすることを目的としている。
我々のフレームワークは、性能損失を小さく抑えながら、新しいタスクを解く際に、計算の複雑さを著しく低減させることを示した。
論文 参考訳(メタデータ) (2020-07-11T21:02:48Z) - Meta Cyclical Annealing Schedule: A Simple Approach to Avoiding
Meta-Amortization Error [50.83356836818667]
循環型アニーリングスケジュールとMMD基準を用いた新しいメタレギュラー化目標を構築した。
実験の結果,本手法は標準的なメタ学習アルゴリズムよりもかなり優れていることがわかった。
論文 参考訳(メタデータ) (2020-03-04T04:43:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。