Fugu-MT 論文翻訳(概要): Interpretable Math Word Problem Solution Generation Via Step-by-step Planning

論文の概要: Interpretable Math Word Problem Solution Generation Via Step-by-step Planning

arxiv url: http://arxiv.org/abs/2306.00784v1
Date: Thu, 1 Jun 2023 15:16:18 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-02 15:15:55.117518
Title: Interpretable Math Word Problem Solution Generation Via Step-by-step Planning
Title（参考訳）: ステップバイステップ計画による解釈可能な数学単語問題解生成
Authors: Mengxue Zhang and Zichao Wang and Zhichao Yang and Weiqi Feng and Andrew Lan
Abstract要約: 中間解生成のためのステップバイステップ計画手法を提案する。提案手法はまず,必要な算術演算の進行を予測し,次のステップを計画する。 GSM8Kデータセットの実験により,本手法が解の精度と解釈可能性を向上させることが示された。
参考スコア（独自算出の注目度）: 6.232269207752905
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Solutions to math word problems (MWPs) with step-by-step explanations are valuable, especially in education, to help students better comprehend problem-solving strategies. Most existing approaches only focus on obtaining the final correct answer. A few recent approaches leverage intermediate solution steps to improve final answer correctness but often cannot generate coherent steps with a clear solution strategy. Contrary to existing work, we focus on improving the correctness and coherence of the intermediate solutions steps. We propose a step-by-step planning approach for intermediate solution generation, which strategically plans the generation of the next solution step based on the MWP and the previous solution steps. Our approach first plans the next step by predicting the necessary math operation needed to proceed, given history steps, then generates the next step, token-by-token, by prompting a language model with the predicted math operation. Experiments on the GSM8K dataset demonstrate that our approach improves the accuracy and interpretability of the solution on both automatic metrics and human evaluation.
Abstract（参考訳）: ステップバイステップの説明を伴う数学用語問題(mwp)に対する解決策は、特に教育において、学生の問題解決戦略の理解を深めるために有用である。既存のアプローチのほとんどは、最終的な正解を得ることだけに焦点を当てている。最近のいくつかのアプローチでは、最終回答の正しさを改善するために中間解ステップを利用するが、明確な解戦略で一貫性のあるステップを生成することはできない。既存の作業とは対照的に、中間解ステップの正しさと整合性の改善に注力する。本稿では,MWPとそれ以前のソリューションステップに基づいて,次のソリューションステップの生成を戦略的に計画する,中間ソリューション生成のためのステップバイステップ計画手法を提案する。提案手法はまず,まず履歴段階の計算に必要な演算を予測して次のステップを計画し,次に予測された演算で言語モデルに促すことでトークン・バイ・トークンを生成する。 GSM8Kデータセットの実験は、我々の手法が自動測定と人的評価の両方で解の精度と解釈性を向上させることを示した。

関連論文リスト

Right Is Not Enough: The Pitfalls of Outcome Supervision in Training LLMs for Math Reasoning [35.142294794883455]
細粒度アノテーションを持つ新しいデータセットであるMathOlympiadEvalを導入し、LLMの回答の正しさとプロセスの正しさの間に大きなギャップがあることを明らかにした。 LLM-as-a-judgeのような既存の自動化手法は、これらの推論の欠陥を確実に検出するのに苦労する。そこで我々はParaStepVerifierを提案する。ParaStepVerifierは数学的解の厳密なステップバイステップ検証のための新しい手法である。
論文参考訳（メタデータ） (2025-06-07T17:54:56Z)
MathMistake Checker: A Comprehensive Demonstration for Step-by-Step Math Problem Mistake Finding by Prompt-Guided LLMs [13.756898876556455]
そこで本研究では,数理問題におけるステップ・バイ・ステップの誤り発見を自動化する新しいシステムであるMathMistake Checkerを提案する。本システムは,教育的観点からの学習経験を簡素化し,効率を向上させることを目的としている。
論文参考訳（メタデータ） (2025-03-06T10:19:01Z)
Step-KTO: Optimizing Mathematical Reasoning through Stepwise Binary Feedback [94.25162866972077]
Step-KTOは、プロセスレベルと結果レベルのバイナリフィードバックを組み合わせたトレーニングフレームワークである。実験の結果,Step-KTOは最終回答の精度と中間推論の質の両方を著しく向上させることがわかった。
論文参考訳（メタデータ） (2025-01-18T15:38:03Z)
Learning to Optimize for Mixed-Integer Non-linear Programming [20.469394148261838]
混合整数非NLPプログラム(MINLP)はエネルギーシステムや輸送など様々な領域で発生するが、解決は困難である。機械学習の最近の進歩は、最適化のための学習として知られる領域において、顕著な成功をもたらしている。勾配を保ちながら整数出力を生成する2つの異なる補正層を提案する。
論文参考訳（メタデータ） (2024-10-14T20:14:39Z)
Do Language Models Exhibit the Same Cognitive Biases in Problem Solving as Human Learners? [140.9751389452011]
本研究では,大言語モデル(LLM)の偏りを,算術語問題を解く際に,子どもに知られているものと関連づけて検討する。我々は,これらの各テストに対して,問題特徴のきめ細かい制御を可能にするニューロシンボリックアプローチを用いて,新しい単語問題を生成する。
論文参考訳（メタデータ） (2024-01-31T18:48:20Z)
SEGO: Sequential Subgoal Optimization for Mathematical Problem-Solving [64.38649623473626]
大規模言語モデル(LLM)は人工知能の大幅な進歩を導いた。数学的問題を解く能力を高めるために,textbfSEquential subtextbfGoal textbfOptimization (SEGO) という新しいフレームワークを提案する。
論文参考訳（メタデータ） (2023-10-19T17:56:40Z)
Thought Propagation: An Analogical Approach to Complex Reasoning with Large Language Models [62.96551299003463]
大規模言語モデルの複雑な推論能力を高めるために,textbftextitThought Propagation (TP)を提案する。 TP はまず LLM に対して,入力問題に関連する類似問題の集合を提案し,解決するよう促す。 TPは、類似問題の結果を再利用して、新しいソリューションを直接生成したり、スクラッチから得られた初期ソリューションを修正するための知識集約的な実行プランを導出する。
論文参考訳（メタデータ） (2023-10-06T01:40:09Z)
Evaluating and Improving Tool-Augmented Computation-Intensive Math Reasoning [75.74103236299477]
CoT(Chain-of- Thought prompting)とツール拡張は、大きな言語モデルを改善するための効果的なプラクティスとして検証されている。ツールインターフェース,すなわち textbfDELI を用いた推論ステップを考慮に入れた新しい手法を提案する。 CARPと他の6つのデータセットの実験結果から、提案されたDELIは、主に競合ベースラインを上回っていることが示された。
論文参考訳（メタデータ） (2023-06-04T17:02:59Z)
Learning Proximal Operators to Discover Multiple Optima [66.98045013486794]
非家族問題における近位演算子を学習するためのエンドツーエンド手法を提案する。本手法は,弱い目的と穏やかな条件下では,世界規模で収束することを示す。
論文参考訳（メタデータ） (2022-01-28T05:53:28Z)
Math Operation Embeddings for Open-ended Solution Analysis and Feedback [2.905751301655124]
我々は、認知チュータシステムに学生ソリューションステップを含むデータセットを使用して、算術演算の暗黙的かつ明示的な表現を学習する。実験結果は、学習した数学操作が異なるデータ分布にわたって表現をうまく一般化することを示している。
論文参考訳（メタデータ） (2021-04-25T02:09:17Z)
Learning by Fixing: Solving Math Word Problems with Weak Supervision [70.62896781438694]
数学用語問題(mwps)の従来のニューラルネットワークソルバは、完全な監視によって学習され、多様なソリューションを生み出すことができない。 MWPを学習するためのテキスト弱教師付きパラダイムを提案する。この手法は最終回答のアノテーションのみを必要とし、単一の問題に対して様々な解決策を生成できる。
論文参考訳（メタデータ） (2020-12-19T03:10:21Z)
Submodular Meta-Learning [43.15332631500541]
将来的なタスクのパフォーマンス向上のために,メタラーニングフレームワークの個別版を導入する。我々のアプローチは、事前データ、すなわち、以前に訪れたタスクを使用して、適切な初期ソリューションセットをトレーニングすることを目的としている。我々のフレームワークは、性能損失を小さく抑えながら、新しいタスクを解く際に、計算の複雑さを著しく低減させることを示した。
論文参考訳（メタデータ） (2020-07-11T21:02:48Z)
Meta Cyclical Annealing Schedule: A Simple Approach to Avoiding Meta-Amortization Error [50.83356836818667]
循環型アニーリングスケジュールとMMD基準を用いた新しいメタレギュラー化目標を構築した。実験の結果,本手法は標準的なメタ学習アルゴリズムよりもかなり優れていることがわかった。
論文参考訳（メタデータ） (2020-03-04T04:43:16Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。