Fugu-MT 論文翻訳(概要): Brain-Inspired Two-Stage Approach: Enhancing Mathematical Reasoning by Imitating Human Thought Processes

論文の概要: Brain-Inspired Two-Stage Approach: Enhancing Mathematical Reasoning by Imitating Human Thought Processes

arxiv url: http://arxiv.org/abs/2403.00800v1
Date: Fri, 23 Feb 2024 17:40:31 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-10 23:57:45.010334
Title: Brain-Inspired Two-Stage Approach: Enhancing Mathematical Reasoning by Imitating Human Thought Processes
Title（参考訳）: 脳にインスパイアされた二段階アプローチ--思考過程の模倣による数学的推論の強化
Authors: Yezeng Chen, Zui Chen, Yi Zhou
Abstract要約: 本稿では,人間の思考過程を模倣し,数学的推論能力を高める新しい手法であるBrainを提案する。まず,コードLLaMA 7Bをベースとしたモデルと比較し,SOTAの性能を評価する。第二に、計画が自然言語、コード、形式言語から明示的に抽出できることが分かる。
参考スコア（独自算出の注目度）: 6.512667145063511
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Although large language models demonstrate emergent abilities in solving math word problems, there is a challenging task in complex multi-step mathematical reasoning tasks. To improve model performance on mathematical reasoning tasks, previous work has conducted supervised fine-tuning on open-source models by improving the quality and quantity of data. In this paper, we propose a novel approach, named Brain, to imitate human thought processes to enhance mathematical reasoning abilities, using the Frontal Lobe Model to generate plans, and then employing the Parietal Lobe Model to generate code and execute to obtain answers. First, we achieve SOTA performance in comparison with Code LLaMA 7B based models through this method. Secondly, we find that plans can be explicitly extracted from natural language, code, or formal language. Our code and data are publicly available at https://github.com/cyzhh/Brain.
Abstract（参考訳）: 大きな言語モデルは、数学用語の問題解決において創発的な能力を示すが、複雑な多段階の数学的推論タスクでは難しい課題がある。数学的推論タスクにおけるモデル性能を向上させるため、従来の研究はデータの質と量を改善し、オープンソースモデルの微調整を行った。本稿では,人間の思考過程を模倣して数学的推論能力を高め,前頭葉モデルを用いて計画を生成し,頭頂葉モデルを用いてコードを生成し,回答を得る新しいアプローチであるbrainを提案する。まず,コードLLaMA 7Bに基づくモデルと比較し,SOTAの性能を評価する。第二に、計画が自然言語、コード、形式言語から明示的に抽出できることが分かる。私たちのコードとデータはhttps://github.com/cyzhh/brainで公開されている。

関連論文リスト

ClozeMath: Improving Mathematical Reasoning in Language Models by Learning to Fill Equations [29.51572057789961]
そこで我々はClozeMathという新しい手法を提案し,数学的推論のための大規模言語モデルを微調整する。私たちのClozeMathは、人間の学習で使用されるクローズエクササイズに似た、与えられたソリューションからマスクされた方程式を予測するテキスト入力タスクを含んでいます。 GSM8K、MATH、GSM-Symbolicの実験では、CloseMathはパフォーマンスとロバスト性において強力なベースラインであるMasked Thoughtを上回っている。
論文参考訳（メタデータ） (2025-06-04T09:27:21Z)
MathFimer: Enhancing Mathematical Reasoning by Expanding Reasoning Steps through Fill-in-the-Middle Task [49.355810887265925]
数学的推論ステップ拡張のための新しいフレームワークであるMathFimerを紹介する。我々は、慎重にキュレートしたNuminaMath-FIMデータセットに基づいて、特殊モデルMathFimer-7Bを開発した。次に、これらのモデルを適用して、解鎖に詳細な中間ステップを挿入することで、既存の数学的推論データセットを強化する。
論文参考訳（メタデータ） (2025-02-17T11:22:24Z)
MathCoder2: Better Math Reasoning from Continued Pretraining on Model-translated Mathematical Code [38.127313175508746]
本稿では, 継続事前学習のための推論ステップを伴って, 数学的コードを生成する新しい手法を提案する。私たちのアプローチは、高品質な数学的継続事前学習データセットの構築から始まります。生成されたコードを推論ステップ毎に適用すると、ペアの自然言語推論ステップとその対応するコードからなるデータが得られる。
論文参考訳（メタデータ） (2024-10-10T17:58:40Z)
MathLearner: A Large Language Model Agent Framework for Learning to Solve Mathematical Problems [0.936726079405677]
本稿では,帰納的推論に基づく数学的問題を解くためのエージェントフレームワークを提案する。学習情報の一般化に関する人間の学習過程をエミュレートすることにより、この枠組みは数学的推論プロセスにおいて優れた性能を発揮する。我々のモデルは個人化された学習支援として利用でき、教育資源の不平等を軽減できる。
論文参考訳（メタデータ） (2024-08-03T13:28:19Z)
InternLM-Math: Open Math Large Language Models Toward Verifiable Reasoning [98.53491178426492]
InternLM2から事前学習を継続するILMs InternLM-Mathをオープンソースとして公開する。我々は、連鎖推論、報酬モデリング、形式推論、データ拡張、コードインタプリタを、統一されたSeq2seqフォーマットで統一する。我々の事前学習モデルは、微調整なしでMiniF2Fテストセットで30.3を達成する。
論文参考訳（メタデータ） (2024-02-09T11:22:08Z)
MMToM-QA: Multimodal Theory of Mind Question Answering [80.87550820953236]
心の理論 (ToM) は人間レベルの社会知能を持つ機械を開発する上で不可欠な要素である。最近の機械学習モデル、特に大きな言語モデルは、ToM理解のいくつかの側面を示しているようだ。一方、ヒューマンToMはビデオやテキストの理解以上のものです。人は、利用可能なデータから抽出された概念的表現に基づいて、他人の心について柔軟に推論することができる。
論文参考訳（メタデータ） (2024-01-16T18:59:24Z)
MathCoder: Seamless Code Integration in LLMs for Enhanced Mathematical Reasoning [52.97768001837269]
本稿では,オープンソース言語モデルを微調整する手法を提案する。本稿では,問題のある新しい,高品質なデータセットを生成する手法とそのコードベースソリューションを提案する。このアプローチは、問題の解決にコードベースのソリューションを生成することができるモデルのファミリーであるMathCoderモデルを生成する。
論文参考訳（メタデータ） (2023-10-05T17:52:09Z)
A Survey of Deep Learning for Mathematical Reasoning [71.88150173381153]
我々は過去10年間の数学的推論とディープラーニングの交差点における重要なタスク、データセット、方法についてレビューする。大規模ニューラルネットワークモデルの最近の進歩は、新しいベンチマークと、数学的推論にディープラーニングを使用する機会を開放している。
論文参考訳（メタデータ） (2022-12-20T18:46:16Z)
JiuZhang: A Chinese Pre-trained Language Model for Mathematical Problem Understanding [74.12405417718054]
本稿では,中国初の数学的事前学習言語モデル(PLM)を提示することにより,機械の数学的知性向上を目指す。他の標準のNLPタスクとは異なり、数学的テキストは問題文に数学的用語、記号、公式を含むため理解が難しい。基礎課程と上級課程の両方からなる数学PLMの学習を改善するための新しいカリキュラム事前学習手法を設計する。
論文参考訳（メタデータ） (2022-06-13T17:03:52Z)
Enhancing Neural Mathematical Reasoning by Abductive Combination with Symbolic Library [5.339286921277565]
本稿では,人的知識でプログラムされた離散的なシステムと帰納的な組み合わせによって,いくつかの能力が達成できることを実証する。数学的推論データセットでは、最近提案された帰納的学習フレームワークを採用し、トランスフォーマーモデルと記号数学ライブラリを組み合わせたABL-Symアルゴリズムを提案する。
論文参考訳（メタデータ） (2022-03-28T04:19:39Z)
SMART: A Situation Model for Algebra Story Problems via Attributed Grammar [74.1315776256292]
本稿では, 問題解決における人間の精神状態を表現する心理学研究から生まれた, emphsituation modelの概念を紹介する。提案モデルでは,より優れた解釈性を保ちながら,従来のすべてのニューラルソルバを大きなマージンで上回る結果が得られた。
論文参考訳（メタデータ） (2020-12-27T21:03:40Z)
Generating Math Word Problems from Equations with Topic Controlling and Commonsense Enforcement [11.459200644989227]
本稿では,新しいテキスト生成モデルを提案する。本モデルでは, 方程式を効果的に符号化するフレキシブルなスキームを提案し, 可変オートエンコーダ(VAE)による方程式エンコーダを強化する。
論文参考訳（メタデータ） (2020-12-14T10:02:11Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。