論文の概要: ATHENA: Mathematical Reasoning with Thought Expansion
- arxiv url: http://arxiv.org/abs/2311.01036v1
- Date: Thu, 2 Nov 2023 07:03:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-03 14:27:47.275110
- Title: ATHENA: Mathematical Reasoning with Thought Expansion
- Title(参考訳): athena: 思考拡大を伴う数学的推論
- Authors: JB. Kim, Hazel Kim, Joonghyuk Hahn, Yo-Sub Han
- Abstract要約: ATHENA(Attention-based Thought Expansion Network Architecture)を導入し、現実の実践の課題に取り組む。
思考拡大は、前段から導かれる算数表現の思考を担っている候補を連続的に生成する。
- 参考スコア(独自算出の注目度): 3.3727470465639833
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Solving math word problems depends on how to articulate the problems, the
lens through which models view human linguistic expressions. Real-world
settings count on such a method even more due to the diverse practices of the
same mathematical operations. Earlier works constrain available thinking
processes by limited prediction strategies without considering their
significance in acquiring mathematical knowledge. We introduce Attention-based
THought Expansion Network Architecture (ATHENA) to tackle the challenges of
real-world practices by mimicking human thought expansion mechanisms in the
form of neural network propagation. A thought expansion recurrently generates
the candidates carrying the thoughts of possible math expressions driven from
the previous step and yields reasonable thoughts by selecting the valid
pathways to the goal. Our experiments show that ATHENA achieves a new
state-of-the-art stage toward the ideal model that is compelling in variant
questions even when the informativeness in training examples is restricted.
- Abstract(参考訳): 数学用語の問題の解決は、人間の言語表現を見るためのレンズである問題をどう表現するかに依存する。
現実世界の設定は、同じ数学的操作の多様な実践のために、そのような方法にさらに依存する。
従来の研究は、数学的知識獲得の意義を考慮せずに、限られた予測戦略によって利用可能な思考過程を制約していた。
本稿では,注意に基づく思考拡張ネットワークアーキテクチャ(athena)を導入し,人間の思考拡張機構をニューラルネットワーク伝播の形で模倣することにより,実世界の実践の課題に取り組む。
思考拡大は、前ステップから駆動される算数表現の思考を担っている候補を反復的に生成し、目標への有効な経路を選択して合理的な思考を得る。
実験の結果,AtheNAは,学習例における情報性が制限された場合でも,変分質問に魅力的な理想モデルに向けて,新たな最先端の段階を達成できることが示唆された。
関連論文リスト
- Learn Beyond The Answer: Training Language Models with Reflection for Mathematical Reasoning [59.98430756337374]
教師付き微調整により、様々な数学的推論タスクにおける言語モデルの問題解決能力が向上する。
本研究は,手前のトレーニング問題をより深く理解することを目的とした,新しい技術を紹介する。
本稿では,各トレーニングインスタンスに問題反映を埋め込む手法であるリフレクティブ拡張を提案する。
論文 参考訳(メタデータ) (2024-06-17T19:42:22Z) - Brain-Inspired Two-Stage Approach: Enhancing Mathematical Reasoning by
Imitating Human Thought Processes [6.512667145063511]
本稿では,人間の思考過程を模倣し,数学的推論能力を高める新しい手法であるBrainを提案する。
まず,コードLLaMA 7Bをベースとしたモデルと比較し,SOTAの性能を評価する。
第二に、計画が自然言語、コード、形式言語から明示的に抽出できることが分かる。
論文 参考訳(メタデータ) (2024-02-23T17:40:31Z) - Large Language Models as Analogical Reasoners [155.9617224350088]
CoT(Chain-of- Thought)は、言語モデルのプロンプトとして、推論タスク全体で素晴らしいパフォーマンスを示す。
そこで本稿では,大規模言語モデルの推論プロセスを自動的にガイドする,新たなプロンプト手法であるアナログプロンプトを導入する。
論文 参考訳(メタデータ) (2023-10-03T00:57:26Z) - The Art of SOCRATIC QUESTIONING: Recursive Thinking with Large Language
Models [45.01562498702836]
CoT(Chain-of-Thought)は、中間ステップを生成することで、大規模言語モデルによる複雑な推論問題の解決を可能にする。
本稿では,再帰的思考過程を模倣する分割・対数型アルゴリズムであるSOCRATIC QUESTIONINGを提案する。
論文 参考訳(メタデータ) (2023-05-24T10:36:14Z) - Learning to solve arithmetic problems with a virtual abacus [0.35911228556176483]
本稿では,認知エージェントが算術的問題を解くための学習方法をシミュレートする,深層強化学習フレームワークを提案する。
提案モデルでは,複数桁の加算と減算をうまく学習し,誤差率を1%以下に抑えることができた。
最も一般的なエラーパターンを分析して、設計選択による制限とバイアスをよりよく理解します。
論文 参考訳(メタデータ) (2023-01-17T13:25:52Z) - A Survey of Deep Learning for Mathematical Reasoning [71.88150173381153]
我々は過去10年間の数学的推論とディープラーニングの交差点における重要なタスク、データセット、方法についてレビューする。
大規模ニューラルネットワークモデルの最近の進歩は、新しいベンチマークと、数学的推論にディープラーニングを使用する機会を開放している。
論文 参考訳(メタデータ) (2022-12-20T18:46:16Z) - Chaining Simultaneous Thoughts for Numerical Reasoning [92.2007997126144]
テキストによる数値推論は、AIシステムにとって不可欠なスキルであるべきです。
これまでの研究は方程式の構造をモデル化することに集中し、様々な構造化デコーダを提案してきた。
我々は、有向非巡回グラフを用いてステップを推論する数値推論器CANTORを提案する。
論文 参考訳(メタデータ) (2022-11-29T18:52:06Z) - Peano: Learning Formal Mathematical Reasoning [35.086032962873226]
一般的な数学的推論は計算不可能であるが、人間は新しい問題を常に解決している。
両パズルの中心は、数学の基礎となる手続き的抽象の構造であると仮定する。
カーン・アカデミー・プラットフォーム上の始点代数の5つの部分に関するケーススタディにおいて、このアイデアを探求する。
論文 参考訳(メタデータ) (2022-11-29T01:42:26Z) - SMART: A Situation Model for Algebra Story Problems via Attributed
Grammar [74.1315776256292]
本稿では, 問題解決における人間の精神状態を表現する心理学研究から生まれた, emphsituation modelの概念を紹介する。
提案モデルでは,より優れた解釈性を保ちながら,従来のすべてのニューラルソルバを大きなマージンで上回る結果が得られた。
論文 参考訳(メタデータ) (2020-12-27T21:03:40Z) - Machine Number Sense: A Dataset of Visual Arithmetic Problems for
Abstract and Relational Reasoning [95.18337034090648]
文法モデルを用いて自動生成される視覚的算術問題からなるデータセット、MNS(Machine Number Sense)を提案する。
これらの視覚的算術問題は幾何学的フィギュアの形をしている。
我々は、この視覚的推論タスクのベースラインとして、4つの主要なニューラルネットワークモデルを用いて、MNSデータセットをベンチマークする。
論文 参考訳(メタデータ) (2020-04-25T17:14:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。