論文の概要: Learning to Solve Geometry Problems via Simulating Human Dual-Reasoning Process
- arxiv url: http://arxiv.org/abs/2405.06232v1
- Date: Fri, 10 May 2024 03:53:49 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-13 16:47:25.775143
- Title: Learning to Solve Geometry Problems via Simulating Human Dual-Reasoning Process
- Title(参考訳): 双対推論過程のシミュレーションによる幾何学的問題の解法
- Authors: Tong Xiao, Jiayu Liu, Zhenya Huang, Jinze Wu, Jing Sha, Shijin Wang, Enhong Chen,
- Abstract要約: 近年,幾何学的問題解決 (GPS) が注目されている。
解法は、テキストとダイアグラムの両方を包括的に理解し、重要な幾何学的知識を習得し、推論に適切に適用する必要がある。
既存の研究は、ニューラルネットワーク翻訳のパラダイムに従っており、人間の幾何学的推論の本質的な特徴を無視したエンコーダの能力の向上にのみ焦点をあてている。
- 参考スコア(独自算出の注目度): 84.49427910920008
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Geometry Problem Solving (GPS), which is a classic and challenging math problem, has attracted much attention in recent years. It requires a solver to comprehensively understand both text and diagram, master essential geometry knowledge, and appropriately apply it in reasoning. However, existing works follow a paradigm of neural machine translation and only focus on enhancing the capability of encoders, which neglects the essential characteristics of human geometry reasoning. In this paper, inspired by dual-process theory, we propose a Dual-Reasoning Geometry Solver (DualGeoSolver) to simulate the dual-reasoning process of humans for GPS. Specifically, we construct two systems in DualGeoSolver, namely Knowledge System and Inference System. Knowledge System controls an implicit reasoning process, which is responsible for providing diagram information and geometry knowledge according to a step-wise reasoning goal generated by Inference System. Inference System conducts an explicit reasoning process, which specifies the goal in each reasoning step and applies the knowledge to generate program tokens for resolving it. The two systems carry out the above process iteratively, which behaves more in line with human cognition. We conduct extensive experiments on two benchmark datasets, GeoQA and GeoQA+. The results demonstrate the superiority of DualGeoSolver in both solving accuracy and robustness from explicitly modeling human reasoning process and knowledge application.
- Abstract(参考訳): 近年,幾何問題解法(GPS)が注目されている。
解法は、テキストとダイアグラムの両方を包括的に理解し、重要な幾何学的知識を習得し、推論に適切に適用する必要がある。
しかし、既存の研究はニューラルネットワーク翻訳のパラダイムに従っており、人間の幾何学的推論の本質的な特徴を無視したエンコーダの能力の向上にのみ焦点をあてている。
本稿では, デュアルプロセス理論に触発されたDual-Reasoning Geometry Solver (DualGeoSolver) を提案する。
具体的には、DualGeoSolver(知識システム)と推論システム(推論システム)の2つのシステムを構築する。
知識システムは、推論システムによって生成されたステップワイズ推論目標に従って図情報と幾何学的知識を提供する責務を負う暗黙の推論プロセスを制御する。
推論システムは明示的な推論プロセスを実行し、各推論ステップのゴールを特定し、その知識を適用してその解決のためのプログラムトークンを生成する。
2つのシステムは上記のプロセスを反復的に実行し、人間の認知とより一致して振る舞う。
我々はGeoQAとGeoQA+という2つのベンチマークデータセットについて広範な実験を行った。
その結果、人間の推論プロセスと知識応用を明示的にモデル化することによる精度と堅牢性の両方において、DualGeoSolverの優位性が示された。
関連論文リスト
- Fuse, Reason and Verify: Geometry Problem Solving with Parsed Clauses from Diagram [78.79651421493058]
平面幾何学的問題解法 (PGPS) のニューラルネットワークモデルを提案し, モーダル融合, 推論過程, 知識検証の3つの重要なステップについて述べる。
推論のために、幾何学的推論過程を記述するための説明可能な解プログラムを設計し、自己限定デコーダを用いて解プログラムを自動回帰的に生成する。
また, PGPS9Kと呼ばれる大規模幾何学的問題データセットを構築し, テキスト節, 解法プログラム, 関連知識解決器の詳細なアノテーションを含む。
論文 参考訳(メタデータ) (2024-07-10T02:45:22Z) - FGeo-DRL: Deductive Reasoning for Geometric Problems through Deep
Reinforcement Learning [1.137457877869062]
我々はFGeoDRLと呼ばれるニューラルシンボリックシステムを構築し、人間のような幾何学的推論を自動的に行う。
神経部分は強化学習に基づくAIエージェントであり、問題解決方法を自律的に学習することができる。
フォーマルなgeo7kデータセットで実施された実験は、86.40%の問題解決成功率を達成した。
論文 参考訳(メタデータ) (2024-02-14T09:48:39Z) - FormalGeo: An Extensible Formalized Framework for Olympiad Geometric
Problem Solving [9.73597821684857]
これは、私たちが過去3年間に達成した一連の研究の中で、初めての論文です。
本稿では,一貫した平面幾何学システムを構築した。
これは、IMOレベルの平面幾何学の課題と、可読性のあるAI自動推論の間に重要な橋渡しとなる。
論文 参考訳(メタデータ) (2023-10-27T09:55:12Z) - Towards a Holistic Understanding of Mathematical Questions with
Contrastive Pre-training [65.10741459705739]
本稿では,数学的問題表現,すなわち QuesCo に対する対照的な事前学習手法を提案する。
まず、コンテンツレベルと構造レベルを含む2段階の質問強化を設計し、類似した目的で文字通り多様な質問ペアを生成する。
そこで我々は,知識概念の階層的情報を完全に活用するために,知識階層を意識したランク戦略を提案する。
論文 参考訳(メタデータ) (2023-01-18T14:23:29Z) - UniGeo: Unifying Geometry Logical Reasoning via Reformulating
Mathematical Expression [127.68780714438103]
計算と証明の2つの主要な幾何学問題は、通常2つの特定のタスクとして扱われる。
我々は4,998の計算問題と9,543の証明問題を含むUniGeoという大規模統一幾何問題ベンチマークを構築した。
また,複数タスクの幾何変換フレームワークであるGeoformerを提案し,計算と証明を同時に行う。
論文 参考訳(メタデータ) (2022-12-06T04:37:51Z) - GeoQA: A Geometric Question Answering Benchmark Towards Multimodal
Numerical Reasoning [172.36214872466707]
我々は、テキスト記述、視覚図、定理知識の包括的理解を必要とする幾何学的問題を解くことに注力する。
そこで本研究では,5,010の幾何学的問題を含む幾何学的質問応答データセットGeoQAを提案する。
論文 参考訳(メタデータ) (2021-05-30T12:34:17Z) - Inter-GPS: Interpretable Geometry Problem Solving with Formal Language
and Symbolic Reasoning [123.06420835072225]
3,002の幾何学的問題と密接なアノテーションを形式言語に含む新しい大規模ベンチマークGeometry3Kを構築します。
我々は、Interpretable Geometry Problemsolvr (Inter-GPS)と呼ばれる形式言語と記号推論を用いた新しい幾何学的解法を提案する。
イントラGPSは定理の知識を条件付き規則として取り入れ、記号的推論を段階的に行う。
論文 参考訳(メタデータ) (2021-05-10T07:46:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。