論文の概要: UniGeo: Unifying Geometry Logical Reasoning via Reformulating
Mathematical Expression
- arxiv url: http://arxiv.org/abs/2212.02746v1
- Date: Tue, 6 Dec 2022 04:37:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-07 15:57:52.309310
- Title: UniGeo: Unifying Geometry Logical Reasoning via Reformulating
Mathematical Expression
- Title(参考訳): UniGeo: 数学的表現の修正による幾何学論理推論の統合
- Authors: Jiaqi Chen, Tong Li, Jinghui Qin, Pan Lu, Liang Lin, Chongyu Chen,
Xiaodan Liang
- Abstract要約: 計算と証明の2つの主要な幾何学問題は、通常2つの特定のタスクとして扱われる。
我々は4,998の計算問題と9,543の証明問題を含むUniGeoという大規模統一幾何問題ベンチマークを構築した。
また,複数タスクの幾何変換フレームワークであるGeoformerを提案し,計算と証明を同時に行う。
- 参考スコア(独自算出の注目度): 127.68780714438103
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Geometry problem solving is a well-recognized testbed for evaluating the
high-level multi-modal reasoning capability of deep models. In most existing
works, two main geometry problems: calculation and proving, are usually treated
as two specific tasks, hindering a deep model to unify its reasoning capability
on multiple math tasks. However, in essence, these two tasks have similar
problem representations and overlapped math knowledge which can improve the
understanding and reasoning ability of a deep model on both two tasks.
Therefore, we construct a large-scale Unified Geometry problem benchmark,
UniGeo, which contains 4,998 calculation problems and 9,543 proving problems.
Each proving problem is annotated with a multi-step proof with reasons and
mathematical expressions. The proof can be easily reformulated as a proving
sequence that shares the same formats with the annotated program sequence for
calculation problems. Naturally, we also present a unified multi-task Geometric
Transformer framework, Geoformer, to tackle calculation and proving problems
simultaneously in the form of sequence generation, which finally shows the
reasoning ability can be improved on both two tasks by unifying formulation.
Furthermore, we propose a Mathematical Expression Pretraining (MEP) method that
aims to predict the mathematical expressions in the problem solution, thus
improving the Geoformer model. Experiments on the UniGeo demonstrate that our
proposed Geoformer obtains state-of-the-art performance by outperforming
task-specific model NGS with over 5.6% and 3.2% accuracies on calculation and
proving problems, respectively.
- Abstract(参考訳): 幾何問題解決は、深層モデルの高レベルマルチモーダル推論能力を評価するためのよく知られたテストベッドである。
ほとんどの既存の作品では、計算と証明という2つの主要な幾何学問題は通常2つの特定のタスクとして扱われ、複数の数学タスクで推論能力を統合するために深いモデルを妨げる。
しかし、本質的にこれら2つのタスクは、同様の問題表現と重複した数学知識を持ち、両方のタスクにおいて深いモデルの理解と推論能力を向上させることができる。
そこで我々は,4,998の計算問題と9,543の証明問題を含むUniGeoという大規模統一幾何問題ベンチマークを構築した。
それぞれの証明問題は、理由と数学的表現を持つ多段階証明で注釈付けされる。
証明は、計算問題に対する注釈付きプログラムシーケンスと同一のフォーマットを共有する証明シーケンスとして容易に再構成できる。
また,多タスク幾何トランスフォーマ(geoformer)という統一型多タスク幾何トランスフォーマフレームワークも提案し,逐次生成という形で計算と証明を同時に行うことで,定式化によって両タスクとも推論能力を向上させることができることを示した。
さらに,問題解における数式予測を目的とし,ジオフォーマモデルの改良を目的とした数式事前学習法(mep)を提案する。
UniGeoの実験により,提案したGeoformerは,タスク固有モデルNGSの計算精度を5.6%以上と3.2%以上で上回り,最先端の性能が得られることを示した。
関連論文リスト
- Fuse, Reason and Verify: Geometry Problem Solving with Parsed Clauses from Diagram [78.79651421493058]
平面幾何学的問題解法 (PGPS) のニューラルネットワークモデルを提案し, モーダル融合, 推論過程, 知識検証の3つの重要なステップについて述べる。
推論のために、幾何学的推論過程を記述するための説明可能な解プログラムを設計し、自己限定デコーダを用いて解プログラムを自動回帰的に生成する。
また, PGPS9Kと呼ばれる大規模幾何学的問題データセットを構築し, テキスト節, 解法プログラム, 関連知識解決器の詳細なアノテーションを含む。
論文 参考訳(メタデータ) (2024-07-10T02:45:22Z) - Learning to Solve Geometry Problems via Simulating Human Dual-Reasoning Process [84.49427910920008]
近年,幾何学的問題解決 (GPS) が注目されている。
解法は、テキストとダイアグラムの両方を包括的に理解し、重要な幾何学的知識を習得し、推論に適切に適用する必要がある。
既存の研究は、ニューラルネットワーク翻訳のパラダイムに従っており、人間の幾何学的推論の本質的な特徴を無視したエンコーダの能力の向上にのみ焦点をあてている。
論文 参考訳(メタデータ) (2024-05-10T03:53:49Z) - GOLD: Geometry Problem Solver with Natural Language Description [7.9345421580482185]
本稿では,自然言語記述モデルを用いた幾何問題 sOlver を提案する。
GOLDは図内のシンボルと幾何学的プリミティブを別々に処理することで、幾何学的関係の抽出を強化する。
抽出した関係を自然言語記述に変換し、大きな言語モデルを効率的に利用して幾何学数学の問題を解く。
論文 参考訳(メタデータ) (2024-05-01T13:00:51Z) - FGeo-TP: A Language Model-Enhanced Solver for Geometry Problems [1.137457877869062]
本稿では,FGeo-TP (Theorem Predictor)を導入し,この言語モデルを用いて定理列の予測を行い,幾何学的問題を解く。
本研究では,FormalGeo7kデータセット上での言語モデル強化FGeo-TPの問題解決率を著しく向上させることを示す。
論文 参考訳(メタデータ) (2024-02-14T09:44:28Z) - GAPS: Geometry-Aware Problem Solver [7.9345421580482185]
幾何学的問題解決は、NLPコミュニティにおける深刻な課題である。
既存のアプローチは、しばしば数学の単語問題を解くために設計されたモデルに依存し、幾何学の数学問題の特異な特徴を無視する。
本研究では,GAPS(Geometry-Aware Problem Solver)モデルを提案する。
GAPSは、様々なタイプの幾何学数学問題に対する解プログラムを生成するように設計されている。
論文 参考訳(メタデータ) (2024-01-29T16:48:34Z) - G-LLaVA: Solving Geometric Problem with Multi-Modal Large Language Model [124.68242155098189]
大規模言語モデル(LLM)は、人間レベルの推論と生成能力に顕著な習熟性を示している。
G-LLaVAは幾何学的問題の解法において例外的な性能を示し、7Bパラメータしか持たないMathVistaベンチマークにおいて GPT-4-V を著しく上回っている。
論文 参考訳(メタデータ) (2023-12-18T17:36:20Z) - FormalGeo: An Extensible Formalized Framework for Olympiad Geometric
Problem Solving [9.73597821684857]
これは、私たちが過去3年間に達成した一連の研究の中で、初めての論文です。
本稿では,一貫した平面幾何学システムを構築した。
これは、IMOレベルの平面幾何学の課題と、可読性のあるAI自動推論の間に重要な橋渡しとなる。
論文 参考訳(メタデータ) (2023-10-27T09:55:12Z) - GeoQA: A Geometric Question Answering Benchmark Towards Multimodal
Numerical Reasoning [172.36214872466707]
我々は、テキスト記述、視覚図、定理知識の包括的理解を必要とする幾何学的問題を解くことに注力する。
そこで本研究では,5,010の幾何学的問題を含む幾何学的質問応答データセットGeoQAを提案する。
論文 参考訳(メタデータ) (2021-05-30T12:34:17Z) - Inter-GPS: Interpretable Geometry Problem Solving with Formal Language
and Symbolic Reasoning [123.06420835072225]
3,002の幾何学的問題と密接なアノテーションを形式言語に含む新しい大規模ベンチマークGeometry3Kを構築します。
我々は、Interpretable Geometry Problemsolvr (Inter-GPS)と呼ばれる形式言語と記号推論を用いた新しい幾何学的解法を提案する。
イントラGPSは定理の知識を条件付き規則として取り入れ、記号的推論を段階的に行う。
論文 参考訳(メタデータ) (2021-05-10T07:46:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。