論文の概要: AutoGPS: Automated Geometry Problem Solving via Multimodal Formalization and Deductive Reasoning
- arxiv url: http://arxiv.org/abs/2505.23381v1
- Date: Thu, 29 May 2025 12:01:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-30 18:14:07.84276
- Title: AutoGPS: Automated Geometry Problem Solving via Multimodal Formalization and Deductive Reasoning
- Title(参考訳): オートGPS:マルチモーダル形式化と推論による自動幾何学問題の解法
- Authors: Bowen Ping, Minnan Luo, Zhuohang Dang, Chenxi Wang, Chengyou Jia,
- Abstract要約: AutoGPSは、簡潔で信頼性があり、人間の解釈可能な推論プロセスで幾何学的問題を解決する、神経象徴的な協調フレームワークである。
MPFは、ニューラルネットワークのクロスモーダル理解を利用して、幾何学的問題を構造化された形式言語表現に変換する。
DSRは形式化を入力とし、ハイパーグラフ拡張タスクとして幾何学的問題解決を定式化する。
- 参考スコア(独自算出の注目度): 14.44742282076576
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Geometry problem solving presents distinctive challenges in artificial intelligence, requiring exceptional multimodal comprehension and rigorous mathematical reasoning capabilities. Existing approaches typically fall into two categories: neural-based and symbolic-based methods, both of which exhibit limitations in reliability and interpretability. To address this challenge, we propose AutoGPS, a neuro-symbolic collaborative framework that solves geometry problems with concise, reliable, and human-interpretable reasoning processes. Specifically, AutoGPS employs a Multimodal Problem Formalizer (MPF) and a Deductive Symbolic Reasoner (DSR). The MPF utilizes neural cross-modal comprehension to translate geometry problems into structured formal language representations, with feedback from DSR collaboratively. The DSR takes the formalization as input and formulates geometry problem solving as a hypergraph expansion task, executing mathematically rigorous and reliable derivation to produce minimal and human-readable stepwise solutions. Extensive experimental evaluations demonstrate that AutoGPS achieves state-of-the-art performance on benchmark datasets. Furthermore, human stepwise-reasoning evaluation confirms AutoGPS's impressive reliability and interpretability, with 99\% stepwise logical coherence. The project homepage is at https://jayce-ping.github.io/AutoGPS-homepage.
- Abstract(参考訳): 幾何学的問題解決は人工知能の独特な課題を示し、例外的な多モーダル理解と厳密な数学的推論能力を必要とする。
既存のアプローチは通常、ニューラルベースとシンボリックベースの方法の2つのカテゴリに分類される。
この課題に対処するために、我々は、簡潔で信頼性があり、人間に解釈可能な推論プロセスで幾何学問題を解く、ニューロシンボリック・コラボレーティブ・フレームワークであるAutoGPSを提案する。
特にAutoGPSは、MPF(Multimodal Problem Formalizer)とDSR(Deductive Symbolic Reasoner)を採用している。
MPFは、ニューラルネットワークのクロスモーダル理解を利用して、幾何学的問題を構造化された形式言語表現に変換し、DSRからのフィードバックを協調的に行う。
DSRは形式化を入力として取り、幾何学的問題解決をハイパーグラフ拡張タスクとして定式化し、数学的に厳密で信頼性の高い導出を実行し、最小限で可読性のあるステップワイドな解を生成する。
大規模な実験的評価は、AutoGPSがベンチマークデータセット上で最先端のパフォーマンスを達成することを示す。
さらに、人間のステップワイド推論評価は、AutoGPSの顕著な信頼性と解釈可能性を確認し、99\%のステップワイド論理コヒーレンスを持つ。
プロジェクトのホームページはhttps://jayce-ping.github.io/AutoGPS-homepageにある。
関連論文リスト
- TrustGeoGen: Scalable and Formal-Verified Data Engine for Trustworthy Multi-modal Geometric Problem Solving [66.0201510984171]
問題生成のためのスケーラブルなデータエンジンTrustGeoGenを提案する。
正式な検証により、TrustGeoGenは、モダリティの整合性を保証するGeoTrust-200Kデータセットを生成する。
実験の結果、GeoTrust-testの精度は49.17%に過ぎなかった。
論文 参考訳(メタデータ) (2025-04-22T10:45:23Z) - Fuse, Reason and Verify: Geometry Problem Solving with Parsed Clauses from Diagram [78.79651421493058]
平面幾何学的問題解法 (PGPS) のニューラルネットワークモデルを提案し, モーダル融合, 推論過程, 知識検証の3つの重要なステップについて述べる。
推論のために、幾何学的推論過程を記述するための説明可能な解プログラムを設計し、自己限定デコーダを用いて解プログラムを自動回帰的に生成する。
また, PGPS9Kと呼ばれる大規模幾何学的問題データセットを構築し, テキスト節, 解法プログラム, 関連知識解決器の詳細なアノテーションを含む。
論文 参考訳(メタデータ) (2024-07-10T02:45:22Z) - Learning to Solve Geometry Problems via Simulating Human Dual-Reasoning Process [84.49427910920008]
近年,幾何学的問題解決 (GPS) が注目されている。
解法は、テキストとダイアグラムの両方を包括的に理解し、重要な幾何学的知識を習得し、推論に適切に適用する必要がある。
既存の研究は、ニューラルネットワーク翻訳のパラダイムに従っており、人間の幾何学的推論の本質的な特徴を無視したエンコーダの能力の向上にのみ焦点をあてている。
論文 参考訳(メタデータ) (2024-05-10T03:53:49Z) - A Multi-Modal Neural Geometric Solver with Textual Clauses Parsed from
Diagram [33.62866585222121]
マルチモーダル情報を効率的に融合する新しいニューラルソルバであるPGPSNetを提案する。
PGPSNetには幾何学定理と幾何学的表現の知識が豊富にある。
我々はPGPS9Kという,大規模かつ詳細なGPSデータセットを構築した。
論文 参考訳(メタデータ) (2023-02-22T02:38:25Z) - UniGeo: Unifying Geometry Logical Reasoning via Reformulating
Mathematical Expression [127.68780714438103]
計算と証明の2つの主要な幾何学問題は、通常2つの特定のタスクとして扱われる。
我々は4,998の計算問題と9,543の証明問題を含むUniGeoという大規模統一幾何問題ベンチマークを構築した。
また,複数タスクの幾何変換フレームワークであるGeoformerを提案し,計算と証明を同時に行う。
論文 参考訳(メタデータ) (2022-12-06T04:37:51Z) - GeoQA: A Geometric Question Answering Benchmark Towards Multimodal
Numerical Reasoning [172.36214872466707]
我々は、テキスト記述、視覚図、定理知識の包括的理解を必要とする幾何学的問題を解くことに注力する。
そこで本研究では,5,010の幾何学的問題を含む幾何学的質問応答データセットGeoQAを提案する。
論文 参考訳(メタデータ) (2021-05-30T12:34:17Z) - Inter-GPS: Interpretable Geometry Problem Solving with Formal Language
and Symbolic Reasoning [123.06420835072225]
3,002の幾何学的問題と密接なアノテーションを形式言語に含む新しい大規模ベンチマークGeometry3Kを構築します。
我々は、Interpretable Geometry Problemsolvr (Inter-GPS)と呼ばれる形式言語と記号推論を用いた新しい幾何学的解法を提案する。
イントラGPSは定理の知識を条件付き規則として取り入れ、記号的推論を段階的に行う。
論文 参考訳(メタデータ) (2021-05-10T07:46:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。