論文の概要: GeoSDF: Plane Geometry Diagram Synthesis via Signed Distance Field
- arxiv url: http://arxiv.org/abs/2506.13492v1
- Date: Mon, 16 Jun 2025 13:50:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-17 17:28:48.593202
- Title: GeoSDF: Plane Geometry Diagram Synthesis via Signed Distance Field
- Title(参考訳): GeoSDF: 符号付き距離場による平面幾何学図生成
- Authors: Chengrui Zhang, Maizhen Ning, Zihao Zhou, Jie Sun, Kaizhu Huang, Qiufeng Wang,
- Abstract要約: 平面幾何学図合成は、教育ツールからAIによる数学的推論まで、コンピュータグラフィックスにおいて重要なタスクである。
署名距離場(Signed Distance Field, SDF)を用いて, 図の自動生成を行う新しいフレームワークGeoSDFを提案する。
我々はGeoSDFにおいて、幾何学的要素や制約を簡単に表現するための記号言語を定義し、合成された幾何学図をSDFで自己検証することができる。
- 参考スコア(独自算出の注目度): 23.189928895665467
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Plane Geometry Diagram Synthesis has been a crucial task in computer graphics, with applications ranging from educational tools to AI-driven mathematical reasoning. Traditionally, we rely on computer tools (e.g., Matplotlib and GeoGebra) to manually generate precise diagrams, but it usually requires huge, complicated calculations cost. Recently, researchers start to work on learning-based methods (e.g., Stable Diffusion and GPT4) to automatically generate diagrams, saving operational cost but usually suffering from limited realism and insufficient accuracy. In this paper, we propose a novel framework GeoSDF to automatically generate diagrams efficiently and accurately with Signed Distance Field (SDF). Specifically, we first represent geometric elements in the SDF, then construct a series of constraint functions to represent geometric relationships, next we optimize such constraint functions to get an optimized field of both elements and constraints, finally by rendering the optimized field, we can obtain the synthesized diagram. In our GeoSDF, we define a symbolic language to easily represent geometric elements and those constraints, and our synthesized geometry diagrams can be self-verified in the SDF, ensuring both mathematical accuracy and visual plausibility. In experiments, our GeoSDF synthesized both normal high-school level and IMO-level geometry diagrams. Through both qualitative and quantitative analysis, we can see that synthesized diagrams are realistic and accurate, and our synthesizing process is simple and efficient. Furthermore, we obtain a very high accuracy of solving geometry problems (over 95\% while the current SOTA accuracy is around 75%) by leveraging our self-verification property. All of these demonstrate the advantage of GeoSDF, paving the way for more sophisticated, accurate, and flexible generation of geometric diagrams for a wide array of applications.
- Abstract(参考訳): 平面幾何学図合成は、教育ツールからAIによる数学的推論まで、コンピュータグラフィックスにおいて重要なタスクである。
従来、我々はコンピュータツール(例えばMatplotlibやGeoGebra)を使って正確な図を手作業で生成していましたが、通常は膨大な複雑な計算コストが必要です。
近年、研究者は学習ベースの手法(例えば、安定拡散法、GPT4)で図を自動生成し、運用コストを削減したが、通常は制限されたリアリズムと不十分な正確さに悩まされている。
本稿では,手話距離場(Signed Distance Field, SDF)を用いて, 図の自動生成を行う新しいフレームワークGeoSDFを提案する。
具体的には、まずSDF内の幾何学的要素を表現し、次に幾何学的関係を表す一連の制約関数を構築し、次に、これらの制約関数を最適化して要素と制約の両方の最適化されたフィールドを得る。
我々のGeoSDFでは、幾何学的要素や制約を簡単に表現するための記号言語を定義し、合成された幾何学図をSDFで自己検証し、数学的精度と視覚的可視性の両方を保証する。
実験では、GeoSDFは通常の高校レベルの図とIMOレベルの図の両方を合成した。
定性的かつ定量的な分析により、合成された図は現実的で正確であり、合成プロセスはシンプルで効率的であることが分かる。
さらに、我々の自己検証特性を活用して、幾何問題(現在のSOTA精度は約75%)の解法を非常に高い精度で得る。
これらすべてがGeoSDFの利点を示し、より洗練され、正確でフレキシブルな幾何学図を生成するための道を開いた。
関連論文リスト
- Enhancing the Geometric Problem-Solving Ability of Multimodal LLMs via Symbolic-Neural Integration [57.95306827012784]
幾何学図のステップワイズ推論パスを自動的に生成するパイプラインであるGeoGenを提案する。
正確なシンボリック推論を活用することで、textbfGeoGenは大規模で高品質な質問応答ペアを生成する。
GeoGen が生成した合成データを用いて,Large Language Model (LLM) である textbfGeoLogic を訓練する。
論文 参考訳(メタデータ) (2025-04-17T09:13:46Z) - MagicGeo: Training-Free Text-Guided Geometric Diagram Generation [39.30134393001854]
本稿では,テキスト記述から幾何学図を生成するためのトレーニングフリーフレームワークMagicGeoを提案する。
MagicGeoは、ダイアグラム生成プロセスを座標最適化問題として定式化し、形式言語ソルバによる幾何的正しさを確保し、座標認識生成を使用する。
220の幾何学的図式記述のベンチマークデータセットであるMagicGeoBenchを導入し、MagicGeoが定性評価と定量的評価の両方で現在の手法より優れていることを示す。
論文 参考訳(メタデータ) (2025-02-19T16:20:14Z) - GeoX: Geometric Problem Solving Through Unified Formalized Vision-Language Pre-training [45.42400674977197]
GeoXは幾何学的理解と推論タスクに焦点を当てたマルチモーダルな大規模モデルである。
図形エンコーダとシンボルデコーダを開発するために,単調な事前学習を導入し,幾何学的画像やコーパスの理解を深める。
本研究では,識別クエリを生成し,不均一に分布した幾何学的信号から不定形表現を除去するジェネレータ・アンド・サンプラー変換器(GS-Former)を提案する。
論文 参考訳(メタデータ) (2024-12-16T15:20:03Z) - Diagram Formalization Enhanced Multi-Modal Geometry Problem Solver [11.69164802295844]
視覚的特徴,幾何学的形式言語,自然言語表現を統合した新しいフレームワークを提案する。
本稿では,新しい合成データ手法を提案し,形式的および自然言語のキャプションを付加した大規模幾何データセットSynthGeo228Kを提案する。
我々のフレームワークは,MLLMの幾何学図処理能力を改善し,フォーマルなgeo7kデータセット上のオープンなタスクに応用範囲を広げる。
論文 参考訳(メタデータ) (2024-09-06T12:11:06Z) - A Survey of Geometric Graph Neural Networks: Data Structures, Models and Applications [71.809127869349]
本稿では、幾何学的メッセージパッシングの観点から、既存のモデルの統一的なビューを提供するデータ構造として幾何学的グラフを定式化する。
また、方法論開発と実験評価の後の研究を促進するために、アプリケーションと関連するデータセットを要約する。
論文 参考訳(メタデータ) (2024-03-01T12:13:04Z) - GeoQA: A Geometric Question Answering Benchmark Towards Multimodal
Numerical Reasoning [172.36214872466707]
我々は、テキスト記述、視覚図、定理知識の包括的理解を必要とする幾何学的問題を解くことに注力する。
そこで本研究では,5,010の幾何学的問題を含む幾何学的質問応答データセットGeoQAを提案する。
論文 参考訳(メタデータ) (2021-05-30T12:34:17Z) - DSG-Net: Learning Disentangled Structure and Geometry for 3D Shape
Generation [98.96086261213578]
DSG-Netは3次元形状の非交叉構造と幾何学的メッシュ表現を学習するディープニューラルネットワークである。
これは、幾何(構造)を不変に保ちながら構造(幾何学)のような不整合制御を持つ新しい形状生成アプリケーションの範囲をサポートする。
本手法は,制御可能な生成アプリケーションだけでなく,高品質な合成形状を生成できる。
論文 参考訳(メタデータ) (2020-08-12T17:06:51Z) - Graph Signal Processing for Geometric Data and Beyond: Theory and
Applications [55.81966207837108]
グラフ信号処理(GSP)は、不規則な領域に存在する処理信号を可能にする。
GSP法は、幾何データとグラフの接続をブリッジすることで、統一的に幾何データに対する手法である。
最近開発されたグラフニューラルネットワーク(GNN)は、GSPの観点からこれらのネットワークの動作を解釈している。
論文 参考訳(メタデータ) (2020-08-05T03:20:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。