論文の概要: GeoLoom: High-quality Geometric Diagram Generation from Textual Input
- arxiv url: http://arxiv.org/abs/2512.08180v1
- Date: Tue, 09 Dec 2025 02:22:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-10 22:28:07.788412
- Title: GeoLoom: High-quality Geometric Diagram Generation from Textual Input
- Title(参考訳): GeoLoom:テキスト入力による高品質な幾何学図生成
- Authors: Xiaojing Wei, Ting Zhang, Wei He, Jingdong Wang, Hua Huang,
- Abstract要約: 幾何学領域におけるテキスト・ダイアグラム生成のための新しいフレームワークであるGeoLoomを提案する。
GeoLoomは、自然言語を世代指向の形式言語GeoLinguaに変換する自動形式化モジュールである。
このフレームワークをサポートするために、自然言語の幾何学的記述と公式なGeoLingua記述とを整合させたデータセットGeoNFを紹介する。
- 参考スコア(独自算出の注目度): 41.9055060542649
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: High-quality geometric diagram generation presents both a challenge and an opportunity: it demands strict spatial accuracy while offering well-defined constraints to guide generation. Inspired by recent advances in geometry problem solving that employ formal languages and symbolic solvers for enhanced correctness and interpretability, we propose GeoLoom, a novel framework for text-to-diagram generation in geometric domains. GeoLoom comprises two core components: an autoformalization module that translates natural language into a specifically designed generation-oriented formal language GeoLingua, and a coordinate solver that maps formal constraints to precise coordinates using the efficient Monte Carlo optimization. To support this framework, we introduce GeoNF, a dataset aligning natural language geometric descriptions with formal GeoLingua descriptions. We further propose a constraint-based evaluation metric that quantifies structural deviation, offering mathematically grounded supervision for iterative refinement. Empirical results demonstrate that GeoLoom significantly outperforms state-of-the-art baselines in structural fidelity, providing a principled foundation for interpretable and scalable diagram generation.
- Abstract(参考訳): 高品質な幾何学図生成は、厳密な空間的正確性を要求し、生成を導くために明確に定義された制約を提供するという、課題と機会の両方を提示する。
幾何学領域におけるテキスト・ダイアグラム生成のための新しいフレームワークであるGeoLoomを提案する。
GeoLoomは、自然言語を特定の設計された世代指向の形式言語GeoLinguaに変換する自動形式化モジュールと、効率的なモンテカルロ最適化を用いて形式制約を正確な座標にマッピングする座標ソルバの2つのコアコンポーネントから構成される。
このフレームワークをサポートするために、自然言語の幾何学的記述と公式なGeoLingua記述とを整合させたデータセットGeoNFを紹介する。
さらに, 構造偏差を定量化する制約に基づく評価指標を提案し, 反復的改善のための数学的基盤の監督を行う。
実証的な結果から、GeoLoomは構造的忠実性において最先端のベースラインを著しく上回り、解釈可能でスケーラブルなダイアグラム生成の基盤となることが示されている。
関連論文リスト
- GeoVLMath: Enhancing Geometry Reasoning in Vision-Language Models via Cross-Modal Reward for Auxiliary Line Creation [54.53486231309254]
ソリッド幾何学における補助線形推論に適したオープンソースのLVLMであるGeoVLMathを提案する。
我々は,LVLMの表現強度に整合性を持たせるために,補助線構成のテキスト記述を生成する。
この報酬に基づいて構築されたGeoVLMathは、固体幾何学における補助線形推論に適したオープンソースのLVLMである。
論文 参考訳(メタデータ) (2025-10-13T05:33:51Z) - GeoRef: Referring Expressions in Geometry via Task Formulation, Synthetic Supervision, and Reinforced MLLM-based Solutions [45.70578816057097]
本稿では,幾何学的問題に対するReferring Expression (REC) の課題を紹介する。
RECは、テキストのプロンプトに応じて図形の点、形、空間関係をローカライズできるかどうかを評価する。
構造化幾何形式言語を用いた大規模合成学習データセットを生成する。
論文 参考訳(メタデータ) (2025-09-25T12:00:52Z) - GeoGramBench: Benchmarking the Geometric Program Reasoning in Modern LLMs [7.605833826892782]
本稿では,従来の数学的推論の複雑さではなく,幾何学的複雑性を考慮した3段階分類によって整理された500の精巧な問題のベンチマークを示す。
17個のフロンティアLSMの総合的な評価により,一貫性と顕著な欠陥が明らかとなった。
これらの結果は、プログラム駆動型空間推論によって引き起こされる独特な課題を浮き彫りにし、シンボル-空間幾何学的推論の研究を進めるための貴重な資源としてGeoGramBenchを確立した。
論文 参考訳(メタデータ) (2025-05-23T09:17:07Z) - MagicGeo: Training-Free Text-Guided Geometric Diagram Generation [39.30134393001854]
本稿では,テキスト記述から幾何学図を生成するためのトレーニングフリーフレームワークMagicGeoを提案する。
MagicGeoは、ダイアグラム生成プロセスを座標最適化問題として定式化し、形式言語ソルバによる幾何的正しさを確保し、座標認識生成を使用する。
220の幾何学的図式記述のベンチマークデータセットであるMagicGeoBenchを導入し、MagicGeoが定性評価と定量的評価の両方で現在の手法より優れていることを示す。
論文 参考訳(メタデータ) (2025-02-19T16:20:14Z) - GeoX: Geometric Problem Solving Through Unified Formalized Vision-Language Pre-training [45.42400674977197]
GeoXは幾何学的理解と推論タスクに焦点を当てたマルチモーダルな大規模モデルである。
図形エンコーダとシンボルデコーダを開発するために,単調な事前学習を導入し,幾何学的画像やコーパスの理解を深める。
本研究では,識別クエリを生成し,不均一に分布した幾何学的信号から不定形表現を除去するジェネレータ・アンド・サンプラー変換器(GS-Former)を提案する。
論文 参考訳(メタデータ) (2024-12-16T15:20:03Z) - A Survey of Geometric Graph Neural Networks: Data Structures, Models and Applications [71.809127869349]
本稿では、幾何学的メッセージパッシングの観点から、既存のモデルの統一的なビューを提供するデータ構造として幾何学的グラフを定式化する。
また、方法論開発と実験評価の後の研究を促進するために、アプリケーションと関連するデータセットを要約する。
論文 参考訳(メタデータ) (2024-03-01T12:13:04Z) - Inter-GPS: Interpretable Geometry Problem Solving with Formal Language
and Symbolic Reasoning [123.06420835072225]
3,002の幾何学的問題と密接なアノテーションを形式言語に含む新しい大規模ベンチマークGeometry3Kを構築します。
我々は、Interpretable Geometry Problemsolvr (Inter-GPS)と呼ばれる形式言語と記号推論を用いた新しい幾何学的解法を提案する。
イントラGPSは定理の知識を条件付き規則として取り入れ、記号的推論を段階的に行う。
論文 参考訳(メタデータ) (2021-05-10T07:46:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。