論文の概要: PGDP5K: A Diagram Parsing Dataset for Plane Geometry Problems
- arxiv url: http://arxiv.org/abs/2205.09947v1
- Date: Fri, 20 May 2022 03:41:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-23 15:17:30.988974
- Title: PGDP5K: A Diagram Parsing Dataset for Plane Geometry Problems
- Title(参考訳): PGDP5K:平面幾何学問題のための図解析データセット
- Authors: Yihan Hao (1 and 2), Mingliang Zhang (2 and 3), Fei Yin (2 and 3) and
Linlin Huang (1) ((1) Beijing Jiaotong University, (2) Institute of
Automation of Chinese Academy of Science, (3) University of Chinese Academy
of Sciences)
- Abstract要約: 本稿では,PGDP5Kと命名された大規模図形データセットと新しいアノテーション手法を提案する。
本データセットは,5つの位置関係,22の記号型,6つのテキスト型を含む16の形状からなる5000の図からなる。
PGDP5KとIMP-Geometry3Kデータセットの実験により、最先端のSOTA(State-of-the-art)法は66.07%のF1値しか達成できないことが明らかになった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diagram parsing is an important foundation for geometry problem solving,
attracting increasing attention in the field of intelligent education and
document image understanding. Due to the complex layout and between-primitive
relationship, plane geometry diagram parsing (PGDP) is still a challenging task
deserving further research and exploration. An appropriate dataset is critical
for the research of PGDP. Although some datasets with rough annotations have
been proposed to solve geometric problems, they are either small in scale or
not publicly available. The rough annotations also make them not very useful.
Thus, we propose a new large-scale geometry diagram dataset named PGDP5K and a
novel annotation method. Our dataset consists of 5000 diagram samples composed
of 16 shapes, covering 5 positional relations, 22 symbol types and 6 text
types. Different from previous datasets, our PGDP5K dataset is labeled with
more fine-grained annotations at primitive level, including primitive classes,
locations and relationships. What is more, combined with above annotations and
geometric prior knowledge, it can generate intelligible geometric propositions
automatically and uniquely. We performed experiments on PGDP5K and
IMP-Geometry3K datasets reveal that the state-of-the-art (SOTA) method achieves
only 66.07% F1 value. This shows that PGDP5K presents a challenge for future
research. Our dataset is available at
http://www.nlpr.ia.ac.cn/databases/CASIA-PGDP5K/.
- Abstract(参考訳): 図解析は幾何学的問題解決の重要な基盤であり、知的教育と文書画像理解の分野で注目を集めている。
複雑なレイアウトと原始的関係のため、平面幾何学図解析(PGDP)はいまだにさらなる研究と探査を継続する難しい課題である。
適切なデータセットは、PGDPの研究に不可欠である。
幾何的な問題を解決するために粗いアノテーションを持つデータセットが提案されているが、規模は小さいか公開されていない。
粗いアノテーションもあまり役に立たない。
そこで本研究では,PGDP5Kと呼ばれる大規模図形データセットと新しいアノテーション手法を提案する。
本データセットは,5つの位置関係,22の記号型,6つのテキスト型を含む16の形状からなる5000の図からなる。
以前のデータセットと異なり、私たちのPGDP5Kデータセットはプリミティブなクラス、場所、関係など、プリミティブなレベルでよりきめ細かいアノテーションでラベル付けされています。
さらに、上記のアノテーションや幾何学的事前知識と組み合わせることで、知的な幾何学的命題を自動的に一意に生成することができる。
我々はPGDP5KとIMP-Geometry3Kのデータセットを用いて実験を行い、最先端(SOTA)法は66.07%のF1値しか達成していないことを明らかにした。
これは、PGDP5Kが将来の研究に挑戦していることを示している。
データセットはhttp://www.nlpr.ia.ac.cn/databases/CASIA-PGDP5K/で利用可能です。
関連論文リスト
- A Survey of Geometric Graph Neural Networks: Data Structures, Models and
Applications [67.33002207179923]
本稿では、幾何学的GNNに関するデータ構造、モデル、および応用について調査する。
幾何学的メッセージパッシングの観点から既存のモデルの統一的なビューを提供する。
また、方法論開発と実験評価の後の研究を促進するために、アプリケーションと関連するデータセットを要約する。
論文 参考訳(メタデータ) (2024-03-01T12:13:04Z) - Adaptive Surface Normal Constraint for Geometric Estimation from Monocular Images [56.86175251327466]
本稿では,幾何学的文脈を取り入れつつ,画像から深度や表面正規度などの測地を学習するための新しい手法を提案する。
提案手法は,入力画像に存在する幾何学的変動を符号化した幾何学的文脈を抽出し,幾何的制約と深度推定を相関付ける。
本手法は,画像から高品質な3次元形状を生成可能な密着型フレームワーク内での深度と表面の正規分布推定を統一する。
論文 参考訳(メタデータ) (2024-02-08T17:57:59Z) - G-LLaVA: Solving Geometric Problem with Multi-Modal Large Language Model [124.68242155098189]
大規模言語モデル(LLM)は、人間レベルの推論と生成能力に顕著な習熟性を示している。
G-LLaVAは幾何学的問題の解法において例外的な性能を示し、7Bパラメータしか持たないMathVistaベンチマークにおいて GPT-4-V を著しく上回っている。
論文 参考訳(メタデータ) (2023-12-18T17:36:20Z) - Improving embedding of graphs with missing data by soft manifolds [51.425411400683565]
グラフ埋め込みの信頼性は、連続空間の幾何がグラフ構造とどの程度一致しているかに依存する。
我々は、この問題を解決することができる、ソフト多様体と呼ばれる新しい多様体のクラスを導入する。
グラフ埋め込みにソフト多様体を用いることで、複雑なデータセット上のデータ解析における任意のタスクを追求するための連続空間を提供できる。
論文 参考訳(メタデータ) (2023-11-29T12:48:33Z) - Exploring Data Geometry for Continual Learning [64.4358878435983]
非定常データストリームのデータ幾何を探索することにより,新しい視点から連続学習を研究する。
提案手法は,新しいデータによって引き起こされる幾何構造に対応するために,基底空間の幾何学を動的に拡張する。
実験により,本手法はユークリッド空間で設計したベースライン法よりも優れた性能が得られることが示された。
論文 参考訳(メタデータ) (2023-04-08T06:35:25Z) - A Multi-Modal Neural Geometric Solver with Textual Clauses Parsed from
Diagram [33.62866585222121]
マルチモーダル情報を効率的に融合する新しいニューラルソルバであるPGPSNetを提案する。
PGPSNetには幾何学定理と幾何学的表現の知識が豊富にある。
我々はPGPS9Kという,大規模かつ詳細なGPSデータセットを構築した。
論文 参考訳(メタデータ) (2023-02-22T02:38:25Z) - Study of Manifold Geometry using Multiscale Non-Negative Kernel Graphs [32.40622753355266]
データの幾何学的構造を研究するための枠組みを提案する。
我々は最近導入された非負のカーネル回帰グラフを用いて、点密度、固有次元、およびデータ多様体(曲率)の線型性を推定する。
論文 参考訳(メタデータ) (2022-10-31T17:01:17Z) - Plane Geometry Diagram Parsing [29.921409628478152]
深層学習とグラフ推論に基づく強力な図式を提案する。
幾何学的プリミティブを抽出する修正インスタンスセグメンテーション法を提案する。
グラフニューラルネットワーク(GNN)を利用して、関係解析と原始分類を実現する。
論文 参考訳(メタデータ) (2022-05-19T07:47:01Z) - Algebraic Machine Learning with an Application to Chemistry [0.0]
我々はスムーズな仮定に頼ることなく、微粒な幾何学的情報をキャプチャする機械学習パイプラインを開発した。
特に,基礎変数の特異点近傍にある点を数値的に検出する手法を提案する。
論文 参考訳(メタデータ) (2022-05-11T22:41:19Z) - GeoQA: A Geometric Question Answering Benchmark Towards Multimodal
Numerical Reasoning [172.36214872466707]
我々は、テキスト記述、視覚図、定理知識の包括的理解を必要とする幾何学的問題を解くことに注力する。
そこで本研究では,5,010の幾何学的問題を含む幾何学的質問応答データセットGeoQAを提案する。
論文 参考訳(メタデータ) (2021-05-30T12:34:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。