論文の概要: Recognizing Handwritten Mathematical Expressions of Vertical Addition
and Subtraction
- arxiv url: http://arxiv.org/abs/2308.05820v1
- Date: Thu, 10 Aug 2023 18:39:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-14 15:41:43.556008
- Title: Recognizing Handwritten Mathematical Expressions of Vertical Addition
and Subtraction
- Title(参考訳): 垂直付加・減算の手書き数学的表現の認識
- Authors: Daniel Rosa, Filipe R. Cordeiro, Ruan Carvalho, Everton Souza, Sergio
Chevtchenko, Luiz Rodrigues, Marcelo Marinho, Thales Vieira and Valmir
Macario
- Abstract要約: 本研究は,垂直形式の加法式と減算式からなる手書き初歩数式データセットを提案する。
また、MNISTデータセットを拡張して、この構造で人工画像を生成する。
解析では, 物体検出アルゴリズム YOLO v7, YOLO v8, YOLO-NAS, NanoDet, FCOS を用いて, 数学的シンボルの同定を行った。
- 参考スコア(独自算出の注目度): 2.945134482768693
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Handwritten Mathematical Expression Recognition (HMER) is a challenging task
with many educational applications. Recent methods for HMER have been developed
for complex mathematical expressions in standard horizontal format. However,
solutions for elementary mathematical expression, such as vertical addition and
subtraction, have not been explored in the literature. This work proposes a new
handwritten elementary mathematical expression dataset composed of addition and
subtraction expressions in a vertical format. We also extended the MNIST
dataset to generate artificial images with this structure. Furthermore, we
proposed a solution for offline HMER, able to recognize vertical addition and
subtraction expressions. Our analysis evaluated the object detection algorithms
YOLO v7, YOLO v8, YOLO-NAS, NanoDet and FCOS for identifying the mathematical
symbols. We also proposed a transcription method to map the bounding boxes from
the object detection stage to a mathematical expression in the LATEX markup
sequence. Results show that our approach is efficient, achieving a high
expression recognition rate. The code and dataset are available at
https://github.com/Danielgol/HME-VAS
- Abstract(参考訳): 手書き数学的表現認識(HMER)は多くの教育応用において難しい課題である。
近年,標準水平形式における複素数式に対するhmer法が開発されている。
しかし, 垂直加算や減算といった基礎数学的表現の解法は, 文献では研究されていない。
本研究は,垂直形式における加算式と減算式からなる手書き初等数式データセットを提案する。
また、MNISTデータセットを拡張して、この構造で人工画像を生成する。
さらに,垂直加算および減算式を認識可能なオフラインHMERの解を提案する。
解析では, 物体検出アルゴリズム YOLO v7, YOLO v8, YOLO-NAS, NanoDet, FCOS を用いて, 数学的シンボルの同定を行った。
我々はまた、オブジェクト検出段階からLATEXマークアップシーケンスの数学的表現への境界ボックスのマッピング法を提案した。
その結果,提案手法は効率的であり,高い表現認識率を達成できた。
コードとデータセットはhttps://github.com/Danielgol/HME-VASで公開されている。
関連論文リスト
- ReasonAgain: Using Extractable Symbolic Programs to Evaluate Mathematical Reasoning [54.70811660561151]
既存の数学データセットは、最終回答または静的例から派生した中間推論ステップを用いて、大規模言語モデル(LLM)の推論能力を評価する。
モデルがプログラムへの様々な入力に対して常に正しい最終回答を生成できる場合、シンボルプログラムを自動評価の手段として利用したいと考えている。
提案手法は, 従来の静的な例と比較して, 精度の低下を観測し, 現状のLLMにおける数学推論の脆弱さを示唆する。
論文 参考訳(メタデータ) (2024-10-24T18:02:37Z) - PosFormer: Recognizing Complex Handwritten Mathematical Expression with Position Forest Transformer [51.260384040953326]
手書き数学的表現認識(HMER)は、人間と機械の相互作用シナリオに広く応用されている。
本稿では,HMERのための位置フォレスト変換器(PosFormer)を提案する。
PosFormerは、最先端のメソッドである2.03%/1.22%/2、1.83%、および4.62%を一貫して上回っている。
論文 参考訳(メタデータ) (2024-07-10T15:42:58Z) - Semantic Graph Representation Learning for Handwritten Mathematical
Expression Recognition [57.60390958736775]
セマンティック・インタラクション・ラーニング(SIL)の簡易かつ効率的な手法を提案する。
まず,統計的シンボル共起確率に基づく意味グラフを構築する。
次に、視覚的および分類的特徴を意味空間に投影する意味認識モジュール(SAM)を設計する。
本手法は, CROHMEとHME100Kの両方のデータセットにおいて, 先行技術よりも優れた認識性能を実現する。
論文 参考訳(メタデータ) (2023-08-21T06:23:41Z) - Semantic Representations of Mathematical Expressions in a Continuous
Vector Space [0.0]
この研究は連続ベクトル空間における数学的表現を表現するためのアプローチを記述する。
我々は、視覚的に異なるが数学的に等価な表現に基づいて訓練されたシーケンス・ツー・シーケンス・アーキテクチャのエンコーダを用いて、ベクトル表現を生成する。
論文 参考訳(メタデータ) (2022-10-08T22:33:39Z) - Self-Supervised Pretraining of Graph Neural Network for the Retrieval of
Related Mathematical Expressions in Scientific Articles [8.942112181408156]
本稿では,機械学習に基づく数学的表現の検索手法を提案する。
埋め込み学習と自己教師型学習を組み合わせた教師なし表現学習タスクを設計する。
arXiv.orgで発行された90,000以上の出版物から、9900万以上の数学的表現を持つ巨大なデータセットを収集します。
論文 参考訳(メタデータ) (2022-08-22T12:11:30Z) - When Counting Meets HMER: Counting-Aware Network for Handwritten
Mathematical Expression Recognition [57.51793420986745]
我々は、手書き数式認識(HMER)のための非従来型ネットワークであるCounting-Aware Network(CAN)を提案する。
シンボルレベルの位置アノテーションを使わずに各シンボルクラスの数を予測できる弱教師付きカウントモジュールを設計する。
HMERのベンチマークデータセットの実験により、エンコーダ・デコーダモデルの予測誤差を修正するために、共同最適化とカウント結果の両方が有用であることが検証された。
論文 参考訳(メタデータ) (2022-07-23T08:39:32Z) - Syntax-Aware Network for Handwritten Mathematical Expression Recognition [53.130826547287626]
手書き数式認識(HMER)は、多くの潜在的な応用が可能な課題である。
HMERの最近の手法はエンコーダ・デコーダアーキテクチャで優れた性能を実現している。
本稿では,構文情報をエンコーダ・デコーダネットワークに組み込んだHMERの簡易かつ効率的な手法を提案する。
論文 参考訳(メタデータ) (2022-03-03T09:57:19Z) - EDSL: An Encoder-Decoder Architecture with Symbol-Level Features for
Printed Mathematical Expression Recognition [23.658113675853546]
シンボルレベルの特徴を持つエンコーダデコーダを省略したEという新しい手法を提案し,画像から印刷された数学的表現を識別する。
Eは92.7%と89.0%の評価を達成しており、これは最先端の手法よりも3.47%と4.04%高い。
論文 参考訳(メタデータ) (2020-07-06T03:53:52Z) - Graph-Structured Referring Expression Reasoning in The Wild [105.95488002374158]
接地参照表現は、自然言語表現によって参照されるオブジェクトのイメージ中を特定することを目的としている。
本研究では,シーングラフとシーングラフの推論を行うために,シーングラフガイドモジュールネットワーク(SGMN)を提案する。
また,構造化参照式推論のための大規模実世界のデータセットRef-Reasoningを提案する。
論文 参考訳(メタデータ) (2020-04-19T11:00:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。