論文の概要: An Intelligent-Detection Network for Handwritten Mathematical Expression
Recognition
- arxiv url: http://arxiv.org/abs/2311.15273v1
- Date: Sun, 26 Nov 2023 12:01:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-28 18:34:18.037487
- Title: An Intelligent-Detection Network for Handwritten Mathematical Expression
Recognition
- Title(参考訳): 手書き数式認識のための知的検出ネットワーク
- Authors: Ziqi Ye
- Abstract要約: HMERのためのIntelligent-Detection Network (IDN) は、オブジェクト検出技術を利用して従来のエンコーダ・デコーダ法とは異なる。
具体的には,デジタルオブジェクトとシンボルオブジェクトの両方を正確に検出できる拡張YOLOv7ネットワークを開発した。
実験により,提案手法は複雑な手書き数学的表現を認識する上で,エンコーダ・デコーダネットワークよりも優れていた。
- 参考スコア(独自算出の注目度): 0.9790236766474201
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The use of artificial intelligence technology in education is growing
rapidly, with increasing attention being paid to handwritten mathematical
expression recognition (HMER) by researchers. However, many existing methods
for HMER may fail to accurately read formulas with complex structures, as the
attention results can be inaccurate due to illegible handwriting or large
variations in writing styles. Our proposed Intelligent-Detection Network (IDN)
for HMER differs from traditional encoder-decoder methods by utilizing object
detection techniques. Specifically, we have developed an enhanced YOLOv7
network that can accurately detect both digital and symbolic objects. The
detection results are then integrated into the bidirectional gated recurrent
unit (BiGRU) and the baseline symbol relationship tree (BSRT) to determine the
relationships between symbols and numbers. The experiments demonstrate that the
proposed method outperforms those encoder-decoder networks in recognizing
complex handwritten mathematical expressions. This is due to the precise
detection of symbols and numbers. Our research has the potential to make
valuable contributions to the field of HMER. This could be applied in various
practical scenarios, such as assignment grading in schools and information
entry of paper documents.
- Abstract(参考訳): 教育における人工知能技術の利用は急速に増加しており、研究者による手書き数式認識(hmer)に注目が集まっている。
しかし、hmerの既存の手法の多くは複雑な構造を持つ式を正確に読み取ることができない可能性がある。
提案するHMER用知的検出ネットワーク(IDN)は,オブジェクト検出技術を用いて従来のエンコーダデコーダ法と異なる。
具体的には,デジタルオブジェクトとシンボルオブジェクトの両方を正確に検出できる拡張YOLOv7ネットワークを開発した。
次に、検出結果を双方向ゲート再帰ユニット(BiGRU)とベースラインシンボル関係ツリー(BSRT)に統合し、シンボルと数字の関係を決定する。
提案手法は, 複雑な手書き数式認識において, エンコーダ・デコーダネットワークよりも優れていることを示す。
これは記号と数字の正確な検出のためである。
我々の研究は、HMERの分野に貴重な貢献をする可能性がある。
これは、学校における課題グレーディングや文書情報の入力など、様々な実践的なシナリオに適用できる。
関連論文リスト
- Towards Scalable Handwriting Communication via EEG Decoding and Latent Embedding Integration [4.403687945412488]
本研究は,手書きによる脳波信号の復号化を目的としたアルファベット分類タスクを中心にしている。
手のキネマティクスを応用して,高次元神経記録からの一貫した埋め込みの抽出を導出する。
並列畳み込みニューラルネットワークモデルを用いて、両方のデータソースから特徴を同時に抽出する。
提案手法は9種類のタスクに対して91%の分類精度を達成し,脳波からのきめ細かな手書きデコードの実現可能性を示した。
論文 参考訳(メタデータ) (2024-11-14T04:12:47Z) - PosFormer: Recognizing Complex Handwritten Mathematical Expression with Position Forest Transformer [51.260384040953326]
手書き数学的表現認識(HMER)は、人間と機械の相互作用シナリオに広く応用されている。
本稿では,HMERのための位置フォレスト変換器(PosFormer)を提案する。
PosFormerは、最先端のメソッドである2.03%/1.22%/2、1.83%、および4.62%を一貫して上回っている。
論文 参考訳(メタデータ) (2024-07-10T15:42:58Z) - Offline Detection of Misspelled Handwritten Words by Convolving
Recognition Model Features with Text Labels [0.0]
テキストに対して手書き画像を比較する作業を紹介する。
我々のモデルの分類ヘッドは、最先端の生成逆数ネットワークを用いて生成された合成データに基づいて訓練されている。
このような大規模なパフォーマンス向上は、ヒューマン・イン・ザ・ループの自動化を利用したアプリケーションの生産性を大幅に向上させる可能性がある。
論文 参考訳(メタデータ) (2023-09-18T21:13:42Z) - Semantic Graph Representation Learning for Handwritten Mathematical
Expression Recognition [57.60390958736775]
セマンティック・インタラクション・ラーニング(SIL)の簡易かつ効率的な手法を提案する。
まず,統計的シンボル共起確率に基づく意味グラフを構築する。
次に、視覚的および分類的特徴を意味空間に投影する意味認識モジュール(SAM)を設計する。
本手法は, CROHMEとHME100Kの両方のデータセットにおいて, 先行技術よりも優れた認識性能を実現する。
論文 参考訳(メタデータ) (2023-08-21T06:23:41Z) - Improving Deep Representation Learning via Auxiliary Learnable Target Coding [69.79343510578877]
本稿では,深層表現学習の補助的正規化として,新たな学習対象符号化を提案する。
具体的には、より差別的な表現を促進するために、マージンベースの三重項損失と、提案した目標符号上の相関整合損失を設計する。
論文 参考訳(メタデータ) (2023-05-30T01:38:54Z) - Offline Handwritten Mathematical Recognition using Adversarial Learning
and Transformers [3.9220281834178463]
オフラインのHMERは、オンラインのHMERに比べてはるかに難しい問題と見なされることが多い。
本稿では,対向学習を用いたエンコーダ・デコーダモデルを提案する。
最新のCROHME 2019テストセットを4%改善しました。
論文 参考訳(メタデータ) (2022-08-20T11:45:02Z) - When Counting Meets HMER: Counting-Aware Network for Handwritten
Mathematical Expression Recognition [57.51793420986745]
我々は、手書き数式認識(HMER)のための非従来型ネットワークであるCounting-Aware Network(CAN)を提案する。
シンボルレベルの位置アノテーションを使わずに各シンボルクラスの数を予測できる弱教師付きカウントモジュールを設計する。
HMERのベンチマークデータセットの実験により、エンコーダ・デコーダモデルの予測誤差を修正するために、共同最適化とカウント結果の両方が有用であることが検証された。
論文 参考訳(メタデータ) (2022-07-23T08:39:32Z) - Syntax-Aware Network for Handwritten Mathematical Expression Recognition [53.130826547287626]
手書き数式認識(HMER)は、多くの潜在的な応用が可能な課題である。
HMERの最近の手法はエンコーダ・デコーダアーキテクチャで優れた性能を実現している。
本稿では,構文情報をエンコーダ・デコーダネットワークに組み込んだHMERの簡易かつ効率的な手法を提案する。
論文 参考訳(メタデータ) (2022-03-03T09:57:19Z) - Handwritten Digit Recognition using Machine and Deep Learning Algorithms [0.0]
我々は,MNISTデータセットを用いて,Support Vector Machines (SVM), Multi-Layer Perceptron (MLP), Convolution Neural Network (CNN)モデルを用いて手書き桁認識を行った。
我々の主な目的は、上述したモデルの精度と実行時間を比較して、桁認識に最適なモデルを得ることである。
論文 参考訳(メタデータ) (2021-06-23T18:23:01Z) - SmartPatch: Improving Handwritten Word Imitation with Patch
Discriminators [67.54204685189255]
本稿では,現在の最先端手法の性能を向上させる新手法であるSmartPatchを提案する。
我々は、よく知られたパッチ損失と、平行訓練された手書きテキスト認識システムから収集された情報を組み合わせる。
これにより、より強化された局所識別器が実現し、より現実的で高品質な手書き文字が生成される。
論文 参考訳(メタデータ) (2021-05-21T18:34:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。