論文の概要: Local and Global Graph Modeling with Edge-weighted Graph Attention Network for Handwritten Mathematical Expression Recognition
- arxiv url: http://arxiv.org/abs/2410.18555v1
- Date: Thu, 24 Oct 2024 08:59:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-25 12:50:55.512379
- Title: Local and Global Graph Modeling with Edge-weighted Graph Attention Network for Handwritten Mathematical Expression Recognition
- Title(参考訳): 手書き数式認識のためのエッジ重み付きグラフ注意ネットワークを用いた局所・グローバルグラフモデリング
- Authors: Yejing Xie, Richard Zanibbi, Harold Mouchère,
- Abstract要約: エッジ重み付きグラフ注意機構(EGAT)を用いたエンドツーエンドモデルを導入し,ノードとエッジの同時分類を行う。
また,局所(LGM)情報とグローバル(GGM)情報の両方に対して,ストロークレベルのグラフモデリング手法を提案する。
本システムは,記号検出,関係分類,表現レベルの認識において優れた性能を示す。
- 参考スコア(独自算出の注目度): 3.419173524128023
- License:
- Abstract: In this paper, we present a novel approach to Handwritten Mathematical Expression Recognition (HMER) by leveraging graph-based modeling techniques. We introduce an End-to-end model with an Edge-weighted Graph Attention Mechanism (EGAT), designed to perform simultaneous node and edge classification. This model effectively integrates node and edge features, facilitating the prediction of symbol classes and their relationships within mathematical expressions. Additionally, we propose a stroke-level Graph Modeling method for both local (LGM) and global (GGM) information, which applies an end-to-end model to Online HMER tasks, transforming the recognition problem into node and edge classification tasks in graph structure. By capturing both local and global graph features, our method ensures comprehensive understanding of the expression structure. Through the combination of these components, our system demonstrates superior performance in symbol detection, relation classification, and expression-level recognition.
- Abstract(参考訳): 本稿では,グラフに基づくモデリング手法を用いて,手書き数式認識(HMER)の新しい手法を提案する。
エッジ重み付きグラフ注意機構(EGAT)を用いたエンドツーエンドモデルを導入し,ノードとエッジの同時分類を実現する。
このモデルはノードとエッジを効果的に統合し、記号クラスとその数学的表現における関係の予測を容易にする。
さらに、オンラインHMERタスクにエンドツーエンドモデルを適用し、認識問題をグラフ構造中のノードおよびエッジ分類タスクに変換する、局所(LGM)情報とグローバル(GGM)情報の両方に対するストロークレベルグラフモデリング手法を提案する。
局所的なグラフ特徴とグローバルなグラフ特徴の両方をキャプチャすることで,表現構造を包括的に理解することが可能になる。
これらの要素を組み合わせることで,シンボル検出,関係分類,表現レベルの認識において,優れた性能を示す。
関連論文リスト
- Graph Transformer GANs with Graph Masked Modeling for Architectural
Layout Generation [153.92387500677023]
本稿では,グラフノード関係を効果的に学習するために,GTGAN(Graph Transformer Generative Adversarial Network)を提案する。
提案したグラフ変換器エンコーダは、局所的およびグローバルな相互作用をモデル化するために、Transformer内のグラフ畳み込みと自己アテンションを組み合わせる。
また,グラフ表現学習のための自己指導型事前学習手法を提案する。
論文 参考訳(メタデータ) (2024-01-15T14:36:38Z) - Semantic Random Walk for Graph Representation Learning in Attributed
Graphs [2.318473106845779]
本稿では,2つの異種ソースの結合最適化を高次近接ベースフレームワークに定式化するための新しい意味グラフ表現(SGR)法を提案する。
高次トポロジ確率を考慮した従来の埋め込み法は、新しく構築されたグラフに容易に適用でき、ノードと属性の両方の表現を学習することができる。
学習された属性の埋め込みは、セマンティック指向の推論タスクを効果的にサポートし、グラフの深いセマンティックを明らかにするのに役立つ。
論文 参考訳(メタデータ) (2023-05-11T02:35:16Z) - GrannGAN: Graph annotation generative adversarial networks [72.66289932625742]
本稿では,高次元分布をモデル化し,グラフスケルトンと整合した複雑な関係特徴構造を持つデータの新しい例を生成することの問題点を考察する。
提案するモデルは,タスクを2つのフェーズに分割することで,各データポイントのグラフ構造に制約されたデータ特徴を生成する問題に対処する。
第一に、与えられたグラフのノードに関連する機能の分布をモデル化し、第二に、ノードのフィーチャに条件付きでエッジ機能を補完する。
論文 参考訳(メタデータ) (2022-12-01T11:49:07Z) - A Representation Learning Framework for Property Graphs [33.04077644004356]
グラフ埋め込み処理にノード特性とエッジ特性を組み込んだグラフ表現学習フレームワークであるPGEを提案する。
実世界のデータセット上でのノード分類やリンク予測などのベンチマークアプリケーションにおいて,PGEが最先端のグラフ埋め込み手法よりも優れた埋め込み結果が得られることを示す。
論文 参考訳(メタデータ) (2022-06-27T10:36:57Z) - Joint Graph Learning and Matching for Semantic Feature Correspondence [69.71998282148762]
本稿では,グラフマッチングを向上するための信頼度の高いグラフ構造を探索するために,GLAMという共用電子グラフ学習とマッチングネットワークを提案する。
提案手法は,3つの人気ビジュアルマッチングベンチマーク (Pascal VOC, Willow Object, SPair-71k) で評価される。
すべてのベンチマークにおいて、従来の最先端のグラフマッチング手法よりも大きなマージンを達成している。
論文 参考訳(メタデータ) (2021-09-01T08:24:02Z) - A Robust and Generalized Framework for Adversarial Graph Embedding [73.37228022428663]
本稿では,AGE という逆グラフ埋め込みのための頑健なフレームワークを提案する。
AGEは、暗黙の分布から強化された負のサンプルとして偽の隣接ノードを生成する。
本フレームワークでは,3種類のグラフデータを扱う3つのモデルを提案する。
論文 参考訳(メタデータ) (2021-05-22T07:05:48Z) - GraphFormers: GNN-nested Transformers for Representation Learning on
Textual Graph [53.70520466556453]
階層的にGNNコンポーネントを言語モデルのトランスフォーマーブロックと一緒にネストするGraphFormerを提案する。
提案したアーキテクチャでは、テキストエンコーディングとグラフ集約を反復的なワークフローに融合する。
さらに、プログレッシブ・ラーニング・ストラテジーを導入し、そのモデルが操作されたデータと元のデータに基づいて連続的に訓練され、グラフ上の情報を統合する能力を強化する。
論文 参考訳(メタデータ) (2021-05-06T12:20:41Z) - Edge-Featured Graph Attention Network [7.0629162428807115]
エッジ機能付きグラフアテンションネットワーク(EGAT)を提案し、グラフニューラルネットワークの利用をノードとエッジの両方の特徴を持つグラフ上で学習するタスクに拡張する。
モデル構造と学習プロセスを改革することにより、新しいモデルはノードとエッジの機能を入力として受け入れ、エッジ情報を機能表現に組み込むことができ、ノードとエッジの機能を並列かつ相互に反復することができる。
論文 参考訳(メタデータ) (2021-01-19T15:08:12Z) - Multi-Level Graph Convolutional Network with Automatic Graph Learning
for Hyperspectral Image Classification [63.56018768401328]
HSI分類のための自動グラフ学習法(MGCN-AGL)を用いたマルチレベルグラフ畳み込みネットワーク(GCN)を提案する。
空間的に隣接する領域における重要度を特徴付けるために注意機構を利用することで、最も関連性の高い情報を適応的に組み込んで意思決定を行うことができる。
MGCN-AGLは局所的に生成した表現表現に基づいて画像領域間の長距離依存性を符号化する。
論文 参考訳(メタデータ) (2020-09-19T09:26:20Z) - Deep Graph Mapper: Seeing Graphs through the Neural Lens [4.401427499962144]
我々はMapperとグラフニューラルネットワーク(GNN)の表現力を組み合わせることで、グラフの階層的でトポロジカルな視覚化を生成する。
これらの視覚化は、複雑なグラフの構造を識別するだけでなく、様々なタスクを解くためにそれらに適用されたモデルを理解する手段を提供する。
論文 参考訳(メタデータ) (2020-02-10T15:29:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。