論文の概要: Global Context for improving recognition of Online Handwritten
Mathematical Expressions
- arxiv url: http://arxiv.org/abs/2105.10156v1
- Date: Fri, 21 May 2021 06:39:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-25 03:26:27.202504
- Title: Global Context for improving recognition of Online Handwritten
Mathematical Expressions
- Title(参考訳): オンライン手書き数式認識改善のためのグローバルコンテキスト
- Authors: Cuong Tuan Nguyen, Thanh-Nghia Truong, Hung Tuan Nguyen and Masaki
Nakagawa
- Abstract要約: オンライン手書き数式(HME)の時間的分類法を提案する。
この方法は、双方向長短期記憶ネットワークのグローバルコンテキストの恩恵を受ける。
オンラインHMEを認識するために、文脈自由文法を用いた記号レベルの構文解析木を構築する。
- 参考スコア(独自算出の注目度): 7.868468656324007
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a temporal classification method for all three subtasks
of symbol segmentation, symbol recognition and relation classification in
online handwritten mathematical expressions (HMEs). The classification model is
trained by multiple paths of symbols and spatial relations derived from the
Symbol Relation Tree (SRT) representation of HMEs. The method benefits from
global context of a deep bidirectional Long Short-term Memory network, which
learns the temporal classification directly from online handwriting by the
Connectionist Temporal Classification loss. To recognize an online HME, a
symbol-level parse tree with Context-Free Grammar is constructed, where symbols
and spatial relations are obtained from the temporal classification results. We
show the effectiveness of the proposed method on the two latest CROHME
datasets.
- Abstract(参考訳): 本稿では,オンライン手書き数式(HME)における記号分割,記号認識,関係分類の3つのサブタスクの時間的分類法を提案する。
分類モデルは、HMEのシンボル関係木(SRT)表現から導かれる記号と空間関係の複数の経路によって訓練される。
この手法は双方向長短期記憶ネットワークのグローバルなコンテキストから恩恵を受け、コネクショニストの時間的分類損失によるオンライン手書きから時間的分類を直接学習する。
オンラインHMEを認識するために、時間的分類結果から記号と空間関係を求める文脈自由文法を用いた記号レベル構文木を構築する。
提案手法の2つの最新のCROHMEデータセットに対する有効性を示す。
関連論文リスト
- Local and Global Graph Modeling with Edge-weighted Graph Attention Network for Handwritten Mathematical Expression Recognition [3.419173524128023]
エッジ重み付きグラフ注意機構(EGAT)を用いたエンドツーエンドモデルを導入し,ノードとエッジの同時分類を行う。
また,局所(LGM)情報とグローバル(GGM)情報の両方に対して,ストロークレベルのグラフモデリング手法を提案する。
本システムは,記号検出,関係分類,表現レベルの認識において優れた性能を示す。
論文 参考訳(メタデータ) (2024-10-24T08:59:27Z) - Spatial Action Unit Cues for Interpretable Deep Facial Expression Recognition [55.97779732051921]
表情認識(FER)のための最先端の分類器は、エンドユーザーにとって重要な特徴である解釈可能性に欠ける。
新しい学習戦略が提案され、AU cues を分類器訓練に明示的に組み込むことで、深い解釈可能なモデルを訓練することができる。
我々の新しい戦略は汎用的であり、アーキテクチャの変更や追加のトレーニング時間を必要とすることなく、ディープCNNやトランスフォーマーベースの分類器に適用できます。
論文 参考訳(メタデータ) (2024-10-01T10:42:55Z) - Dual Branch Network Towards Accurate Printed Mathematical Expression
Recognition [27.428642277844972]
局所的およびグローバルな文脈情報から正確な印刷数式認識を行うために,Dual Branch Transformer-based Network (DBN)を提案する。
実験の結果,DBNは数学的表現を正確に認識でき,最先端の性能を達成できた。
論文 参考訳(メタデータ) (2023-12-14T15:30:34Z) - Semantic Graph Representation Learning for Handwritten Mathematical
Expression Recognition [57.60390958736775]
セマンティック・インタラクション・ラーニング(SIL)の簡易かつ効率的な手法を提案する。
まず,統計的シンボル共起確率に基づく意味グラフを構築する。
次に、視覚的および分類的特徴を意味空間に投影する意味認識モジュール(SAM)を設計する。
本手法は, CROHMEとHME100Kの両方のデータセットにおいて, 先行技術よりも優れた認識性能を実現する。
論文 参考訳(メタデータ) (2023-08-21T06:23:41Z) - Direct Embedding of Temporal Network Edges via Time-Decayed Line Graphs [51.51417735550026]
時間的ネットワーク上での機械学習の方法は、一般的に2つの制限のうちの少なくとも1つを示す。
ネットワークのライングラフは,各インタラクションのノードを含むもので,インタラクション間の時間差に基づいて,このグラフのエッジを重み付けする。
実世界のネットワークにおける実験結果から,エッジ分類と時間リンク予測の両方において,本手法の有効性と有効性を示す。
論文 参考訳(メタデータ) (2022-09-30T18:24:13Z) - Sign Language Translation with Hierarchical Spatio-TemporalGraph Neural
Network [6.623802929157273]
手話翻訳(SLT)は、手話の視覚的内容から音声言語のテキストを生成する。
本稿では,これらの手話の特徴を階層時間グラフ表現として定式化する。
階層型階層時間グラフニューラルネットワーク(HSTG-NN)と呼ばれる新しいディープラーニングアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-11-14T07:02:28Z) - Hierarchical Heterogeneous Graph Representation Learning for Short Text
Classification [60.233529926965836]
短文分類のためのグラフニューラルネットワーク(GNN)に基づく ShiNE と呼ばれる新しい手法を提案する。
まず,短文データセットを単語レベル成分グラフからなる階層的不均一グラフとしてモデル化する。
そして、類似した短いテキスト間の効果的なラベル伝搬を容易にするショート文書グラフを動的に学習する。
論文 参考訳(メタデータ) (2021-10-30T05:33:05Z) - Learning symbol relation tree for online mathematical expression
recognition [7.868468656324007]
本稿では,記号関係木(SRT)をストローク列から直接構築することで,オンライン手書き数式(OnHME)を認識できる手法を提案する。
双方向リカレントニューラルネットワークは、SRTの複数の派生経路から学習し、グローバルコンテキストを用いてシンボル間のシンボルと空間的関係を予測する。
この認識システムは、オンライン手書き数式(CROHME)2014および2016のテストセットに関するコンペティションで44.12%および41.76%の表現認識率を達成している。
論文 参考訳(メタデータ) (2021-05-13T05:18:17Z) - Learning the Implicit Semantic Representation on Graph-Structured Data [57.670106959061634]
グラフ畳み込みネットワークにおける既存の表現学習手法は主に、各ノードの近傍を知覚全体として記述することで設計される。
本稿では,グラフの潜在意味パスを学習することで暗黙的な意味を探索する意味グラフ畳み込みネットワーク(sgcn)を提案する。
論文 参考訳(メタデータ) (2021-01-16T16:18:43Z) - Multi-Level Graph Convolutional Network with Automatic Graph Learning
for Hyperspectral Image Classification [63.56018768401328]
HSI分類のための自動グラフ学習法(MGCN-AGL)を用いたマルチレベルグラフ畳み込みネットワーク(GCN)を提案する。
空間的に隣接する領域における重要度を特徴付けるために注意機構を利用することで、最も関連性の高い情報を適応的に組み込んで意思決定を行うことができる。
MGCN-AGLは局所的に生成した表現表現に基づいて画像領域間の長距離依存性を符号化する。
論文 参考訳(メタデータ) (2020-09-19T09:26:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。