論文の概要: Learning symbol relation tree for online mathematical expression
recognition
- arxiv url: http://arxiv.org/abs/2105.06084v1
- Date: Thu, 13 May 2021 05:18:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-14 14:06:25.708551
- Title: Learning symbol relation tree for online mathematical expression
recognition
- Title(参考訳): オンライン数式認識のための学習記号関係木
- Authors: Thanh-Nghia Truong, Hung Tuan Nguyen, Cuong Tuan Nguyen and Masaki
Nakagawa
- Abstract要約: 本稿では,記号関係木(SRT)をストローク列から直接構築することで,オンライン手書き数式(OnHME)を認識できる手法を提案する。
双方向リカレントニューラルネットワークは、SRTの複数の派生経路から学習し、グローバルコンテキストを用いてシンボル間のシンボルと空間的関係を予測する。
この認識システムは、オンライン手書き数式(CROHME)2014および2016のテストセットに関するコンペティションで44.12%および41.76%の表現認識率を達成している。
- 参考スコア(独自算出の注目度): 7.868468656324007
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper proposes a method for recognizing online handwritten mathematical
expressions (OnHME) by building a symbol relation tree (SRT) directly from a
sequence of strokes. A bidirectional recurrent neural network learns from
multiple derived paths of SRT to predict both symbols and spatial relations
between symbols using global context. The recognition system has two parts: a
temporal classifier and a tree connector. The temporal classifier produces an
SRT by recognizing an OnHME pattern. The tree connector splits the SRT into
several sub-SRTs. The final SRT is formed by looking up the best combination
among those sub-SRTs. Besides, we adopt a tree sorting method to deal with
various stroke orders. Recognition experiments indicate that the proposed OnHME
recognition system is competitive to other methods. The recognition system
achieves 44.12% and 41.76% expression recognition rates on the Competition on
Recognition of Online Handwritten Mathematical Expressions (CROHME) 2014 and
2016 testing sets.
- Abstract(参考訳): 本稿では,記号関係木(SRT)をストローク列から直接構築することで,オンライン手書き数式(OnHME)を認識できる手法を提案する。
双方向リカレントニューラルネットワークは、SRTの複数の派生経路から学習し、グローバルコンテキストを用いてシンボル間のシンボルと空間的関係を予測する。
認識システムは、時間分類器とツリーコネクタの2つの部分を有する。
時間分類器は、OnHMEパターンを認識してSRTを生成する。
ツリーコネクタはSRTをいくつかのサブSRTに分割する。
最終SRTは、これらのサブSRTの中で最高の組み合わせを見出すことによって形成される。
また,様々なストロークオーダーに対応するツリーソート手法も採用している。
認識実験により,提案するOnHME認識システムは,他の手法と競合することが示された。
認識システムは、オンライン手書き数式認識コンペティション(CROHME)2014と2016のテストセットで44.12%と41.76%の表現認識率を達成した。
関連論文リスト
- Complex Event Recognition with Symbolic Register Transducers: Extended Technical Report [51.86861492527722]
本稿では,オートマトンに基づく複合イベント認識システムを提案する。
本システムは,記号とレジスタオートマトンを組み合わせたオートマトンモデルに基づいている。
我々は、イベントストリーム上のパターンを検出するために、SRTをCERでどのように使用できるかを示す。
論文 参考訳(メタデータ) (2024-07-03T07:59:13Z) - Scope-enhanced Compositional Semantic Parsing for DRT [52.657454970993086]
談話表現のための構成的, 神経象徴的意味的ニューロシンボリックAMS理論について紹介する。
我々は, AMS が良好な出力を確実に生成し, DRT 解析, 特に複雑な文に対して良好に動作することを示す。
論文 参考訳(メタデータ) (2024-07-02T02:50:15Z) - Dual Branch Network Towards Accurate Printed Mathematical Expression
Recognition [27.428642277844972]
局所的およびグローバルな文脈情報から正確な印刷数式認識を行うために,Dual Branch Transformer-based Network (DBN)を提案する。
実験の結果,DBNは数学的表現を正確に認識でき,最先端の性能を達成できた。
論文 参考訳(メタデータ) (2023-12-14T15:30:34Z) - Semantic Graph Representation Learning for Handwritten Mathematical
Expression Recognition [57.60390958736775]
セマンティック・インタラクション・ラーニング(SIL)の簡易かつ効率的な手法を提案する。
まず,統計的シンボル共起確率に基づく意味グラフを構築する。
次に、視覚的および分類的特徴を意味空間に投影する意味認識モジュール(SAM)を設計する。
本手法は, CROHMEとHME100Kの両方のデータセットにおいて, 先行技術よりも優れた認識性能を実現する。
論文 参考訳(メタデータ) (2023-08-21T06:23:41Z) - Graph Neural Networks for Contextual ASR with the Tree-Constrained
Pointer Generator [9.053645441056256]
本稿では,グラフニューラルネットワーク(GNN)符号化を用いたエンドツーエンドのコンテキストASRを実現するための革新的な手法を提案する。
GNNエンコーディングは、各ツリーノードでのASR復号処理において、将来のワードピースのルックアヘッドを促進する。
Librispeech と AMI corpus を用いて,視覚的な文脈的 ASR パイプラインに従ってシステム性能を評価した。
論文 参考訳(メタデータ) (2023-05-30T08:20:58Z) - Global Context for improving recognition of Online Handwritten
Mathematical Expressions [7.868468656324007]
オンライン手書き数式(HME)の時間的分類法を提案する。
この方法は、双方向長短期記憶ネットワークのグローバルコンテキストの恩恵を受ける。
オンラインHMEを認識するために、文脈自由文法を用いた記号レベルの構文解析木を構築する。
論文 参考訳(メタデータ) (2021-05-21T06:39:47Z) - Knowledge Distillation By Sparse Representation Matching [107.87219371697063]
本稿では,一方の畳み込みネットワーク(cnn)から他方へ,スパース表現を用いて中間知識を伝達するスパース表現マッチング(srm)を提案する。
勾配降下を利用して効率的に最適化し、任意のCNNにプラグアンドプレイで統合できるニューラルプロセッシングブロックとして定式化します。
実験の結果,教師と生徒のネットワーク間のアーキテクチャの違いに頑健であり,複数のデータセットにまたがる他のkd技術よりも優れていた。
論文 参考訳(メタデータ) (2021-03-31T11:47:47Z) - Syntactic representation learning for neural network based TTS with
syntactic parse tree traversal [49.05471750563229]
本稿では,構文解析木に基づく構文表現学習手法を提案し,構文構造情報を自動的に活用する。
実験の結果,提案手法の有効性が示された。
複数の構文解析木を持つ文では、合成音声から韻律的差異が明確に認識される。
論文 参考訳(メタデータ) (2020-12-13T05:52:07Z) - Emotion recognition by fusing time synchronous and time asynchronous
representations [17.26466867595571]
マルチモーダル感情認識のための新しい2分岐ニューラルネットワークモデル構造を提案する。
時間同期ブランチ(TSB)と時間非同期ブランチ(TAB)で構成される。
2分岐構造は、すべての一般的なテスト設定を伴う4方向の分類において、最先端の結果を達成する。
論文 参考訳(メタデータ) (2020-10-27T07:14:31Z) - MetricUNet: Synergistic Image- and Voxel-Level Learning for Precise CT
Prostate Segmentation via Online Sampling [66.01558025094333]
本稿では,前立腺領域を高速に局在させる第1段階と,前立腺領域を正確に区分する第2段階の2段階のフレームワークを提案する。
マルチタスクネットワークにおけるボクセルワイドサンプリングによる新しいオンラインメトリック学習モジュールを提案する。
本手法は,従来のクロスエントロピー学習法やDice損失学習法と比較して,より代表的なボクセルレベルの特徴を効果的に学習することができる。
論文 参考訳(メタデータ) (2020-05-15T10:37:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。