論文の概要: Unsupervised Training Data Generation of Handwritten Formulas using
Generative Adversarial Networks with Self-Attention
- arxiv url: http://arxiv.org/abs/2106.09432v1
- Date: Thu, 17 Jun 2021 12:27:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-18 16:05:09.323696
- Title: Unsupervised Training Data Generation of Handwritten Formulas using
Generative Adversarial Networks with Self-Attention
- Title(参考訳): 自己注意型生成対向ネットワークを用いた手書き公式の教師なし学習データ生成
- Authors: Matthias Springstein and Eric M\"uller-Budack and Ralph Ewerth
- Abstract要約: 本稿では,文書から派生した数学的表現の大規模な学習例を作成するシステムを提案する。
そこで本研究では, 適応方程式を手書き公式に翻訳する, 注目に基づく新たな生成逆ネットワークを提案する。
このアプローチによって生成されたデータセットには何十万もの公式が含まれており、より複雑なモデルの設計や事前訓練に最適である。
- 参考スコア(独自算出の注目度): 3.785514121306353
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The recognition of handwritten mathematical expressions in images and video
frames is a difficult and unsolved problem yet. Deep convectional neural
networks are basically a promising approach, but typically require a large
amount of labeled training data. However, such a large training dataset does
not exist for the task of handwritten formula recognition. In this paper, we
introduce a system that creates a large set of synthesized training examples of
mathematical expressions which are derived from LaTeX documents. For this
purpose, we propose a novel attention-based generative adversarial network to
translate rendered equations to handwritten formulas. The datasets generated by
this approach contain hundreds of thousands of formulas, making it ideal for
pretraining or the design of more complex models. We evaluate our synthesized
dataset and the recognition approach on the CROHME 2014 benchmark dataset.
Experimental results demonstrate the feasibility of the approach.
- Abstract(参考訳): 画像やビデオフレームにおける手書きの数学的表現の認識は困難で未解決の問題である。
深層対流ニューラルネットワークは基本的に有望なアプローチだが、通常は大量のラベル付きトレーニングデータを必要とする。
しかし、手書き公式認識のタスクにはそのような大規模なトレーニングデータセットは存在しない。
本稿では,ラテックス文書から派生した数学的表現の合成訓練例を多数作成するシステムを提案する。
そこで本研究では, 適応方程式を手書き公式に変換する, 注目に基づく新たな生成逆ネットワークを提案する。
このアプローチによって生成されたデータセットには数十万の式が含まれており、事前トレーニングやより複雑なモデルの設計に最適である。
CROHME 2014ベンチマークデータセットを用いた合成データセットと認識手法の評価を行った。
実験結果は,アプローチの実現可能性を示している。
関連論文リスト
- Self-Supervised Representation Learning for Online Handwriting Text
Classification [0.8594140167290099]
本稿では,日本語と中国語の個人によるオンライン筆跡から情報表現を抽出するための事前学習の前提として,新しいストロークマスキング(POSM)を提案する。
抽出した表現の質を評価するために,本質的評価法と外生的評価法の両方を用いる。
事前訓練されたモデルは、作家の識別、性別分類、手書きの分類といったタスクにおいて、最先端の結果を達成するために微調整される。
論文 参考訳(メタデータ) (2023-10-10T14:07:49Z) - Syntax-Aware Network for Handwritten Mathematical Expression Recognition [53.130826547287626]
手書き数式認識(HMER)は、多くの潜在的な応用が可能な課題である。
HMERの最近の手法はエンコーダ・デコーダアーキテクチャで優れた性能を実現している。
本稿では,構文情報をエンコーダ・デコーダネットワークに組み込んだHMERの簡易かつ効率的な手法を提案する。
論文 参考訳(メタデータ) (2022-03-03T09:57:19Z) - Data-to-text Generation with Macro Planning [61.265321323312286]
本稿では,マクロ計画段階のニューラルモデルと,従来の手法を連想させる生成段階を提案する。
提案手法は, 自動評価と人的評価の両面で, 競争ベースラインを上回っている。
論文 参考訳(メタデータ) (2021-02-04T16:32:57Z) - Learning to Segment Human Body Parts with Synthetically Trained Deep
Convolutional Networks [58.0240970093372]
本稿では,合成データのみを用いて学習した深部畳み込みニューラルネットワークに基づく人体部分分割のための新しい枠組みを提案する。
提案手法は,人体部品の実際の注釈付きデータを用いてモデルを訓練することなく,最先端の結果が得られる。
論文 参考訳(メタデータ) (2021-02-02T12:26:50Z) - Disambiguating Symbolic Expressions in Informal Documents [2.423990103106667]
約33,000項目のデータセットを提示します。
arxiv.orgから得られたソースに予め訓練されたトランスフォーマー言語モデルを用いた方法論を記述する。
我々は,シンボリック表現の構文と意味を考慮に入れて,複数の専用手法を用いてモデルを評価する。
論文 参考訳(メタデータ) (2021-01-25T10:14:37Z) - Learning the Implicit Semantic Representation on Graph-Structured Data [57.670106959061634]
グラフ畳み込みネットワークにおける既存の表現学習手法は主に、各ノードの近傍を知覚全体として記述することで設計される。
本稿では,グラフの潜在意味パスを学習することで暗黙的な意味を探索する意味グラフ畳み込みネットワーク(sgcn)を提案する。
論文 参考訳(メタデータ) (2021-01-16T16:18:43Z) - Neural Language Modeling for Contextualized Temporal Graph Generation [49.21890450444187]
本稿では,大規模事前学習言語モデルを用いた文書のイベントレベル時間グラフの自動生成に関する最初の研究について述べる。
論文 参考訳(メタデータ) (2020-10-20T07:08:00Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z) - Recognizing Handwritten Mathematical Expressions as LaTex Sequences
Using a Multiscale Robust Neural Network [3.9164573079514016]
手書きの数学的表現と出力シーケンスを認識するために,ロバストなマルチスケールニューラルネットワークを提案する。
可視化の追加により、モデルの認識プロセスが詳細に示される。
本モデルの結果から, 最先端モデルの方がロバスト性が高く, 誤差が少なく, 精度も高いことが示唆された。
論文 参考訳(メタデータ) (2020-02-26T12:39:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。