論文の概要: Characters as Graphs: Recognizing Online Handwritten Chinese Characters
via Spatial Graph Convolutional Network
- arxiv url: http://arxiv.org/abs/2004.09412v1
- Date: Mon, 20 Apr 2020 16:12:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-11 18:56:31.324083
- Title: Characters as Graphs: Recognizing Online Handwritten Chinese Characters
via Spatial Graph Convolutional Network
- Title(参考訳): グラフとしての文字:空間グラフ畳み込みネットワークによるオンライン手書き漢字認識
- Authors: Ji Gan, Weiqiang Wang, Ke Lu
- Abstract要約: 文字グラフを効果的に分類するための空間グラフ畳み込みネットワーク(SGCN)を提案する。
我々のSGCNは、空間グラフ畳み込みによって局所的な周辺情報を取り込み、さらに階層的残差構造を用いて大域的な形状特性を学習する。
IAHCC-UCAS2016, ICDAR-2013, UNIPENデータセットの実験は、SGCNが文字認識の最先端手法と同等の認識性能を達成できることを示した。
- 参考スコア(独自算出の注目度): 28.565182625800333
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Chinese is one of the most widely used languages in the world, yet online
handwritten Chinese character recognition (OLHCCR) remains challenging. To
recognize Chinese characters, one popular choice is to adopt the 2D
convolutional neural network (2D-CNN) on the extracted feature images, and
another one is to employ the recurrent neural network (RNN) or 1D-CNN on the
time-series features. Instead of viewing characters as either static images or
temporal trajectories, here we propose to represent characters as geometric
graphs, retaining both spatial structures and temporal orders. Accordingly, we
propose a novel spatial graph convolution network (SGCN) to effectively
classify those character graphs for the first time. Specifically, our SGCN
incorporates the local neighbourhood information via spatial graph convolutions
and further learns the global shape properties with a hierarchical residual
structure. Experiments on IAHCC-UCAS2016, ICDAR-2013, and UNIPEN datasets
demonstrate that the SGCN can achieve comparable recognition performance with
the state-of-the-art methods for character recognition.
- Abstract(参考訳): 中国語は世界で最も広く使われている言語の一つだが、オンライン手書き漢字認識(OLHCCR)は依然として難しい。
漢字を認識するためには、抽出した特徴画像に2d畳み込みニューラルネットワーク(2d-cnn)を、時系列特徴にrecurrent neural network(rnn)または1d-cnnを使用することが一般的である。
ここでは,文字を静止画像または時間軌道として見る代わりに,文字を幾何学グラフとして表現し,空間構造と時間順序の両方を保持することを提案する。
そこで我々は,これらの文字グラフを初めて効果的に分類する新しい空間グラフ畳み込みネットワーク(sgcn)を提案する。
特に,sgcnは,空間グラフ畳み込みによって局所的な近傍情報を取り込んで,階層的残差構造を持つ大域的形状特性をさらに学習する。
IAHCC-UCAS2016, ICDAR-2013, UNIPENデータセットの実験は、SGCNが文字認識の最先端手法と同等の認識性能を達成できることを示した。
関連論文リスト
- DepWiGNN: A Depth-wise Graph Neural Network for Multi-hop Spatial
Reasoning in Text [52.699307699505646]
マルチホップ空間推論のためのDepWiGNN(Depth-Wise Graph Neural Network)を提案する。
具体的には,新しいノードメモリ方式を設計し,グラフの幅次元ではなく深さ次元の情報を集約する。
2つの挑戦的なマルチホップ空間推論データセットの実験結果から,DepWiGNNが既存の空間推論手法より優れていることが示された。
論文 参考訳(メタデータ) (2023-10-19T08:07:22Z) - Graph Neural Networks Provably Benefit from Structural Information: A
Feature Learning Perspective [53.999128831324576]
グラフニューラルネットワーク(GNN)は、グラフ表現学習の先駆けとなった。
本研究では,特徴学習理論の文脈におけるグラフ畳み込みの役割について検討する。
論文 参考訳(メタデータ) (2023-06-24T10:21:11Z) - Spatio-Temporal driven Attention Graph Neural Network with Block
Adjacency matrix (STAG-NN-BA) [0.0]
衛星画像を用いた空間的・時間的分類のためのグラフニューラルネットワークアーキテクチャを提案する。
本稿では,各画素を分類する代わりに,単純な線形反復クラスタリング(SLIC)画像分割とグラフ注意GATに基づく手法を提案する。
コードとデータセットはGitHubリポジトリ経由で公開されます。
論文 参考訳(メタデータ) (2023-03-25T01:26:50Z) - Global Regular Network for Writer Identification [0.5330240017302619]
作家識別は偽造検知と法医学に実用的応用がある。
ネットワークは,グローバルな特徴を抽出するための入力としてページ手書きを,ローカル特徴を抽出するための入力として単語手書きを,という2つのブランチで構成されている。
実験は、著者識別分野におけるネットワークの強力な能力を示す。
論文 参考訳(メタデータ) (2022-01-16T02:43:38Z) - Sign Language Translation with Hierarchical Spatio-TemporalGraph Neural
Network [6.623802929157273]
手話翻訳(SLT)は、手話の視覚的内容から音声言語のテキストを生成する。
本稿では,これらの手話の特徴を階層時間グラフ表現として定式化する。
階層型階層時間グラフニューラルネットワーク(HSTG-NN)と呼ばれる新しいディープラーニングアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-11-14T07:02:28Z) - Graph Neural Networks with Learnable Structural and Positional
Representations [83.24058411666483]
任意のグラフの大きな問題は、ノードの標準位置情報の欠如である。
ノードの位置ノード(PE)を導入し、Transformerのように入力層に注入する。
両方のGNNクラスで学習可能なPEを考えると、分子データセットのパフォーマンスは2.87%から64.14%に向上する。
論文 参考訳(メタデータ) (2021-10-15T05:59:15Z) - Spatial-Temporal Correlation and Topology Learning for Person
Re-Identification in Videos [78.45050529204701]
クロススケール空間時空間相関をモデル化し, 識別的, 堅牢な表現を追求する新しい枠組みを提案する。
CTLはCNNバックボーンとキーポイント推定器を使用して人体から意味的局所的特徴を抽出する。
グローバルな文脈情報と人体の物理的接続の両方を考慮して、多スケールグラフを構築するためのコンテキスト強化トポロジーを探求する。
論文 参考訳(メタデータ) (2021-04-15T14:32:12Z) - GR-RNN: Global-Context Residual Recurrent Neural Networks for Writer
Identification [8.147652597876862]
本稿では,手書きの単語画像から著者を識別するエンドツーエンドニューラルネットワークシステムを提案する。
グローバルコンテキスト情報は、グローバル平均プーリングステップによってニューラルネットワークの尾部から抽出される。
ローカルおよびフラグメントベースの機能のシーケンスは、低レベルのディープフィーチャーマップから抽出される。
論文 参考訳(メタデータ) (2021-04-11T15:46:31Z) - Multi-Level Graph Convolutional Network with Automatic Graph Learning
for Hyperspectral Image Classification [63.56018768401328]
HSI分類のための自動グラフ学習法(MGCN-AGL)を用いたマルチレベルグラフ畳み込みネットワーク(GCN)を提案する。
空間的に隣接する領域における重要度を特徴付けるために注意機構を利用することで、最も関連性の高い情報を適応的に組み込んで意思決定を行うことができる。
MGCN-AGLは局所的に生成した表現表現に基づいて画像領域間の長距離依存性を符号化する。
論文 参考訳(メタデータ) (2020-09-19T09:26:20Z) - Binarized Graph Neural Network [65.20589262811677]
我々は二項化グラフニューラルネットワークを開発し、二項化ネットワークパラメータを用いてノードのバイナリ表現を学習する。
提案手法は既存のGNNベースの埋め込み手法にシームレスに統合できる。
実験により、提案された二項化グラフニューラルネットワーク、すなわちBGNは、時間と空間の両方の観点から、桁違いに効率的であることが示されている。
論文 参考訳(メタデータ) (2020-04-19T09:43:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。