論文の概要: GR-RNN: Global-Context Residual Recurrent Neural Networks for Writer
Identification
- arxiv url: http://arxiv.org/abs/2104.05036v1
- Date: Sun, 11 Apr 2021 15:46:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-13 14:11:30.237161
- Title: GR-RNN: Global-Context Residual Recurrent Neural Networks for Writer
Identification
- Title(参考訳): GR-RNN: 文字識別のための大域的文脈残差リカレントニューラルネットワーク
- Authors: Sheng He, Lambert Schomaker
- Abstract要約: 本稿では,手書きの単語画像から著者を識別するエンドツーエンドニューラルネットワークシステムを提案する。
グローバルコンテキスト情報は、グローバル平均プーリングステップによってニューラルネットワークの尾部から抽出される。
ローカルおよびフラグメントベースの機能のシーケンスは、低レベルのディープフィーチャーマップから抽出される。
- 参考スコア(独自算出の注目度): 8.147652597876862
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper presents an end-to-end neural network system to identify writers
through handwritten word images, which jointly integrates global-context
information and a sequence of local fragment-based features. The global-context
information is extracted from the tail of the neural network by a global
average pooling step. The sequence of local and fragment-based features is
extracted from a low-level deep feature map which contains subtle information
about the handwriting style. The spatial relationship between the sequence of
fragments is modeled by the recurrent neural network (RNN) to strengthen the
discriminative ability of the local fragment features. We leverage the
complementary information between the global-context and local fragments,
resulting in the proposed global-context residual recurrent neural network
(GR-RNN) method. The proposed method is evaluated on four public data sets and
experimental results demonstrate that it can provide state-of-the-art
performance. In addition, the neural networks trained on gray-scale images
provide better results than neural networks trained on binarized and contour
images, indicating that texture information plays an important role for writer
identification.
The source code will be available:
\url{https://github.com/shengfly/writer-identification}.
- Abstract(参考訳): 本稿では,グローバルコンテキスト情報と局所フラグメントに基づく特徴列を共同で統合した,手書きの単語画像を用いて書き手を識別するエンド・ツー・エンドニューラルネットワークシステムを提案する。
グローバルコンテキスト情報は、グローバル平均プーリングステップによってニューラルネットワークのテールから抽出される。
局所的および断片的特徴のシーケンスは、手書きスタイルに関する微妙な情報を含む低レベル深層特徴マップから抽出される。
断片列間の空間的関係はrecurrent neural network(rnn)によってモデル化され、局所的断片の特徴の識別能力を強化する。
本稿では,グローバルコンテキストとローカルフラグメントの相補的情報を活用することにより,グローバルコンテキスト残差リカレントニューラルネットワーク(gr-rnn)法を提案する。
提案手法は4つの公開データセット上で評価され,実験結果から最新性能が得られた。
さらに、グレースケール画像でトレーニングされたニューラルネットワークは、二色化画像や輪郭画像でトレーニングされたニューラルネットワークよりも優れた結果をもたらし、テクスチャ情報がライター識別に重要な役割を果たすことを示している。
ソースコードは、 \url{https://github.com/shengfly/writer-identification} で入手できる。
関連論文リスト
- Graph Neural Networks for Learning Equivariant Representations of Neural Networks [55.04145324152541]
本稿では,ニューラルネットワークをパラメータの計算グラフとして表現することを提案する。
我々のアプローチは、ニューラルネットワークグラフを多種多様なアーキテクチャでエンコードする単一モデルを可能にする。
本稿では,暗黙的ニューラル表現の分類や編集など,幅広いタスクにおける本手法の有効性を示す。
論文 参考訳(メタデータ) (2024-03-18T18:01:01Z) - GNN-LoFI: a Novel Graph Neural Network through Localized Feature-based
Histogram Intersection [51.608147732998994]
グラフニューラルネットワークは、グラフベースの機械学習の選択フレームワークになりつつある。
本稿では,古典的メッセージパッシングに代えて,ノード特徴の局所分布を解析するグラフニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-01-17T13:04:23Z) - Unleashing the Power of Depth and Pose Estimation Neural Networks by
Designing Compatible Endoscopic Images [12.412060445862842]
内視鏡画像の特性を詳細に解析し、画像とニューラルネットワークの互換性を改善する。
まず,完全な画像情報の代わりに部分的な画像情報を入力するMask Image Modelling (MIM) モジュールを導入する。
第2に、画像とニューラルネットワークの互換性を明確に向上させるために、内視鏡画像を強化する軽量ニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2023-09-14T02:19:38Z) - Global Regular Network for Writer Identification [0.5330240017302619]
作家識別は偽造検知と法医学に実用的応用がある。
ネットワークは,グローバルな特徴を抽出するための入力としてページ手書きを,ローカル特徴を抽出するための入力として単語手書きを,という2つのブランチで構成されている。
実験は、著者識別分野におけるネットワークの強力な能力を示す。
論文 参考訳(メタデータ) (2022-01-16T02:43:38Z) - TextRGNN: Residual Graph Neural Networks for Text Classification [13.912147013558846]
TextRGNNは改良されたGNN構造であり、畳み込みネットワークの深さを深くする残差接続を導入している。
我々の構造はより広いノード受容場を得ることができ、ノード特徴の過度な平滑化を効果的に抑制できる。
コーパスレベルであれテキストレベルであれ、分類精度を大幅に向上させ、幅広いテキスト分類データセット上でSOTA性能を達成することができる。
論文 参考訳(メタデータ) (2021-12-30T13:48:58Z) - Overcoming Catastrophic Forgetting in Graph Neural Networks [50.900153089330175]
破滅的な忘れは、ニューラルネットワークが新しいタスクを学ぶ前に学んだ知識を「忘れる」傾向を指します。
本稿では,この問題を克服し,グラフニューラルネットワーク(GNN)における継続学習を強化するための新しいスキームを提案する。
私たちのアプローチの中心には、トポロジ認識重量保存(TWP)と呼ばれる汎用モジュールがあります。
論文 参考訳(メタデータ) (2020-12-10T22:30:25Z) - Multi-Level Graph Convolutional Network with Automatic Graph Learning
for Hyperspectral Image Classification [63.56018768401328]
HSI分類のための自動グラフ学習法(MGCN-AGL)を用いたマルチレベルグラフ畳み込みネットワーク(GCN)を提案する。
空間的に隣接する領域における重要度を特徴付けるために注意機構を利用することで、最も関連性の高い情報を適応的に組み込んで意思決定を行うことができる。
MGCN-AGLは局所的に生成した表現表現に基づいて画像領域間の長距離依存性を符号化する。
論文 参考訳(メタデータ) (2020-09-19T09:26:20Z) - A new approach to descriptors generation for image retrieval by
analyzing activations of deep neural network layers [43.77224853200986]
本稿では,ディープニューラルネットワークを用いたコンテンツベース画像検索作業における記述子構築の問題点について考察する。
ネットワークの畳み込み部分のニューロンの総数は多く、その大部分が最終分類決定にほとんど影響を与えないことが知られている。
本稿では,最も重要なニューロン活性化を抽出し,その情報を利用して効果的な記述子を構築する新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-13T18:53:10Z) - Ventral-Dorsal Neural Networks: Object Detection via Selective Attention [51.79577908317031]
我々はVDNet(Ventral-Dorsal Networks)と呼ばれる新しいフレームワークを提案する。
人間の視覚システムの構造にインスパイアされた我々は「Ventral Network」と「Dorsal Network」の統合を提案する。
実験の結果,提案手法は最先端の物体検出手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2020-05-15T23:57:36Z) - Dense Residual Network: Enhancing Global Dense Feature Flow for
Character Recognition [75.4027660840568]
本稿では,すべての畳み込み層から階層的特徴をフルに活用することにより,局所的・大域的特徴フローを改善する方法について検討する。
技術的には、テキスト認識のための効率的で効果的なCNNフレームワークであるFDRN(Fast Dense Residual Network)を提案する。
論文 参考訳(メタデータ) (2020-01-23T06:55:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。