論文の概要: Research on Fast Text Recognition Method for Financial Ticket Image
- arxiv url: http://arxiv.org/abs/2101.01310v1
- Date: Tue, 5 Jan 2021 01:42:35 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-11 11:35:41.665753
- Title: Research on Fast Text Recognition Method for Financial Ticket Image
- Title(参考訳): 金融券画像の高速テキスト認識手法に関する研究
- Authors: Fukang Tian, Haiyu Wu, Bo Xu
- Abstract要約: 金融会計の分野では、チケット数の増加が激増し、労働コストが劇的に増加する。
本論文は,まず482種類の金融チケットの特徴を解析し,すべての金融チケットを3つのカテゴリに分け,各カテゴリごとに異なる認識パターンを提案する。
財務チケットテキストの特性に応じて、より高い認識精度を得るために、損失関数、地域提案ネットワーク(RPN)および非最大抑制(NMS)が改善されます。
- 参考スコア(独自算出の注目度): 5.371241477007343
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Currently, deep learning methods have been widely applied in and thus
promoted the development of different fields. In the financial accounting
field, the rapid increase in the number of financial tickets dramatically
increases labor costs; hence, using a deep learning method to relieve the
pressure on accounting is necessary. At present, a few works have applied deep
learning methods to financial ticket recognition. However, first, their
approaches only cover a few types of tickets. In addition, the precision and
speed of their recognition models cannot meet the requirements of practical
financial accounting systems. Moreover, none of the methods provides a detailed
analysis of both the types and content of tickets. Therefore, this paper first
analyzes the different features of 482 kinds of financial tickets, divides all
kinds of financial tickets into three categories and proposes different
recognition patterns for each category. These recognition patterns can meet
almost all types of financial ticket recognition needs. Second, regarding the
fixed format types of financial tickets (accounting for 68.27\% of the total
types of tickets), we propose a simple yet efficient network named the
Financial Ticket Faster Detection network (FTFDNet) based on a Faster RCNN.
Furthermore, according to the characteristics of the financial ticket text, in
order to obtain higher recognition accuracy, the loss function, Region Proposal
Network (RPN), and Non-Maximum Suppression (NMS) are improved to make FTFDNet
focus more on text. Finally, we perform a comparison with the best ticket
recognition model from the ICDAR2019 invoice competition. The experimental
results illustrate that FTFDNet increases the processing speed by 50\% while
maintaining similar precision.
- Abstract(参考訳): 現在,ディープラーニング手法が広く適用されており,様々な分野の開発が進められている。
金融会計分野では、金融券の急激な増加が労働コストを劇的に増加させるため、会計の圧力を和らげるために深層学習手法が必要である。
現在,金融チケット認識に深層学習手法を適用している研究がいくつかある。
しかし、まず、彼らのアプローチは数種類のチケットしかカバーしていない。
さらに、その認識モデルの精度と速度は、実用的な財務会計システムの要件を満たすことができない。
さらに,チケットの種類や内容の詳細な分析は行われていない。
そこで本稿ではまず,482種類の金融チケットの異なる特徴を分析し,すべての金融チケットを3つのカテゴリに分け,各カテゴリの異なる認識パターンを提案する。
これらの認識パターンは、ほぼあらゆる種類のファイナンシャルチケット認識のニーズを満たすことができる。
第2に、固定形式の金融切符(全切符の68.27\%)について、より高速なrcnnに基づいて、簡易かつ効率的な金融切符高速検出ネットワーク(ftfdnet)を提案する。
さらに、ファイナンシャルチケットのテキストの特徴により、高い認識精度を得るために、損失関数、地域提案ネットワーク(RPN)、非最大抑圧(NMS)を改善して、FTFDNetをよりテキストに集中させる。
最後に,ICDAR2019請求書コンテストにおけるチケット認識モデルの比較を行った。
実験の結果, FTFDNetは処理速度を50%向上し, 類似の精度を維持した。
関連論文リスト
- Multimodality Helps Few-Shot 3D Point Cloud Semantic Segmentation [61.91492500828508]
FS-PCS (Few-shot 3D point cloud segmentation) は、最小のサポートサンプルで新しいカテゴリを分割するモデルを一般化することを目的としている。
本稿では,テキストラベルと潜在的に利用可能な2次元画像モダリティを利用して,コストフリーのマルチモーダルFS-PCSセットアップを提案する。
トレーニングバイアスを軽減するため,テスト時間適応型クロスモーダルセグ(TACC)技術を提案する。
論文 参考訳(メタデータ) (2024-10-29T19:28:41Z) - FinEmbedDiff: A Cost-Effective Approach of Classifying Financial Documents with Vector Sampling using Multi-modal Embedding Models [0.0]
FinEmbedDiffは、財務文書を分類するための費用効率の良いベクトルサンプリング手法である。
最先端のベースラインと比較して、競争力のある分類精度を達成する。
これは現実の金融アプリケーションのための実用的でスケーラブルなソリューションです。
論文 参考訳(メタデータ) (2024-05-28T16:34:24Z) - Identifying Banking Transaction Descriptions via Support Vector Machine Short-Text Classification Based on a Specialized Labelled Corpus [7.046417074932257]
本稿では,自然言語処理技術と機械学習アルゴリズムを組み合わせて,銀行取引記述を分類する新しいシステムについて述べる。
また,スパム検出における既存のソリューションに触発されて,ジャカード距離に基づくトレーニングセットサイズの削減を目的とした,短いテキスト類似度検出手法を提案する。
Google PlayとApp Storeで利用可能なパーソナルファイナンスアプリケーションCoinScrapのユースケースを提示する。
論文 参考訳(メタデータ) (2024-03-29T13:15:46Z) - Textual Data Mining for Financial Fraud Detection: A Deep Learning
Approach [0.0]
本稿では,自然言語処理(以下,NLP)のバイナリ分類タスクを,金融詐欺テキストの分析に活用する深層学習手法を提案する。
私の方法論では、埋め込み層を持つ多層パーセプトロン、Vanilla Recurrent Neural Network(RNN)、Long-Short Term Memory(LSTM)、Gated Recurrent Unit(GRU)など、さまざまな種類のニューラルネットワークモデルが関係しています。
本研究が深層学習,NLP,金融の交差点における研究の進展に寄与するため,私の研究成果は,金融不正検出に重大な影響を及ぼす。
論文 参考訳(メタデータ) (2023-08-05T15:33:10Z) - Transaction Fraud Detection via an Adaptive Graph Neural Network [64.9428588496749]
本稿では,アダプティブサンプリングとアグリゲーションに基づくグラフニューラルネットワーク(ASA-GNN)を提案する。
ノイズの多いノードをフィルタリングし、不正なノードを補うために、隣のサンプリング戦略を実行する。
3つのファイナンシャルデータセットの実験により,提案手法のASA-GNNは最先端のデータセットよりも優れていることが示された。
論文 参考訳(メタデータ) (2023-07-11T07:48:39Z) - Robust Lottery Tickets for Pre-trained Language Models [57.14316619360376]
本稿では,従来の言語モデルに隠されたロバストなチケットを識別するために,二分重マスクの学習に基づく新しい手法を提案する。
実験結果から, 従来の対向ロバスト性評価法に比べて, 提案手法の大幅な改善が示された。
論文 参考訳(メタデータ) (2022-11-06T02:59:27Z) - The Elastic Lottery Ticket Hypothesis [106.79387235014379]
Lottery Ticket Hypothesisは、スパーストレーニング可能なワークスや優勝チケットの識別に注意を向けています。
そのような勝利チケットを識別する最も効果的な方法は、まだ反復マグニチュードベースのPruningです。
我々は,同じモデルファミリーの異なるネットワークから得られる当選チケットを微調整する様々な戦略を提案する。
論文 参考訳(メタデータ) (2021-03-30T17:53:45Z) - Research on All-content Text Recognition Method for Financial Ticket
Image [5.371241477007343]
深層学習に基づく全コンテンツのテキスト検出・認識手法を高精度かつ効率的に設計する。
また,ftcrf(financial ticket character recognition framework)を提案する。
漢字認識の特徴により,この枠組みは2段階情報抽出法を含んでいる。
実験の結果,本手法の平均認識精度は91.75%であり,チケット全体の認識精度は87%であった。
論文 参考訳(メタデータ) (2020-12-15T09:39:32Z) - Financial ticket intelligent recognition system based on deep learning [4.606100785248409]
このシステムは194種類のファイナンシャルチケットを認識でき、自動反復最適化機構を備えている。
システムの平均認識精度は97.07%で、1回のチケットの平均走行時間は175.67msである。
論文 参考訳(メタデータ) (2020-10-29T05:07:40Z) - Winning Lottery Tickets in Deep Generative Models [64.79920299421255]
本稿では,GANやVAEなどの深層生成モデルにおいて,入賞チケットの存在を示す。
また、異なる生成モデル間での当選チケットの転送可能性を示す。
論文 参考訳(メタデータ) (2020-10-05T21:45:39Z) - ResNeSt: Split-Attention Networks [86.25490825631763]
このアーキテクチャは、異なるネットワークブランチにチャンネルワイズを応用し、機能間相互作用のキャプチャと多様な表現の学習の成功を活用する。
我々のモデルはResNeStと呼ばれ、画像分類の精度と遅延トレードオフにおいてEfficientNetより優れています。
論文 参考訳(メタデータ) (2020-04-19T20:40:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。