論文の概要: Training Protocol Matters: Towards Accurate Scene Text Recognition via
Training Protocol Searching
- arxiv url: http://arxiv.org/abs/2203.06696v2
- Date: Thu, 17 Mar 2022 03:08:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-18 10:43:28.209196
- Title: Training Protocol Matters: Towards Accurate Scene Text Recognition via
Training Protocol Searching
- Title(参考訳): トレーニングプロトコル問題:トレーニングプロトコル検索による正確なシーンテキスト認識に向けて
- Authors: Xiaojie Chu, Yongtao Wang, Chunhua Shen, Jingdong Chen, Wei Chu
- Abstract要約: 実験結果から,本研究の学習プロトコルは,主要なSTRモデルの認識精度を2.7%向上できることがわかった。
検索したトレーニングプロトコルでは、TRBA-Netは最先端のSTRモデルよりも2.1%高い精度を実現している。
- 参考スコア(独自算出の注目度): 105.05658178620698
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The development of scene text recognition (STR) in the era of deep learning
has been mainly focused on novel architectures of STR models. However, training
protocol (i.e., settings of the hyper-parameters involved in the training of
STR models), which plays an equally important role in successfully training a
good STR model, is under-explored for scene text recognition. In this work, we
attempt to improve the accuracy of existing STR models by searching for optimal
training protocol. Specifically, we develop a training protocol search
algorithm, based on a newly designed search space and an efficient search
algorithm using evolutionary optimization and proxy tasks. Experimental results
show that our searched training protocol can improve the recognition accuracy
of mainstream STR models by 2.7%~3.9%. In particular, with the searched
training protocol, TRBA-Net achieves 2.1% higher accuracy than the
state-of-the-art STR model (i.e., EFIFSTR), while the inference speed is 2.3x
and 3.7x faster on CPU and GPU respectively. Extensive experiments are
conducted to demonstrate the effectiveness of the proposed method and the
generalization ability of the training protocol found by our search method.
Code is available at https://github.com/VDIGPKU/STR_TPSearch.
- Abstract(参考訳): ディープラーニング時代のシーンテキスト認識(STR)の開発は主にSTRモデルの新しいアーキテクチャに焦点を当てている。
しかし、優れたSTRモデルのトレーニングにおいて等しく重要な役割を果たすトレーニングプロトコル(すなわちSTRモデルのトレーニングにかかわるハイパーパラメータの設定)は、シーンテキスト認識には未熟である。
本研究では,既存のSTRモデルの最適トレーニングプロトコルを探索することで,精度の向上を試みる。
具体的には,新しく設計された探索空間に基づく学習プロトコル探索アルゴリズムと,進化的最適化とプロキシタスクを用いた効率的な探索アルゴリズムを開発した。
実験結果から,本研究の学習プロトコルは,主要なSTRモデルの認識精度を2.7%~3.9%向上できることがわかった。
特に、検索したトレーニングプロトコルでは、TRBA-Netは最先端のSTRモデル(EFIFSTR)よりも2.1%高い精度で、推論速度はCPUとGPUでそれぞれ2.3倍と3.7倍速い。
提案手法の有効性と,本手法で検出したトレーニングプロトコルの一般化能力を示すため,大規模な実験を行った。
コードはhttps://github.com/VDIGPKU/STR_TPSearchで入手できる。
関連論文リスト
- The Surprising Effectiveness of Test-Time Training for Abstract Reasoning [64.36534512742736]
モデル推論能力向上のためのメカニズムとして,テストタイムトレーニング(TTT)の有効性を検討する。
TTTはARCタスクのパフォーマンスを大幅に改善し、ベースとなる微調整モデルと比較して最大6倍の精度向上を実現した。
本研究は,ニューラルネットワークモデルにおける抽象的推論改善の道筋として,明示的な記号探索が唯一の道ではないことを示唆している。
論文 参考訳(メタデータ) (2024-11-11T18:59:45Z) - Deep Active Learning with Structured Neural Depth Search [18.180995603975422]
Active-iNASは、複数のモデルを訓練し、各アクティブラーニングサイクルの後に、その後のサンプルをクエリする最適な一般化性能でモデルを選択する。
本稿では,SVI(Structured Variational Inference)あるいはSNDS(Structured Neural Deep Search)と呼ばれる手法を用いた新しいアクティブ戦略を提案する。
同時に、理論上は、平均場推定に基づく現在のVIベースの手法が性能を低下させる可能性があることを実証している。
論文 参考訳(メタデータ) (2023-06-05T12:00:12Z) - Searching a High-Performance Feature Extractor for Text Recognition
Network [92.12492627169108]
優れた特徴抽出器を持つための原理を探求し,ドメイン固有の検索空間を設計する。
空間は巨大で複雑な構造であるため、既存のNASアルゴリズムを適用することはできない。
本研究では,空間内を効率的に探索する2段階のアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-09-27T03:49:04Z) - TSO: Curriculum Generation using continuous optimization [0.0]
連続最適化に基づく簡便かつ効率的な手法を提案する。
エンコーダネットワークは、トレーニングシーケンスを連続空間にマップ/組込みする。
予測ネットワークは、戦略の連続表現を入力として使用し、固定ネットワークアーキテクチャの精度を予測する。
論文 参考訳(メタデータ) (2021-06-16T06:32:21Z) - AutoRC: Improving BERT Based Relation Classification Models via
Architecture Search [50.349407334562045]
BERTに基づく関係分類(RC)モデルは、従来のディープラーニングモデルよりも大幅に改善されている。
最適なアーキテクチャとは何かという合意は得られない。
BERTをベースとしたRCモデルのための包括的検索空間を設計し、設計選択を自動的に検出するためにNAS(Neural Architecture Search)手法を用いる。
論文 参考訳(メタデータ) (2020-09-22T16:55:49Z) - A Novel Training Protocol for Performance Predictors of Evolutionary
Neural Architecture Search Algorithms [10.658358586764171]
進化的ニューラルネットワーク探索(ENAS)は、進化的計算アルゴリズムを用いてディープニューラルネットワーク(DNN)のアーキテクチャを自動的に設計することができる。
性能予測器は、計算資源を多く必要とせず、探索を補助できる回帰モデルの一種である。
本稿では,これらの課題に対処する新たなトレーニングプロトコルを提案する。トレーニングターゲットを構築するためのペアワイズランキングインジケータを設計し,ロジスティック回帰を用いてトレーニングサンプルに適合させ,トレーニングインスタンスを構築するための差分法を開発することを提案する。
論文 参考訳(メタデータ) (2020-08-30T14:39:28Z) - Pre-training Text Representations as Meta Learning [113.3361289756749]
本稿では,下流タスクを効果的に学習するために,モデルがテキスト表現を学習する能力を直接最適化する学習アルゴリズムを提案する。
マルチタスク事前学習とモデル非依存型メタラーニングの間には,一連のメタトレインステップによる本質的な関係があることが示されている。
論文 参考訳(メタデータ) (2020-04-12T09:05:47Z) - AutoSTR: Efficient Backbone Search for Scene Text Recognition [80.7290173000068]
テキストインスタンスの多様性とシーンの複雑さのため、シーンテキスト認識(STR)は非常に難しい。
テキスト認識性能を向上させるために,データ依存のバックボーンを検索するための自動STR(AutoSTR)を提案する。
実験によると、データ依存のバックボーンを検索することで、AutoSTRは標準ベンチマークにおける最先端のアプローチより優れている。
論文 参考訳(メタデータ) (2020-03-14T06:51:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。