論文の概要: An End-to-End Approach for Recognition of Modern and Historical
Handwritten Numeral Strings
- arxiv url: http://arxiv.org/abs/2004.03337v1
- Date: Sat, 28 Mar 2020 16:51:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-18 23:19:20.143287
- Title: An End-to-End Approach for Recognition of Modern and Historical
Handwritten Numeral Strings
- Title(参考訳): 現代・歴史的手書き文字列認識のためのエンドツーエンドアプローチ
- Authors: Andre G. Hochuli, Alceu S. Britto Jr., Jean P. Barddal, Luiz E. S.
Oliveira, Robert Sabourin
- Abstract要約: 手書き文字列認識のためのエンドツーエンドソリューションを提案する。
主な貢献は、前処理とセグメンテーションのための文字列ベースのメソッドを避けることである。
複数の文字列データセットに基づくロバストな実験プロトコルにより,提案手法が実現可能なエンド・ツー・エンド・ソリューションであることを実証した。
- 参考スコア(独自算出の注目度): 9.950131528559211
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: An end-to-end solution for handwritten numeral string recognition is
proposed, in which the numeral string is considered as composed of objects
automatically detected and recognized by a YoLo-based model. The main
contribution of this paper is to avoid heuristic-based methods for string
preprocessing and segmentation, the need for task-oriented classifiers, and
also the use of specific constraints related to the string length. A robust
experimental protocol based on several numeral string datasets, including one
composed of historical documents, has shown that the proposed method is a
feasible end-to-end solution for numeral string recognition. Besides, it
reduces the complexity of the string recognition task considerably since it
drops out classical steps, in special preprocessing, segmentation, and a set of
classifiers devoted to strings with a specific length.
- Abstract(参考訳): ヨーロベースモデルによって自動的に検出され認識される物体からなる数字と見なされる手書きの数字認識のためのエンドツーエンドソリューションを提案する。
本論文の主な貢献は,文字列前処理とセグメンテーションのヒューリスティックな手法,タスク指向の分類器の必要性,および文字列長に関する特定の制約の使用を避けることである。
歴史的文書を含む数個の数値文字列データセットに基づく頑健な実験プロトコルでは,提案手法が数値文字列認識の終端解として実現可能であることを示した。
さらに、特別な前処理、セグメンテーション、特定の長さの文字列専用の分類器のセットなど、古典的なステップを省略するため、文字列認識タスクの複雑さを大幅に減らす。
関連論文リスト
- STORE: Streamlining Semantic Tokenization and Generative Recommendation with A Single LLM [59.08493154172207]
本稿では,意味的トークン化と生成的レコメンデーションプロセスを合理化する統合フレームワークを提案する。
我々は,意味的トークン化をテキスト・ツー・ケントタスクとして定式化し,生成的推薦をトークン・ツー・ケントタスクとして,トークン・ツー・ケント・コンストラクションタスクとテキスト・ツー・ケント補助タスクで補足する。
これらのタスクはすべて生成的な方法でフレーム化され、単一の大規模言語モデル(LLM)バックボーンを使用してトレーニングされる。
論文 参考訳(メタデータ) (2024-09-11T13:49:48Z) - Out of Length Text Recognition with Sub-String Matching [54.63761108308825]
本稿では,このタスクをOOL(Out of Length)テキスト認識と呼ぶ。
サブ文字列マッチング(SMTR)を用いたOOLテキスト認識手法を提案する。
SMTRは2つのクロスアテンションベースのモジュールから構成される: 1つは複数の文字を含むサブストリングを次のクエリと前のクエリにエンコードし、もう1つは画像の特徴に対応するためにクエリを使用する。
論文 参考訳(メタデータ) (2024-07-17T05:02:17Z) - A Fixed-Point Approach to Unified Prompt-Based Counting [51.20608895374113]
本研究の目的は,ボックス,ポイント,テキストなど,さまざまなプロンプト型で示されるオブジェクトの密度マップを生成することができる包括的プロンプトベースのカウントフレームワークを確立することである。
本モデルは,クラスに依存しない顕著なデータセットに優れ,データセット間の適応タスクにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2024-03-15T12:05:44Z) - Token Alignment via Character Matching for Subword Completion [34.76794239097628]
本稿では,生成モデルにおけるテキスト補完におけるトークン化アーティファクトの緩和手法について検討する。
この手法はトークンアライメントと呼ばれ、最後の完全なトークンをバックトラックし、モデルの生成がプロンプトと整合することを保証する。
論文 参考訳(メタデータ) (2024-03-13T16:44:39Z) - Large Language Model Prompt Chaining for Long Legal Document
Classification [2.3148470932285665]
チェイン(Chaining)は、複雑なタスクを小さな管理可能なコンポーネントに分解する戦略である。
即時連鎖により、ゼロショット以上の性能を向上できるだけでなく、より大きなモデルによって達成されたマイクロF1スコアを超越できることを実証する。
論文 参考訳(メタデータ) (2023-08-08T08:57:01Z) - Multiview Identifiers Enhanced Generative Retrieval [78.38443356800848]
生成検索は、検索対象の通路の識別子文字列を生成する。
本稿では,パスの内容に基づいて生成される新しいタイプの識別子,合成識別子を提案する。
提案手法は生成的検索において最善を尽くし,その有効性とロバスト性を実証する。
論文 参考訳(メタデータ) (2023-05-26T06:50:21Z) - Attributable and Scalable Opinion Summarization [79.87892048285819]
我々は、頻繁なエンコーディングを復号することで抽象的な要約を生成し、同じ頻繁なエンコーディングに割り当てられた文を選択して抽出的な要約を生成する。
本手法は,要約プロセスの一部として要約を生成するために使用される文を同定するため,帰属的手法である。
なぜなら、アグリゲーションはトークンの長いシーケンスではなく、潜在空間で実行されるからである。
論文 参考訳(メタデータ) (2023-05-19T11:30:37Z) - On Parsing as Tagging [66.31276017088477]
そこで我々は,現在最先端の選挙区タグであるテトラタグを減らして,シフト-リデュース解析を行う方法を示す。
我々は、線形化器、学習者、復号器の異なる選択でタグ付けパイプラインの分類を実証的に評価する。
論文 参考訳(メタデータ) (2022-11-14T13:37:07Z) - End-to-End Approach for Recognition of Historical Digit Strings [2.0754848504005583]
ARDISデータセット(4桁長弦)に存在する古代の筆跡の難易度に対処するエンドツーエンドのセグメンテーションフリー深層学習手法を提案する。
VGG-16ディープモデルのわずかな変更により、フレームワークは93.2%の認識率を達成でき、メソッド、セグメンテーション、および融合方法のない実現可能なソリューションであることが示されています。
論文 参考訳(メタデータ) (2021-04-28T09:39:29Z) - A Skip-connected Multi-column Network for Isolated Handwritten Bangla
Character and Digit recognition [12.551285203114723]
マルチスケールマルチカラムスキップ畳み込みニューラルネットワークを用いた非明示的特徴抽出手法を提案する。
本手法は,手書き文字と数字の4つの公開データセットを用いて評価する。
論文 参考訳(メタデータ) (2020-04-27T13:18:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。