論文の概要: Realistic Handwritten Multi-Digit Writer (MDW) Number Recognition Challenges
- arxiv url: http://arxiv.org/abs/2512.00676v1
- Date: Sun, 30 Nov 2025 00:13:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.355516
- Title: Realistic Handwritten Multi-Digit Writer (MDW) Number Recognition Challenges
- Title(参考訳): 実写手書きMulti-Digit Writer (MDW)ナンバー認識チャレンジ
- Authors: Kiri L. Wagstaff,
- Abstract要約: 分離された桁分類は、数十年にわたる機械学習研究の動機付け問題となっている。
実際の設定では、数字は複数の桁で表され、すべて同一人物によって書かれる。
本研究では,NIST桁画像の書き手に関する知識を活用し,より現実的なベンチマーク多桁文字(MDW)データセットを作成する。
- 参考スコア(独自算出の注目度): 1.5939955861266888
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Isolated digit classification has served as a motivating problem for decades of machine learning research. In real settings, numbers often occur as multiple digits, all written by the same person. Examples include ZIP Codes, handwritten check amounts, and appointment times. In this work, we leverage knowledge about the writers of NIST digit images to create more realistic benchmark multi-digit writer (MDW) data sets. As expected, we find that classifiers may perform well on isolated digits yet do poorly on multi-digit number recognition. If we want to solve real number recognition problems, additional advances are needed. The MDW benchmarks come with task-specific performance metrics that go beyond typical error calculations to more closely align with real-world impact. They also create opportunities to develop methods that can leverage task-specific knowledge to improve performance well beyond that of individual digit classification methods.
- Abstract(参考訳): 分離された桁分類は、数十年にわたる機械学習研究の動機付け問題となっている。
実際の設定では、数字は複数の桁で表され、すべて同一人物によって書かれる。
例えば、ZIPコード、手書きチェック量、アポイントメント時間などがある。
本研究では,NIST桁画像の書き手に関する知識を活用し,より現実的なベンチマーク多桁文字(MDW)データセットを作成する。
期待されたように、分類器は孤立桁ではうまく機能するが、多重桁数認識では不十分である。
実数認識問題を解くためには、さらなる進歩が必要である。
MDWベンチマークには、典型的なエラー計算以上のタスク固有のパフォーマンス指標があり、実際の影響とより密に一致している。
彼らはまた、タスク固有の知識を活用して、個々の桁分類方法以上のパフォーマンスを向上させる方法を開発する機会も生み出す。
関連論文リスト
- Handwritten Digit Recognition: An Ensemble-Based Approach for Superior Performance [9.174021241188143]
本稿では,CNN(Convolutional Neural Networks)と従来の機械学習技術を組み合わせて,認識精度と堅牢性を向上させるアンサンブルに基づくアプローチを提案する。
我々は,70,000個の手書き桁画像からなるMNISTデータセットを用いて本手法の評価を行った。
特徴抽出にCNNを,分類にSVM(Support Vector Machines)を併用したハイブリッドモデルは,99.30%の精度を実現する。
論文 参考訳(メタデータ) (2025-03-08T07:09:49Z) - Transformers Can Do Arithmetic with the Right Embeddings [75.66545271398704]
算術演算における変換器の性能向上について述べる。
たった20桁の数値で1日1GPUでトレーニングすれば、最先端のパフォーマンスに到達できます。
これらの数的増加は、ソートや乗算を含む他の多段階の推論タスクの改善を解放する。
論文 参考訳(メタデータ) (2024-05-27T17:49:18Z) - Deep Learning-Driven Approach for Handwritten Chinese Character Classification [0.0]
手書き文字認識は、機械学習研究者にとって難しい問題である。
多数のユニークな文字クラスが存在するため、ロジカルスクリプトや中韓文字シーケンスのようなデータによっては、HCR問題に新たな複雑さをもたらす。
本稿では、モデルアーキテクチャ、データ前処理ステップ、設計手順のテストを導入し、詳細な文字画像分類のための高度にスケーラブルなアプローチを提案する。
論文 参考訳(メタデータ) (2024-01-30T15:29:32Z) - Identifying and Analyzing Performance-Critical Tokens in Large Language Models [52.404072802235234]
我々は大規模な言語モデルがいかに実演からタスクを実行するかを研究する。
私たちの仕事は、大規模な言語モデルがデモからタスクを実行するための学習方法に光を当て、さまざまな種類のトークンが大きな言語モデルで果たす役割についての理解を深めます。
論文 参考訳(メタデータ) (2024-01-20T20:55:21Z) - Positional Description Matters for Transformers Arithmetic [58.4739272381373]
トランスフォーマーは、大きな能力にもかかわらず、算術的なタスクに干渉することが多い。
位置エンコーディングを直接修正するか、あるいは算術タスクの表現を変更して、標準的な位置エンコーディングを異なる方法で活用することで、問題を解決する方法をいくつか提案する。
論文 参考訳(メタデータ) (2023-11-22T00:31:01Z) - Sampling and Ranking for Digital Ink Generation on a tight computational
budget [69.15275423815461]
トレーニングされたデジタルインク生成モデルの出力品質を最大化する方法について検討する。
我々は、デジタルインク領域におけるその種類に関する最初のアブレーション研究において、複数のサンプリングとランキング手法の効果を使用、比較する。
論文 参考訳(メタデータ) (2023-06-02T09:55:15Z) - FERMAT: An Alternative to Accuracy for Numerical Reasoning [11.893004722079557]
数値推論は、既存のデータセットの単一スコアを用いて測定される。
我々は、FERMATと呼ばれる、英語の数値推論のための多視点評価セットを導入する。
FerMATは、数理解、数学的操作、訓練依存など、様々な重要な数値推論の側面でモデルを評価する。
論文 参考訳(メタデータ) (2023-05-27T15:00:45Z) - NumGPT: Improving Numeracy Ability of Generative Pre-trained Models [59.931394234642816]
テキスト中の数値特性を明示的にモデル化する生成事前学習モデルであるNumGPTを提案する。
具体的には、プロトタイプベースの数値埋め込みを利用して、数値の行列をエンコードし、個々の埋め込みをエンコードし、数値の指数をエンコードする。
数値認識損失関数は、NumGPTの事前学習目的に数値を統合するように設計されている。
論文 参考訳(メタデータ) (2021-09-07T15:06:12Z) - Multi-script Handwritten Digit Recognition Using Multi-task Learning [2.8698937226234795]
堅牢で多目的なシステムの開発を促進するマルチスクリプトの桁認識では、あまり一般的ではない。
本研究では,マルチタスク学習を用いた手書き文字認識について検討する。
ラテン文字、アラビア文字、カンナダ文字を含む3文字の手書き桁は、個々のタスクを書き換えたマルチタスクモデルが有望な結果を示していることを示すために研究されている。
論文 参考訳(メタデータ) (2021-06-15T16:30:37Z) - Digit Recognition Using Convolution Neural Network [0.0]
本稿では,文字認識の精度を高めるために,正しい特徴を抽出することを目的とする。
パスワード、銀行小切手などの数字認識の応用により、有効なユーザ識別が認識される。
本研究の主な目的は、畳み込みニューラルネットワーク(CNN)を用いて、99.15%の精度を得ることである。
論文 参考訳(メタデータ) (2020-04-01T10:41:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。