論文の概要: An MLP Baseline for Handwriting Recognition Using Planar Curvature and Gradient Orientation
- arxiv url: http://arxiv.org/abs/2508.11803v1
- Date: Fri, 15 Aug 2025 21:18:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-19 14:49:10.381518
- Title: An MLP Baseline for Handwriting Recognition Using Planar Curvature and Gradient Orientation
- Title(参考訳): 平面曲率と勾配方向を用いた手書き文字認識のためのMLPベースライン
- Authors: Azam Nouri,
- Abstract要約: 本研究では,手書き文字認識のための多層パーセプトロンを駆動するには,2次幾何学的手がかりだけで十分かどうかを検討する。
この3つの手作り特徴マップを入力として用い,MNIST桁で97%,EMNIST文字で99%の精度を実現した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This study investigates whether second-order geometric cues - planar curvature magnitude, curvature sign, and gradient orientation - are sufficient on their own to drive a multilayer perceptron (MLP) classifier for handwritten character recognition (HCR), offering an alternative to convolutional neural networks (CNNs). Using these three handcrafted feature maps as inputs, our curvature-orientation MLP achieves 97 percent accuracy on MNIST digits and 89 percent on EMNIST letters. These results underscore the discriminative power of curvature-based representations for handwritten character images and demonstrate that the advantages of deep learning can be realized even with interpretable, hand-engineered features.
- Abstract(参考訳): 本研究では、手書き文字認識(HCR)のための多層パーセプトロン(MLP)分類器を駆動するために、平面曲率、曲率符号、勾配方向の2階幾何学的手がかりが、畳み込みニューラルネットワーク(CNN)の代替となるかどうかを検討する。
この3つの手作り特徴マップを入力として用い,MNIST桁で97%,EMNIST文字で99%の精度を実現した。
これらの結果は,手書き文字画像に対する曲率に基づく表現の識別力を強調し,解釈可能な手書き文字画像であっても,ディープラーニングの利点が実現可能であることを示した。
関連論文リスト
- A Sobel-Gradient MLP Baseline for Handwritten Character Recognition [0.0]
我々は古典的なソベル演算子を再考し、簡単な問いを述べる:手書き文字認識(HCR)のための全密度多層パーセプトロン(MLP)を駆動するのに十分な一階エッジマップは十分か?
水平および垂直のソベル微分のみを入力として、MNISTおよびEMNIST文字上でニューラルネットワークをトレーニングする。
極端な単純さにもかかわらず、結果として得られたネットワークは、MNIST桁で98%、EMNIST文字で92%の精度に達し、CNNに近づきながら、メモリフットプリントと透過的な機能を提供する。
論文 参考訳(メタデータ) (2025-08-16T04:17:39Z) - Towards Scalable Handwriting Communication via EEG Decoding and Latent Embedding Integration [4.403687945412488]
本研究は,手書きによる脳波信号の復号化を目的としたアルファベット分類タスクを中心にしている。
手のキネマティクスを応用して,高次元神経記録からの一貫した埋め込みの抽出を導出する。
並列畳み込みニューラルネットワークモデルを用いて、両方のデータソースから特徴を同時に抽出する。
提案手法は9種類のタスクに対して91%の分類精度を達成し,脳波からのきめ細かな手書きデコードの実現可能性を示した。
論文 参考訳(メタデータ) (2024-11-14T04:12:47Z) - Quantifying the Optimization and Generalization Advantages of Graph Neural Networks Over Multilayer Perceptrons [50.33260238739837]
グラフネットワーク(GNN)は、グラフ構造化データから学習する際、顕著な能力を示した。
最適化と一般化の観点から、GNNと一般化を比較した分析の欠如がまだ残っている。
論文 参考訳(メタデータ) (2023-06-24T10:21:11Z) - Learning Implicit Feature Alignment Function for Semantic Segmentation [51.36809814890326]
Implicit Feature Alignment Function (IFA)は、暗黙の神経表現の急速に拡大するトピックにインスパイアされている。
IFAは機能マップを異なるレベルで暗黙的に整列し、任意の解像度でセグメンテーションマップを生成することができることを示す。
提案手法は,様々なアーキテクチャの改善と組み合わせて,一般的なベンチマークにおける最先端の精度のトレードオフを実現する。
論文 参考訳(メタデータ) (2022-06-17T09:40:14Z) - Locally Aggregated Feature Attribution on Natural Language Model
Understanding [12.233103741197334]
Locally Aggregated Feature Attribution (LAFA) は、NLPモデルのための新しい勾配に基づく特徴属性法である。
あいまいな参照トークンに頼る代わりに、言語モデル埋め込みから派生した類似参照テキストを集約することで勾配を円滑にする。
評価のために、公開データセット上でのエンティティ認識やセンチメント分析を含む異なるNLPタスクの実験も設計する。
論文 参考訳(メタデータ) (2022-04-22T18:59:27Z) - Learning Where to Learn in Cross-View Self-Supervised Learning [54.14989750044489]
自己教師付き学習(SSL)は大きな進歩を遂げ、教師付き学習との大きなギャップを狭めた。
現在の方法では、埋め込みにピクセルの統一的なアグリゲーションを採用する。
本稿では,特徴の空間情報を適応的に集約する学習方法であるLearning Where to Learn(LEWEL)を提案する。
論文 参考訳(メタデータ) (2022-03-28T17:02:42Z) - Measuring Self-Supervised Representation Quality for Downstream
Classification using Discriminative Features [56.89813105411331]
我々は,SimCLR,SwaV,MoCo,BYOL,DINO,SimSiam,VICReg,Barlow Twinsといった最先端の自己教師型モデルの表現空間について検討した。
本稿では,標本が誤分類される可能性を確実に予測できる教師なしスコアである自己監督表現品質スコア(Qスコア)を提案する。
Q-Score正規化による微調整により、SSLモデルの線形探索精度はImageNet-100で5.8%、ImageNet-1Kで3.7%向上する。
論文 参考訳(メタデータ) (2022-03-03T17:48:23Z) - Neural Representation Learning for Scribal Hands of Linear B [23.603494290484086]
本稿では,リニアB書記システムのスクレイバルハンド解析におけるニューラル特徴抽出の利用について検討する。
人間のアノテーションを必要としない、完全に教師なしのニューラルネットワークを用いた学習機能を提案する。
論文 参考訳(メタデータ) (2021-07-14T20:33:59Z) - Gradient-based Analysis of NLP Models is Manipulable [44.215057692679494]
モデルの勾配は容易に操作可能であることを実証し、勾配に基づく解析の信頼性に疑問を呈する。
特に、ターゲットモデルの層をファサードとマージし、予測に影響を与えることなく勾配を圧倒する。
論文 参考訳(メタデータ) (2020-10-12T02:54:22Z) - Orientation Attentive Robotic Grasp Synthesis with Augmented Grasp Map
Representation [62.79160608266713]
物体の形態学的特徴は、ロボットの把握の視覚的学習を阻害する、幅広い可視的把握方向を提供する可能性がある。
既存のグリップ生成アプローチを呪い、グリップポイント毎に大きく異なる向きのアノテーションを集約することにより、不連続グリップマップを構築する。
そこで本研究では,角度空間を複数のビンに分割することで,方向を局所的に歪曲する,画素ワイズ合成に適した拡張型グリップマップ表現を提案する。
論文 参考訳(メタデータ) (2020-06-09T08:54:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。