論文の概要: Rotation-free Online Handwritten Character Recognition Using Linear Recurrent Units
- arxiv url: http://arxiv.org/abs/2602.01533v1
- Date: Mon, 02 Feb 2026 01:57:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-03 19:28:33.841272
- Title: Rotation-free Online Handwritten Character Recognition Using Linear Recurrent Units
- Title(参考訳): リニアリカレントユニットを用いた回転自由オンライン手書き文字認識
- Authors: Zhe Ling, Sicheng Yu, Danyu Yang,
- Abstract要約: オンライン手書き文字認識は、一般的にオフライン認識よりも精度と堅牢性が高い。
現実的な応用として、回転変形はストロークの空間的レイアウトを妨害し、認識精度を大幅に低下させる。
Sliding Window Path Signature (SW-PS) を用いて文字の局所的構造的特徴を捉えるとともに,LRU(Linear Recurrent Units) を分類器として導入する。
- 参考スコア(独自算出の注目度): 4.774782532120883
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Online handwritten character recognition leverages stroke order and dynamic features, which generally provide higher accuracy and robustness compared with offline recognition. However, in practical applications, rotational deformations can disrupt the spatial layout of strokes, substantially reducing recognition accuracy. Extracting rotation-invariant features therefore remains a challenging open problem. In this work, we employ the Sliding Window Path Signature (SW-PS) to capture local structural features of characters, and introduce the lightweight Linear Recurrent Units (LRU) as the classifier. The LRU combine the fast incremental processing capability of recurrent neural networks (RNN) with the efficient parallel training of state space models (SSM), while reliably modelling dynamic stroke characteristics. We conducted recognition experiments with random rotation angle up to $\pm 180^{\circ}$ on three subsets of the CASIA-OLHWDB1.1 dataset: digits, English upper letters, and Chinese radicals. The accuracies achieved after ensemble learning were $99.62\%$, $96.67\%$, and $94.33\%$, respectively. Experimental results demonstrate that the proposed SW-PS+LRU framework consistently surpasses competing models in both convergence speed and test accuracy.
- Abstract(参考訳): オンライン手書き文字認識はストローク順序と動的特徴を活用し、一般的にオフライン認識よりも精度と堅牢性を提供する。
しかし、実際の応用では、回転変形によってストロークの空間的レイアウトが破壊され、認識精度が大幅に低下する。
したがって、回転不変な特徴を抽出することは難しい問題である。
本研究では,Sliding Window Path Signature (SW-PS) を用いて文字の局所的構造的特徴を抽出し,LRU(Linear Recurrent Units) を分類器として導入する。
LRUは、リカレントニューラルネットワーク(RNN)の高速インクリメンタル処理能力と、動的ストローク特性を確実にモデル化しながら、ステートスペースモデル(SSM)の効率的な並列トレーニングを組み合わせる。
CASIA-OLHWDB1.1データセットの3つのサブセット(桁、英語上文字、中国語ラジカル)に対して、ランダム回転角最大$\pm 180^{\circ}$の認識実験を行った。
アンサンブル学習後の評価は99.62 %$、96.67 %$、94.33 %$である。
実験結果から,SW-PS+LRUフレームワークはコンバージェンス速度とテスト精度の両面で競合モデルを上回っていることがわかった。
関連論文リスト
- Registration is a Powerful Rotation-Invariance Learner for 3D Anomaly Detection [64.0168648353038]
ポイントクラウドデータにおける3次元異常検出は、高い信頼性で構造欠陥を特定することを目的として、産業品質管理に不可欠である。
現在のメモリバンクベースの手法は、しばしば一貫性のない特徴変換と限定的な識別能力に悩まされる。
本稿では、ポイントクラウド登録とメモリベース異常検出の目的を統合した、登録による回転不変の特徴抽出フレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-19T14:56:38Z) - Knowledge Regularized Negative Feature Tuning of Vision-Language Models for Out-of-Distribution Detection [54.433899174017185]
信頼性の高い機械学習モデルを構築するには、アウト・オブ・ディストリビューション(OOD)検出が不可欠である。
我々はKR-NFT(Knowledge Regularized Negative Feature Tuning)と呼ばれる新しい手法を提案する。
NFTは、事前訓練されたテキスト特徴に分布認識変換を適用し、正および負の特徴を異なる空間に効果的に分離する。
ImageNetデータセットから数発のサンプルをトレーニングすると、KR-NFTはID分類精度とOOD検出を改善するだけでなく、FPR95を5.44%削減する。
論文 参考訳(メタデータ) (2025-07-26T07:44:04Z) - PARE-Net: Position-Aware Rotation-Equivariant Networks for Robust Point Cloud Registration [8.668461141536383]
回転不変の特徴を学習することは、ポイントクラウド登録の基本的な要件である。
既存の手法では、回転に敏感なネットワークを用いて特徴を抽出し、回転拡大を用いて近似不変写像を無作為に学習する。
高速で軽量でロバストな登録のための位置認識型回転同変ネットワークを提案する。
論文 参考訳(メタデータ) (2024-07-14T10:26:38Z) - SPE-Net: Boosting Point Cloud Analysis via Rotation Robustness
Enhancement [118.20816888815658]
SPE-Netという名前の3Dポイントクラウドアプリケーションに適した新しいディープアーキテクチャを提案する。
埋め込みSelective Position variant' の手順は、入力の根底にある回転条件に効果的に対応できる注意機構に依存している。
SPE-Netと関連する仮説の利点を4つのベンチマークで示し、SOTA法よりも回転試験データと回転試験データの両方に明らかな改善点を示した。
論文 参考訳(メタデータ) (2022-11-15T15:59:09Z) - Adjoint Rigid Transform Network: Task-conditioned Alignment of 3D Shapes [86.2129580231191]
Adjoint Rigid Transform (ART) Networkは、さまざまな3Dネットワークと統合可能なニューラルネットワークモジュールである。
ARTは入力の形状を学習した標準方向に回転させることを学び、多くのタスクに欠かせない。
さらなる研究のために、コードと事前訓練されたモデルをリリースします。
論文 参考訳(メタデータ) (2021-02-01T20:58:45Z) - DAIS: Automatic Channel Pruning via Differentiable Annealing Indicator
Search [55.164053971213576]
畳み込みニューラルネットワークは,計算オーバーヘッドが大きいにもかかわらず,コンピュータビジョンタスクの実行において大きな成功を収めている。
構造的(チャネル)プルーニングは、通常、ネットワーク構造を保ちながらモデルの冗長性を低減するために適用される。
既存の構造化プルーニング法では、手作りのルールが必要であり、これは大きなプルーニング空間に繋がる可能性がある。
論文 参考訳(メタデータ) (2020-11-04T07:43:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。