論文の概要: Embedded ConvNet Ensembles: A Lightweight Approach to Recognize Arabic Handwritten Characters
- arxiv url: http://arxiv.org/abs/2605.18060v1
- Date: Mon, 18 May 2026 08:47:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:49.197455
- Title: Embedded ConvNet Ensembles: A Lightweight Approach to Recognize Arabic Handwritten Characters
- Title(参考訳): ConvNetの埋め込みアンサンブル:アラビア文字認識のための軽量なアプローチ
- Authors: Mohsine El Khayati, Rachid Elouahbi, Abdelillah Semma,
- Abstract要約: 本研究では,軽量な組込みConvNetモデルとアンサンブル学習手法の組み合わせを提案する。
AHCRのベストプラクティスを特定するために実験を行った。
その結果、組込みモデルは、より重いアーキテクチャに匹敵する、あるいは超える精度を達成できることが示された。
- 参考スコア(独自算出の注目度): 0.27528170226206433
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Arabic Handwritten Character Recognition (AHCR) has recently advanced significantly with deep Convolutional Neural Networks (ConvNets). However, many models in the literature are deep and computationally expensive in terms of parameters and FLOPs, limiting their deployment on resource-constrained devices, which are increasingly common. This study addresses this gap by proposing a combination of lightweight embedded ConvNet models and ensemble learning techniques. Extensive experiments were conducted to identify best practices in AHCR, considering training hyperparameters, learning strategies, model choices, and ensemble methods. Results show that embedded models can achieve accuracy comparable to, or even surpassing, heavier architectures. Ensemble learning further enhances performance with only modest computational overhead, particularly under challenging training scenarios. Among the ensembling strategies, soft voting yielded the best overall results.
- Abstract(参考訳): アラビア手書き文字認識(AHCR)は近年,深層畳み込みニューラルネットワーク(ConvNets)で大きく進歩している。
しかし、文献の多くのモデルはパラメータやFLOPの観点で深く計算的に高価であり、資源に制約のあるデバイスへの展開を制限している。
本研究では,軽量な組込みConvNetモデルとアンサンブル学習手法を組み合わせることで,このギャップを解消する。
過度パラメータのトレーニング,学習戦略,モデル選択,アンサンブル手法を考慮し,AHCRのベストプラクティスを特定するための大規模な実験を行った。
その結果、組み込みモデルは、より重いアーキテクチャに匹敵する、あるいは超える精度を達成できることが示された。
アンサンブル学習は、特に困難なトレーニングシナリオにおいて、控えめな計算オーバーヘッドでパフォーマンスをさらに向上させる。
合理化戦略の中では、ソフト投票が総合的に最高の結果となった。
関連論文リスト
- Resource-Efficient Adaptation of Large Language Models for Text Embeddings via Prompt Engineering and Contrastive Fine-tuning [3.9914181590063884]
大規模言語モデル(LLM)は自然言語処理(NLP)の基盤となっている。
プリトレーニングされたデコーダのみのLLMの適応戦略について検討する。
論文 参考訳(メタデータ) (2025-07-30T14:49:30Z) - Revisiting N-Gram Models: Their Impact in Modern Neural Networks for Handwritten Text Recognition [4.059708117119894]
本研究は,言語モデル,特にn-gramモデルが,手書き認識の分野における最先端のディープラーニングアーキテクチャの性能に引き続き寄与するかどうかを論じる。
我々は、明示的なn-gram言語モデルを統合することなく、2つの著名なニューラルネットワークアーキテクチャ、PyLaiaとDANを評価した。
その結果,文字やサブワードの n-gram モデルの導入は,すべてのデータセット上での ATR モデルの性能を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2024-04-30T07:37:48Z) - RAVEN: In-Context Learning with Retrieval-Augmented Encoder-Decoder Language Models [57.12888828853409]
RAVENは検索強化されたマスク付き言語モデリングとプレフィックス言語モデリングを組み合わせたモデルである。
フュージョン・イン・コンテキスト・ラーニング(Fusion-in-Context Learning)により、追加のトレーニングを必要とせずに、より多くのコンテキスト内サンプルを利用できる。
本研究は,テキスト内学習のためのエンコーダ・デコーダ言語モデルの構築の可能性を明らかにするものである。
論文 参考訳(メタデータ) (2023-08-15T17:59:18Z) - Unifying Synergies between Self-supervised Learning and Dynamic
Computation [53.66628188936682]
SSLとDCのパラダイム間の相互作用に関する新しい視点を提示する。
SSL設定において、スクラッチから高密度かつゲートされたサブネットワークを同時に学習することは可能であることを示す。
密集エンコーダとゲートエンコーダの事前学習における共進化は、良好な精度と効率のトレードオフをもたらす。
論文 参考訳(メタデータ) (2023-01-22T17:12:58Z) - Empirical evaluation of shallow and deep learning classifiers for Arabic
sentiment analysis [1.1172382217477126]
本研究は、アラビア語レビューの感情分析のためのディープラーニングモデルの性能を詳細に比較したものである。
この研究で使用されるデータセットは、アラビア語のホテルと本レビューデータセットである。
その結果,2次・複数ラベル分類では深層学習が浅層学習より優れており,文献で報告された同様の研究結果とは対照的であった。
論文 参考訳(メタデータ) (2021-12-01T14:45:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。