Fugu-MT 論文翻訳(概要): myMNIST: Benchmark of PETNN, KAN, and Classical Deep Learning Models for Burmese Handwritten Digit Recognition

論文の概要: myMNIST: Benchmark of PETNN, KAN, and Classical Deep Learning Models for Burmese Handwritten Digit Recognition

arxiv url: http://arxiv.org/abs/2603.18597v1
Date: Thu, 19 Mar 2026 08:10:41 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-20 17:19:06.023263
Title: myMNIST: Benchmark of PETNN, KAN, and Classical Deep Learning Models for Burmese Handwritten Digit Recognition
Title（参考訳）: myMNIST:ビルマ手書きデジタル認識のためのPETNN, Kan, および古典的ディープラーニングモデルのベンチマーク
Authors: Ye Kyaw Thu, Thazin Myint Oo, Thepchai Supnithi,
Abstract要約: ミャンマーのNLP/AI研究において重要なビルマの手書き桁データセットであるmyMNISTに,最初の体系的ベンチマークを提示する。評価指標としてPrecision, Recall, F1-Score, Accuracyを用い, CNNは依然として強力なベースラインであることを示す。 PETNN(GELU)モデルは(F1 = 0.9955, Accuracy = 0.9966)、LSTM、GRU、Transformer、Kanの変種よりも優れている。
参考スコア（独自算出の注目度）: 0.30586855806896046
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: We present the first systematic benchmark on myMNIST (formerly BHDD), a publicly available Burmese handwritten digit dataset important for Myanmar NLP/AI research. We evaluate eleven architectures spanning classical deep learning models (Multi-Layer Perceptron, Convolutional Neural Network, Long Short-Term Memory, Gated Recurrent Unit, Transformer), recent alternatives (FastKAN, EfficientKAN), an energy-based model (JEM), and physics-inspired PETNN variants (Sigmoid, GELU, SiLU). Using Precision, Recall, F1-Score, and Accuracy as evaluation metrics, our results show that the CNN remains a strong baseline, achieving the best overall scores (F1 = 0.9959, Accuracy = 0.9970). The PETNN (GELU) model closely follows (F1 = 0.9955, Accuracy = 0.9966), outperforming LSTM, GRU, Transformer, and KAN variants. JEM, representing energy-based modeling, performs competitively (F1 = 0.9944, Accuracy = 0.9958). KAN-based models (FastKAN, EfficientKAN) trail the top performers but provide a meaningful alternative baseline (Accuracy ~0.992). These findings (i) establish reproducible baselines for myMNIST across diverse modeling paradigms, (ii) highlight PETNN's strong performance relative to classical and Transformer-based models, and (iii) quantify the gap between energy-inspired PETNNs and a true energy-based model (JEM). We release this benchmark to facilitate future research on Myanmar digit recognition and to encourage broader evaluation of emerging architectures on regional scripts.
Abstract（参考訳）: ミャンマーのNLP/AI研究において重要なビルマ人手書き桁データセットであるmyMNIST(旧BHDD)に,最初の体系的ベンチマークを提示する。我々は、古典的なディープラーニングモデル(Multi-Layer Perceptron、Convolutional Neural Network、Long Short-Term Memory、Gated Recurrent Unit、Transformer)、最近の代替(FastKAN、EfficientKAN)、エネルギーベースモデル(JEM)、物理に着想を得たPETNN変種(Sigmoid、GELU、SiLU)にまたがる11のアーキテクチャを評価した。評価指標としてPrecision, Recall, F1-Score, Accuracyを用い, CNNは高いベースラインを維持し, 総合スコア(F1=0.9959, Accuracy=0.9970)を達成できた。 PETNN(GELU)モデルは(F1 = 0.9955, Accuracy = 0.9966)、LSTM、GRU、Transformer、Kanの変種よりも優れている。 JEMはエネルギーベースモデリングを代表し、競争力を持つ(F1 = 0.9944, Accuracy = 0.9958)。 Kanベースのモデル(FastKAN、EfficientKAN)は、トップパフォーマーを追いかけるが、有意義な代替ベースライン(Accuracy ~0.992)を提供する。これらの発見 i)様々なモデリングパラダイムにまたがって、myMNISTの再現可能なベースラインを確立する。 (II)従来のトランスフォーマーモデルと比較してPETNNの強い性能を強調し、三エネルギーに着想を得たPETNNと真のエネルギーベースモデル(JEM)のギャップを定量化する。このベンチマークは、ミャンマーのデジタル認識の今後の研究を促進するとともに、地域スクリプトにおける新しいアーキテクチャのより広範な評価を促進するためのものである。

関連論文リスト

BabyHGRN: Exploring RNNs for Sample-Efficient Training of Language Models [3.287942619833188]
我々は最近提案された RNN ベースのアーキテクチャである HGRN2 (Qin et al., 2024) を利用して、トランスフォーマーベースのベースラインに対する効果を相対的に評価する。実験の結果,HGRN2言語モデルであるBABYHGRNは10Mと100Mのワードトラックにおいてトランスフォーマーモデルよりも優れていた。
論文参考訳（メタデータ） (2024-12-20T15:21:41Z)
Foundation Models for Structural Health Monitoring [14.36493796970864]
本稿では,トランスフォーマーニューラルネットワークをMasked Auto-Encoderアーキテクチャを用いて,構造的健康モニタリングのための基礎モデルとして初めて利用することを提案する。自己教師付き事前学習を通じて、複数の大規模データセットから一般化可能な表現を学習する能力を実証する。本研究は,3つの運用用インダクトのデータを用いた基礎モデルの有効性を示す。
論文参考訳（メタデータ） (2024-04-03T13:32:44Z)
Matbench Discovery -- A framework to evaluate machine learning crystal stability predictions [1.9402357545481315]
Matbench Discoveryは機械学習(ML)エネルギーモデルの評価フレームワークである。ランダムフォレスト、グラフニューラルネットワーク(GNN)、ワンショット予測器、反復ベイズ、普遍原子間ポテンシャル(UIP)など、さまざまなアプローチをベンチマークする。 UIPはトップパフォーマーとして登場し、最初の10k安定予測ではF1スコアが0.57-0.82、発見加速因子(DAF)が6倍に達する。
論文参考訳（メタデータ） (2023-08-28T22:29:57Z)
Preserving Knowledge Invariance: Rethinking Robustness Evaluation of Open Information Extraction [49.15931834209624]
実世界におけるオープン情報抽出モデルの評価をシミュレートする最初のベンチマークを示す。我々は、それぞれの例が知識不変のcliqueである大規模なテストベッドを設計し、注釈付けする。さらにロバスト性計量を解明することにより、その性能が全体の傾きに対して一貫して正確であるならば、モデルはロバストであると判断される。
論文参考訳（メタデータ） (2023-05-23T12:05:09Z)
Universal Domain Adaptation from Foundation Models: A Baseline Study [58.51162198585434]
基礎モデルを用いた最先端UniDA手法の実証的研究を行った。 CLIPモデルからターゲット知識を抽出するためのパラメータフリーな手法であるtextitCLIP 蒸留を導入する。単純な手法ではあるが、ほとんどのベンチマークタスクでは従来の手法よりも優れている。
論文参考訳（メタデータ） (2023-05-18T16:28:29Z)
Exploring the Value of Pre-trained Language Models for Clinical Named Entity Recognition [6.917786124918387]
我々は、スクラッチからトレーニングされたTransformerモデルと、細調整されたBERTベースのLLMを比較した。文脈学習を促進するために,追加のCRF層がそのようなモデルに与える影響を検討する。
論文参考訳（メタデータ） (2022-10-23T16:27:31Z)
MoEfication: Conditional Computation of Transformer Models for Efficient Inference [66.56994436947441]
トランスフォーマーベースの事前学習言語モデルは、パラメータ容量が大きいため、ほとんどのNLPタスクにおいて優れた性能を実現することができるが、計算コストも大きい。スパースアクティベーション現象に基づく条件計算により,大規模モデル推論を高速化する。そこで本研究では,モデルサイズが等しいMoE(Mix-of-experts)バージョン,すなわちMoEficationに変換することを提案する。
論文参考訳（メタデータ） (2021-10-05T02:14:38Z)
Conformer: Convolution-augmented Transformer for Speech Recognition [60.119604551507805]
最近、トランスフォーマーと畳み込みニューラルネットワーク(CNN)に基づくモデルが、自動音声認識(ASR)の有望な結果を示している。音声認識のための畳み込み拡張変換器,Conformerを提案する。広く使われているLibriSpeechベンチマークでは、言語モデルを用いずにWERが2.1%/4.3%、テスト/テストの外部言語モデルで1.9%/3.9%を達成した。
論文参考訳（メタデータ） (2020-05-16T20:56:25Z)
Benchmarking Graph Neural Networks [75.42159546060509]
グラフニューラルネットワーク(GNN)は、グラフ上のデータから分析および学習するための標準ツールキットとなっている。成功している分野が主流で信頼性を持つようになるためには、進捗を定量化するためにベンチマークを開発する必要がある。 GitHubリポジトリは1,800のスターと339のフォークに到達し、提案されているオープンソースフレームワークの有用性を実証している。
論文参考訳（メタデータ） (2020-03-02T15:58:46Z)
Assessing Graph-based Deep Learning Models for Predicting Flash Point [52.931492216239995]
グラフベースのディープラーニング(GBDL)モデルは初めてフラッシュポイントを予測するために実装された。 MPNNの平均R2と平均絶対誤差(MAE)は、それぞれ2.3%低、2.0K高である。
論文参考訳（メタデータ） (2020-02-26T06:10:12Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。