論文の概要: Pruning Distorted Images in MNIST Handwritten Digits
- arxiv url: http://arxiv.org/abs/2307.14343v1
- Date: Fri, 26 May 2023 11:44:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 16:09:38.283749
- Title: Pruning Distorted Images in MNIST Handwritten Digits
- Title(参考訳): MNIST手書きディジットにおける歪み画像のプルーニング
- Authors: Amarnath R, Vinay Kumar V
- Abstract要約: 手書き文字を認識できる2段階の深層学習手法を提案する。
最初の段階では、トレーニングセット内で歪んだ桁を識別する単純なニューラルネットワークを作成します。
第2段階では、これらの識別された画像をトレーニングデータセットから除外し、フィルタデータセットを使用してモデルを再トレーニングする。
実験の結果,提案手法の有効性を実証し,テストデータセットの精度を99.5%以上とした。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recognizing handwritten digits is a challenging task primarily due to the
diversity of writing styles and the presence of noisy images. The widely used
MNIST dataset, which is commonly employed as a benchmark for this task,
includes distorted digits with irregular shapes, incomplete strokes, and
varying skew in both the training and testing datasets. Consequently, these
factors contribute to reduced accuracy in digit recognition. To overcome this
challenge, we propose a two-stage deep learning approach. In the first stage,
we create a simple neural network to identify distorted digits within the
training set. This model serves to detect and filter out such distorted and
ambiguous images. In the second stage, we exclude these identified images from
the training dataset and proceed to retrain the model using the filtered
dataset. This process aims to improve the classification accuracy and
confidence levels while mitigating issues of underfitting and overfitting. Our
experimental results demonstrate the effectiveness of the proposed approach,
achieving an accuracy rate of over 99.5% on the testing dataset. This
significant improvement showcases the potential of our method in enhancing
digit classification accuracy. In our future work, we intend to explore the
scalability of this approach and investigate techniques to further enhance
accuracy by reducing the size of the training data.
- Abstract(参考訳): 手書き文字の認識は、主に書体の多様性とノイズの多い画像の存在のために難しい課題である。
このタスクのベンチマークとして一般的に使用される広く使用されているMNISTデータセットには、不規則な形状、不完全なストローク、トレーニングとテストの両方のデータセットの様々な歪がある。
したがって、これらの要因はデジタル認識の精度を低下させる。
この課題を克服するために,我々は2段階のディープラーニングアプローチを提案する。
第1段階では、トレーニングセット内の歪んだ数字を識別するシンプルなニューラルネットワークを作成します。
このモデルは、歪んだ不明瞭な画像を検出し、フィルタリングするのに役立つ。
第2段階では、これらの識別された画像をトレーニングデータセットから除外し、フィルタデータセットを使用してモデルを再トレーニングする。
このプロセスは、過フィッティングと過剰フィッティングの問題を緩和しながら、分類精度と信頼性レベルを改善することを目的としている。
実験の結果,提案手法の有効性が示され,テストデータセットの精度は99.5%以上となった。
この大幅な改善は、桁分類精度を高める方法の可能性を示している。
今後の課題として,本手法のスケーラビリティについて検討し,トレーニングデータのサイズを小さくすることで精度の向上を図る。
関連論文リスト
- Image edge enhancement for effective image classification [7.470763273994321]
ニューラルネットワークの精度とトレーニング速度を両立させるエッジ拡張に基づく手法を提案する。
我々のアプローチは、利用可能なデータセット内の画像からエッジなどの高周波特徴を抽出し、元の画像と融合させることである。
論文 参考訳(メタデータ) (2024-01-13T10:01:34Z) - Few-shot Image Classification based on Gradual Machine Learning [6.935034849731568]
少ないショット画像分類は、ラベル付きサンプルのみを使用してラベル付きイメージを正確に分類することを目的としている。
段階的機械学習(GML)の非i.dパラダイムに基づく新しいアプローチを提案する。
提案手法は精度でSOTAの性能を1-5%向上させることができることを示す。
論文 参考訳(メタデータ) (2023-07-28T12:30:41Z) - Influence of image noise on crack detection performance of deep
convolutional neural networks [0.0]
深層畳み込みニューラルネットワークを用いた画像データからのひび割れの分類について多くの研究がなされている。
本稿では,画像ノイズがネットワークの精度に与える影響について検討する。
AlexNetは提案したインデックスに基づいて最も効率的なモデルに選ばれた。
論文 参考訳(メタデータ) (2021-11-03T09:08:54Z) - Learning Co-segmentation by Segment Swapping for Retrieval and Discovery [67.6609943904996]
この研究の目的は、一対のイメージから視覚的に類似したパターンを効率的に識別することである。
画像中のオブジェクトセグメントを選択し、それを別の画像にコピーペーストすることで、合成トレーニングペアを生成する。
提案手法は,Brueghelデータセット上でのアートワークの詳細検索に対して,明確な改善をもたらすことを示す。
論文 参考訳(メタデータ) (2021-10-29T16:51:16Z) - Semi-supervised Long-tailed Recognition using Alternate Sampling [95.93760490301395]
ロングテール認識の主な課題は、データ分布の不均衡とテールクラスにおけるサンプル不足である。
半教師付き長尾認識という新しい認識設定を提案する。
2つのデータセットで、他の競合方法よりも大幅な精度向上を実証します。
論文 参考訳(メタデータ) (2021-05-01T00:43:38Z) - Mixed-Privacy Forgetting in Deep Networks [114.3840147070712]
大規模画像分類タスクにおいてトレーニングされたネットワークの重みからトレーニングサンプルのサブセットの影響を除去できることを示す。
そこで本研究では,混合プライバシー設定における「忘れ」という新しい概念を導入する。
提案手法は,モデル精度のトレードオフを伴わずに忘れることができることを示す。
論文 参考訳(メタデータ) (2020-12-24T19:34:56Z) - Application of Facial Recognition using Convolutional Neural Networks
for Entry Access Control [0.0]
本論文は,画像中の人物を入力として捉え,その人物を著者の1人か否かを分類する,教師付き分類問題の解決に焦点をあてる。
提案手法は,(1)WoodNetと呼ばれるニューラルネットワークをスクラッチから構築し,トレーニングすること,(2)ImageNetデータベース上に事前トレーニングされたネットワークを利用することで,転送学習を活用すること,の2つである。
結果は、データセット内の個人を高い精度で分類し、保持されたテストデータに対して99%以上の精度で達成する2つのモデルである。
論文 参考訳(メタデータ) (2020-11-23T07:55:24Z) - Data-driven Meta-set Based Fine-Grained Visual Classification [61.083706396575295]
本稿では, ノイズの多いWeb画像に対して, 微粒化認識のためのデータ駆動型メタセットベースアプローチを提案する。
具体的には、少量のクリーンなメタセットでガイドされ、メタラーニング方式で選択ネットを訓練し、分布内および分布外ノイズ画像の識別を行う。
論文 参考訳(メタデータ) (2020-08-06T03:04:16Z) - Deep Traffic Sign Detection and Recognition Without Target Domain Real
Images [52.079665469286496]
本稿では,ターゲットドメインからの実際の画像を必要としない新しいデータベース生成手法と,(ii)交通標識のテンプレートを提案する。
この方法は、実際のデータでトレーニングを克服することではなく、実際のデータが利用できない場合に互換性のある代替手段になることを目的としている。
大規模なデータセットでは、完全に合成されたデータセットによるトレーニングは、実際のデータセットとトレーニングのパフォーマンスにほぼ一致する。
論文 参考訳(メタデータ) (2020-07-30T21:06:47Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z) - Manifold-based Test Generation for Image Classifiers [7.226144684379191]
画像分類ニューラルネットワークをテストするには、信頼を刺激するのに十分な現実的なテストデータを取得する必要がある。
本稿では,これらの課題に対処するための新しい枠組みを提案する。
実験により、この手法により、十分に訓練されたモデルであっても、何千もの現実的かつフォールトレベリングなテストケースを効率的に生成できることが示された。
論文 参考訳(メタデータ) (2020-02-15T07:53:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。