Fugu-MT 論文翻訳(概要): Pruning Distorted Images in MNIST Handwritten Digits

論文の概要: Pruning Distorted Images in MNIST Handwritten Digits

arxiv url: http://arxiv.org/abs/2307.14343v1
Date: Fri, 26 May 2023 11:44:35 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-23 16:09:38.283749
Title: Pruning Distorted Images in MNIST Handwritten Digits
Title（参考訳）: MNIST手書きディジットにおける歪み画像のプルーニング
Authors: Amarnath R, Vinay Kumar V
Abstract要約: 手書き文字を認識できる2段階の深層学習手法を提案する。最初の段階では、トレーニングセット内で歪んだ桁を識別する単純なニューラルネットワークを作成します。第2段階では、これらの識別された画像をトレーニングデータセットから除外し、フィルタデータセットを使用してモデルを再トレーニングする。実験の結果,提案手法の有効性を実証し,テストデータセットの精度を99.5%以上とした。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Recognizing handwritten digits is a challenging task primarily due to the diversity of writing styles and the presence of noisy images. The widely used MNIST dataset, which is commonly employed as a benchmark for this task, includes distorted digits with irregular shapes, incomplete strokes, and varying skew in both the training and testing datasets. Consequently, these factors contribute to reduced accuracy in digit recognition. To overcome this challenge, we propose a two-stage deep learning approach. In the first stage, we create a simple neural network to identify distorted digits within the training set. This model serves to detect and filter out such distorted and ambiguous images. In the second stage, we exclude these identified images from the training dataset and proceed to retrain the model using the filtered dataset. This process aims to improve the classification accuracy and confidence levels while mitigating issues of underfitting and overfitting. Our experimental results demonstrate the effectiveness of the proposed approach, achieving an accuracy rate of over 99.5% on the testing dataset. This significant improvement showcases the potential of our method in enhancing digit classification accuracy. In our future work, we intend to explore the scalability of this approach and investigate techniques to further enhance accuracy by reducing the size of the training data.
Abstract（参考訳）: 手書き文字の認識は、主に書体の多様性とノイズの多い画像の存在のために難しい課題である。このタスクのベンチマークとして一般的に使用される広く使用されているMNISTデータセットには、不規則な形状、不完全なストローク、トレーニングとテストの両方のデータセットの様々な歪がある。したがって、これらの要因はデジタル認識の精度を低下させる。この課題を克服するために,我々は2段階のディープラーニングアプローチを提案する。第1段階では、トレーニングセット内の歪んだ数字を識別するシンプルなニューラルネットワークを作成します。このモデルは、歪んだ不明瞭な画像を検出し、フィルタリングするのに役立つ。第2段階では、これらの識別された画像をトレーニングデータセットから除外し、フィルタデータセットを使用してモデルを再トレーニングする。このプロセスは、過フィッティングと過剰フィッティングの問題を緩和しながら、分類精度と信頼性レベルを改善することを目的としている。実験の結果,提案手法の有効性が示され,テストデータセットの精度は99.5%以上となった。この大幅な改善は、桁分類精度を高める方法の可能性を示している。今後の課題として,本手法のスケーラビリティについて検討し,トレーニングデータのサイズを小さくすることで精度の向上を図る。

関連論文リスト

Combating Digitally Altered Images: Deepfake Detection [0.0]
本研究では,改良型視覚変換器(ViT)モデルに基づく頑健なディープフェイク検出手法を提案する。このモデルはOpenForensicsデータセットのサブセットで、さまざまなイメージ操作の堅牢性を高めるために、複数の拡張テクニックでトレーニングされている。このモデルは、テストデータセット上で最先端の結果を示し、Deepfakeイメージを慎重に検出する。
論文参考訳（メタデータ） (2025-08-23T09:59:03Z)
Effective Data Pruning through Score Extrapolation [40.61665742457229]
少数のデータのみをトレーニングする必要のある,新たな重要スコア外挿フレームワークを導入する。このフレームワークでは,この最小限のサブセットから学習したパターンを用いて,データセット全体のサンプル重要度を正確に予測する2つの初期アプローチを提案する。以上の結果から,スコアの補間は,プルーニングやデータ属性,その他のタスクなど,高価なスコア計算手法をスケールする上で有望な方向であることが示唆された。
論文参考訳（メタデータ） (2025-06-10T17:38:49Z)
A Fresh Take on Stale Embeddings: Improving Dense Retriever Training with Corrector Networks [81.2624272756733]
密集検索では、ディープエンコーダは入力とターゲットの両方に埋め込みを提供する。我々は、古いキャッシュされたターゲット埋め込みを調整できる小さなパラメトリック補正ネットワークを訓練する。私たちのアプローチは、トレーニング中にターゲット埋め込み更新が行われなくても、最先端の結果と一致します。
論文参考訳（メタデータ） (2024-09-03T13:29:13Z)
Certifying Robustness of Learning-Based Keypoint Detection and Pose Estimation Methods [9.953693315812995]
この研究は、視覚に基づく2段階の6次元オブジェクトポーズ推定の堅牢性の証明に対処する。中心となる考え方は、ローカルロバストネスの認定を、分類タスクのニューラルネットワーク検証に変換することである。
論文参考訳（メタデータ） (2024-07-31T19:02:54Z)
UniForensics: Face Forgery Detection via General Facial Representation [60.5421627990707]
高レベルの意味的特徴は摂動の影響を受けにくく、フォージェリー固有の人工物に限らないため、より強い一般化がある。我々は、トランスフォーマーベースのビデオネットワークを活用する新しいディープフェイク検出フレームワークUniForensicsを導入し、顔の豊かな表現のためのメタファンクショナルな顔分類を行う。
論文参考訳（メタデータ） (2024-07-26T20:51:54Z)
Data Adaptive Traceback for Vision-Language Foundation Models in Image Classification [34.37262622415682]
我々はData Adaptive Tracebackと呼ばれる新しい適応フレームワークを提案する。具体的には、ゼロショット法を用いて、事前学習データの最もダウンストリームなタスク関連サブセットを抽出する。我々は、擬似ラベルに基づく半教師付き手法を採用し、事前学習画像の再利用と、半教師付き学習における確証バイアス問題に対処するための視覚言語コントラスト学習手法を提案する。
論文参考訳（メタデータ） (2024-07-11T18:01:58Z)
Image edge enhancement for effective image classification [7.470763273994321]
ニューラルネットワークの精度とトレーニング速度を両立させるエッジ拡張に基づく手法を提案する。我々のアプローチは、利用可能なデータセット内の画像からエッジなどの高周波特徴を抽出し、元の画像と融合させることである。
論文参考訳（メタデータ） (2024-01-13T10:01:34Z)
Learning Co-segmentation by Segment Swapping for Retrieval and Discovery [67.6609943904996]
この研究の目的は、一対のイメージから視覚的に類似したパターンを効率的に識別することである。画像中のオブジェクトセグメントを選択し、それを別の画像にコピーペーストすることで、合成トレーニングペアを生成する。提案手法は,Brueghelデータセット上でのアートワークの詳細検索に対して,明確な改善をもたらすことを示す。
論文参考訳（メタデータ） (2021-10-29T16:51:16Z)
Semi-supervised Long-tailed Recognition using Alternate Sampling [95.93760490301395]
ロングテール認識の主な課題は、データ分布の不均衡とテールクラスにおけるサンプル不足である。半教師付き長尾認識という新しい認識設定を提案する。 2つのデータセットで、他の競合方法よりも大幅な精度向上を実証します。
論文参考訳（メタデータ） (2021-05-01T00:43:38Z)
Mixed-Privacy Forgetting in Deep Networks [114.3840147070712]
大規模画像分類タスクにおいてトレーニングされたネットワークの重みからトレーニングサンプルのサブセットの影響を除去できることを示す。そこで本研究では,混合プライバシー設定における「忘れ」という新しい概念を導入する。提案手法は,モデル精度のトレードオフを伴わずに忘れることができることを示す。
論文参考訳（メタデータ） (2020-12-24T19:34:56Z)
Application of Facial Recognition using Convolutional Neural Networks for Entry Access Control [0.0]
本論文は,画像中の人物を入力として捉え,その人物を著者の1人か否かを分類する,教師付き分類問題の解決に焦点をあてる。提案手法は,(1)WoodNetと呼ばれるニューラルネットワークをスクラッチから構築し,トレーニングすること,(2)ImageNetデータベース上に事前トレーニングされたネットワークを利用することで,転送学習を活用すること,の2つである。結果は、データセット内の個人を高い精度で分類し、保持されたテストデータに対して99%以上の精度で達成する2つのモデルである。
論文参考訳（メタデータ） (2020-11-23T07:55:24Z)
Deep Traffic Sign Detection and Recognition Without Target Domain Real Images [52.079665469286496]
本稿では,ターゲットドメインからの実際の画像を必要としない新しいデータベース生成手法と,(ii)交通標識のテンプレートを提案する。この方法は、実際のデータでトレーニングを克服することではなく、実際のデータが利用できない場合に互換性のある代替手段になることを目的としている。大規模なデータセットでは、完全に合成されたデータセットによるトレーニングは、実際のデータセットとトレーニングのパフォーマンスにほぼ一致する。
論文参考訳（メタデータ） (2020-07-30T21:06:47Z)
Manifold-based Test Generation for Image Classifiers [7.226144684379191]
画像分類ニューラルネットワークをテストするには、信頼を刺激するのに十分な現実的なテストデータを取得する必要がある。本稿では,これらの課題に対処するための新しい枠組みを提案する。実験により、この手法により、十分に訓練されたモデルであっても、何千もの現実的かつフォールトレベリングなテストケースを効率的に生成できることが示された。
論文参考訳（メタデータ） (2020-02-15T07:53:34Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。