論文の概要: Fruit Quality and Defect Image Classification with Conditional GAN Data
Augmentation
- arxiv url: http://arxiv.org/abs/2104.05647v1
- Date: Mon, 12 Apr 2021 17:13:05 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-13 14:24:29.566464
- Title: Fruit Quality and Defect Image Classification with Conditional GAN Data
Augmentation
- Title(参考訳): 条件付きGANデータ拡張による果実品質と欠陥画像分類
- Authors: Jordan J. Bird, Chloe M. Barnes, Luis J. Manso, Anik\'o Ek\'art, Diego
R. Faria
- Abstract要約: 微調整、トランスファーラーニング、ジェネレーションモデルに基づくトレーニングデータ拡張というアイデアを組み合わせた機械学習パイプラインを提案します。
畳み込み層に完全に接続された4096個のニューロンを付加すると、83.77%の画像分類精度が得られる。
そして,2000エポックの訓練データに基づいて条件付き生成型adversarial networkを訓練し,比較的現実的な画像を生成することを学ぶ。
- 参考スコア(独自算出の注目度): 2.6424021470496672
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Contemporary Artificial Intelligence technologies allow for the employment of
Computer Vision to discern good crops from bad, providing a step in the
pipeline of selecting healthy fruit from undesirable fruit, such as those which
are mouldy or gangrenous. State-of-the-art works in the field report high
accuracy results on small datasets (<1000 images), which are not representative
of the population regarding real-world usage. The goals of this study are to
further enable real-world usage by improving generalisation with data
augmentation as well as to reduce overfitting and energy usage through model
pruning. In this work, we suggest a machine learning pipeline that combines the
ideas of fine-tuning, transfer learning, and generative model-based training
data augmentation towards improving fruit quality image classification. A
linear network topology search is performed to tune a VGG16 lemon quality
classification model using a publicly-available dataset of 2690 images. We find
that appending a 4096 neuron fully connected layer to the convolutional layers
leads to an image classification accuracy of 83.77%. We then train a
Conditional Generative Adversarial Network on the training data for 2000
epochs, and it learns to generate relatively realistic images. Grad-CAM
analysis of the model trained on real photographs shows that the synthetic
images can exhibit classifiable characteristics such as shape, mould, and
gangrene. A higher image classification accuracy of 88.75% is then attained by
augmenting the training with synthetic images, arguing that Conditional
Generative Adversarial Networks have the ability to produce new data to
alleviate issues of data scarcity. Finally, model pruning is performed via
polynomial decay, where we find that the Conditional GAN-augmented
classification network can retain 81.16% classification accuracy when
compressed to 50% of its original size.
- Abstract(参考訳): 現代の人工知能技術は、コンピュータビジョンの雇用によって良い作物と悪い作物を区別することを可能にし、不好ましくない果物から健康な果物を選ぶパイプラインのステップを提供する。
現場における最新研究は、実世界の利用に関する人口の代表的ではない小さなデータセット(<1000画像)の精度の高い結果を報告している。
本研究の目的は,データ拡張による一般化の向上と,モデルプルーニングによるオーバーフィッティングとエネルギー使用量の削減により,現実世界の活用をさらに促進することである。
本研究では,果実品質の画像分類の改善に向けて,微調整,転写学習,生成モデルに基づくトレーニングデータ拡張のアイデアを組み合わせた機械学習パイプラインを提案する。
2690画像の公開データセットを用いてvgg16レモン品質分類モデルを調整するために線形ネットワークトポロジ探索を行う。
4096ニューロンの完全な結合層を畳み込み層に付加すると、画像の分類精度は83.77%になる。
そして,2000エポックの訓練データに基づいて条件付き生成型adversarial networkを訓練し,比較的現実的な画像を生成することを学ぶ。
実際の写真で訓練されたモデルのグラッド-CAM分析は、合成画像が形状、モールド、グルーレンなどの分類可能な特徴を示すことを示した。
88.75%の高い画像分類精度は、合成画像によるトレーニングを増強することで達成され、条件付き生成逆数ネットワークは、データ不足の問題を緩和する新しいデータを生成することができる、と論じられる。
最後に, モデルプルーニングは多項式崩壊によって行われ, 条件付きGAN拡張分類ネットワークは, 原サイズの50%まで圧縮した場合, 81.16%の分類精度を維持できることがわかった。
関連論文リスト
- Comparative Analysis and Ensemble Enhancement of Leading CNN Architectures for Breast Cancer Classification [0.0]
本研究は,病理組織像を用いた乳癌分類への新規かつ正確なアプローチを提案する。
さまざまな画像データセット間で、主要な畳み込みニューラルネットワーク(CNN)モデルを体系的に比較する。
そこで本研究では,スタンドアロンCNNモデルにおいて,例外的分類精度を実現するために必要な設定について検討した。
論文 参考訳(メタデータ) (2024-10-04T11:31:43Z) - Unleashing the Potential of Synthetic Images: A Study on Histopathology Image Classification [0.12499537119440242]
病理組織像分類は様々な疾患の正確な同定と診断に重要である。
合成画像は、既存のデータセットを効果的に増強し、最終的に下流の病理組織像分類タスクの性能を向上させることができることを示す。
論文 参考訳(メタデータ) (2024-09-24T12:02:55Z) - Is Synthetic Image Useful for Transfer Learning? An Investigation into Data Generation, Volume, and Utilization [62.157627519792946]
ブリッジドトランスファー(ブリッジドトランスファー)と呼ばれる新しいフレームワークを導入する。このフレームワークは、当初、トレーニング済みモデルの微調整に合成画像を使用し、転送性を向上させる。
合成画像と実画像のスタイルアライメントを改善するために,データセットスタイルの逆変換方式を提案する。
提案手法は10の異なるデータセットと5つの異なるモデルで評価され、一貫した改善が示されている。
論文 参考訳(メタデータ) (2024-03-28T22:25:05Z) - Performance of GAN-based augmentation for deep learning COVID-19 image
classification [57.1795052451257]
ディープラーニングを医療分野に適用する上で最大の課題は、トレーニングデータの提供である。
データ拡張は、限られたデータセットに直面した時に機械学習で使用される典型的な方法論である。
本研究は, 新型コロナウイルスの胸部X線画像セットを限定して, StyleGAN2-ADAモデルを用いて訓練するものである。
論文 参考訳(メタデータ) (2023-04-18T15:39:58Z) - CIFAKE: Image Classification and Explainable Identification of
AI-Generated Synthetic Images [7.868449549351487]
本稿では,コンピュータビジョンによるAI生成画像の認識能力を高めることを提案する。
写真が本物かAIによって生成されるかに関して、バイナリ分類問題として存在する2つのデータセット。
本研究では,畳み込みニューラルネットワーク(CNN)を用いて画像をリアルとフェイクの2つのカテゴリに分類する。
論文 参考訳(メタデータ) (2023-03-24T16:33:06Z) - Diffusion-based Data Augmentation for Skin Disease Classification:
Impact Across Original Medical Datasets to Fully Synthetic Images [2.5075774184834803]
深層ニューラルネットワークは、過度な適合を避けるために、依然として大量のトレーニングデータに依存している。
医療のような現実世界のアプリケーションのためのラベル付きトレーニングデータには制限があり、アクセスが困難である。
我々は,我々の大脳皮質皮膚疾患データセットのトレーニングサンプルを増強する上で,テキスト・画像拡散確率モデルの成功を生かした。
論文 参考訳(メタデータ) (2023-01-12T04:22:23Z) - Is synthetic data from generative models ready for image recognition? [69.42645602062024]
本研究では,最新のテキスト・画像生成モデルから生成した合成画像が,画像認識タスクにどのように利用できるかを検討した。
本稿では,既存の生成モデルからの合成データの強大さと欠点を示し,認識タスクに合成データを適用するための戦略を提案する。
論文 参考訳(メタデータ) (2022-10-14T06:54:24Z) - Data Augmentation using Feature Generation for Volumetric Medical Images [0.08594140167290097]
医用画像分類は画像認識領域で最も重要な問題の一つである。
この分野での大きな課題の1つは、ラベル付きトレーニングデータの不足である。
特にディープラーニングモデルでは,画像のセグメンテーションや分類問題に関する有望な結果が示されている。
論文 参考訳(メタデータ) (2022-09-28T13:46:24Z) - Facilitated machine learning for image-based fruit quality assessment in
developing countries [68.8204255655161]
自動画像分類は食品科学における教師あり機械学習の一般的な課題である。
事前学習型視覚変換器(ViT)に基づく代替手法を提案する。
標準的なデバイス上で限られたリソースで簡単に実装できる。
論文 参考訳(メタデータ) (2022-07-10T19:52:20Z) - Image Quality Assessment using Contrastive Learning [50.265638572116984]
我々は、補助的な問題を解決するために、対照的な対の目的を用いて深層畳み込みニューラルネットワーク(CNN)を訓練する。
本研究では,最新のNR画像品質モデルと比較して,ContriQUEが競争性能を向上することを示す。
以上の結果から,大きなラベル付き主観的画像品質データセットを必要とせずに,知覚的関連性を持つ強力な品質表現が得られることが示唆された。
論文 参考訳(メタデータ) (2021-10-25T21:01:00Z) - Classification of COVID-19 in CT Scans using Multi-Source Transfer
Learning [91.3755431537592]
我々は,従来のトランスファー学習の改良にマルチソース・トランスファー・ラーニングを応用して,CTスキャンによる新型コロナウイルスの分類を提案する。
マルチソースファインチューニングアプローチでは、ImageNetで微調整されたベースラインモデルよりも優れています。
我々の最高のパフォーマンスモデルは、0.893の精度と0.897のリコールスコアを達成でき、ベースラインのリコールスコアを9.3%上回った。
論文 参考訳(メタデータ) (2020-09-22T11:53:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。