論文の概要: PotatoGANs: Utilizing Generative Adversarial Networks, Instance Segmentation, and Explainable AI for Enhanced Potato Disease Identification and Classification
- arxiv url: http://arxiv.org/abs/2405.07332v1
- Date: Sun, 12 May 2024 17:00:52 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-14 15:24:35.445605
- Title: PotatoGANs: Utilizing Generative Adversarial Networks, Instance Segmentation, and Explainable AI for Enhanced Potato Disease Identification and Classification
- Title(参考訳): PotatoGANs:Potato病の特定と分類のためのジェネレーティブ・ディバイサル・ネットワーク、インスタンス・セグメンテーション、説明可能なAIの利用
- Authors: Mohammad Shafiul Alam, Fatema Tuj Johora Faria, Mukaffi Bin Moin, Ahmed Al Wase, Md. Rabius Sani, Khan Md Hasib,
- Abstract要約: 我々の研究は、PotatoGANsと呼ばれる新しいアプローチを採用している。
2種類のGANを用いて合成ポテト病画像を生成する。
インセプションスコアを指標として,PotatoGANが生成した画像の品質と現実性を示す実験を行った。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Numerous applications have resulted from the automation of agricultural disease segmentation using deep learning techniques. However, when applied to new conditions, these applications frequently face the difficulty of overfitting, resulting in lower segmentation performance. In the context of potato farming, where diseases have a large influence on yields, it is critical for the agricultural economy to quickly and properly identify these diseases. Traditional data augmentation approaches, such as rotation, flip, and translation, have limitations and frequently fail to provide strong generalization results. To address these issues, our research employs a novel approach termed as PotatoGANs. In this novel data augmentation approach, two types of Generative Adversarial Networks (GANs) are utilized to generate synthetic potato disease images from healthy potato images. This approach not only expands the dataset but also adds variety, which helps to enhance model generalization. Using the Inception score as a measure, our experiments show the better quality and realisticness of the images created by PotatoGANs, emphasizing their capacity to resemble real disease images closely. The CycleGAN model outperforms the Pix2Pix GAN model in terms of image quality, as evidenced by its higher IS scores CycleGAN achieves higher Inception scores (IS) of 1.2001 and 1.0900 for black scurf and common scab, respectively. This synthetic data can significantly improve the training of large neural networks. It also reduces data collection costs while enhancing data diversity and generalization capabilities. Our work improves interpretability by combining three gradient-based Explainable AI algorithms (GradCAM, GradCAM++, and ScoreCAM) with three distinct CNN architectures (DenseNet169, Resnet152 V2, InceptionResNet V2) for potato disease classification.
- Abstract(参考訳): 深層学習技術を用いた農業病のセグメンテーションの自動化により、多くの応用がもたらされた。
しかし、新しい条件を適用すると、これらのアプリケーションはオーバーフィッティングの困難に直面し、セグメンテーション性能が低下する。
ジャガイモ農業では、病気が収量に大きな影響を与えているため、農業経済がこれらの病気を迅速かつ適切に識別することが重要である。
回転、フリップ、翻訳といった従来のデータ拡張アプローチには制限があり、しばしば強力な一般化結果の提供に失敗する。
これらの課題に対処するため,本研究では,PotatoGANと呼ばれる新しいアプローチを採用している。
この新たなデータ拡張アプローチでは,2種類のGANを用いて,健康なジャガイモ画像から合成ジャガイモ病画像を生成する。
このアプローチはデータセットを拡大するだけでなく、モデル一般化の強化に役立つバラエティも追加する。
インセプションスコアを指標として,本実験では,PotatoGANsが生成した画像の品質と現実性が向上し,実際の疾患画像と密に類似する能力を強調した。
CycleGANモデルは、画像品質の点でPix2Pix GANモデルよりも優れており、より高いISスコアにより、CycleGANはブラックスカーフとコモンスハーブでそれぞれ1.2001と1.0900のインセプションスコア(IS)を達成している。
この合成データは、大規模なニューラルネットワークのトレーニングを大幅に改善することができる。
また、データの多様性と一般化能力を高めながら、データ収集コストを低減する。
我々の研究は、3つのグラデーションベースのExplainable AIアルゴリズム(GradCAM, GradCAM++, ScoreCAM)と3つの異なるCNNアーキテクチャ(DenseNet169, Resnet152 V2, InceptionResNet V2)を組み合わせてジャガイモ病の分類を行うことにより、解釈可能性を向上させる。
関連論文リスト
- Local Lesion Generation is Effective for Capsule Endoscopy Image Data Augmentation in a Limited Data Setting [0.0]
そこで我々は, 局所病変生成手法を2つ提案し, 小型医用画像データセットの増大に対処する。
最初のアプローチでは、古典的な画像処理技術であるPoisson Image Editingアルゴリズムを使用して、リアルな画像合成を生成する。
第2のアプローチでは、微調整されたイメージインペインティングGANを利用して、現実的な病変を合成する新しい生成手法を導入している。
論文 参考訳(メタデータ) (2024-11-05T13:44:25Z) - Small data deep learning methodology for in-field disease detection [6.2747249113031325]
本稿では,ポテト作物の遅発症状を軽度に検出できる最初の機械学習モデルを提案する。
提案手法は, 焦点損失関数を持つ深部畳み込みニューラルネットワークをベースとした, パッチ方式による高分解能画像の高精細化を実現する。
本モデルでは, 早期症状の同定に高い精度と有効性を示した。
論文 参考訳(メタデータ) (2024-09-25T17:31:17Z) - Could We Generate Cytology Images from Histopathology Images? An Empirical Study [1.791005104399795]
本研究では,CycleGANやNeural Style Transferといった従来の画像間転送モデルについて検討した。
本研究では,CycleGANやNeural Style Transferといった従来の画像間転送モデルについて検討した。
論文 参考訳(メタデータ) (2024-03-16T10:43:12Z) - Additional Look into GAN-based Augmentation for Deep Learning COVID-19
Image Classification [57.1795052451257]
我々は,GANに基づく拡張性能のデータセットサイズ依存性について,小サンプルに着目して検討した。
両方のセットでStyleGAN2-ADAをトレーニングし、生成した画像の品質を検証した後、マルチクラス分類問題における拡張アプローチの1つとしてトレーニングされたGANを使用する。
GANベースの拡張アプローチは、中規模および大規模データセットでは古典的な拡張に匹敵するが、より小さなデータセットでは不十分である。
論文 参考訳(メタデータ) (2024-01-26T08:28:13Z) - Evaluating Data Augmentation Techniques for Coffee Leaf Disease
Classification [2.0892083471064407]
本稿では,RoCoLeデータセットを用いて,深層学習による画像からのコーヒー葉病の分類を行う。
本研究は, トランスフォーマーモデル, オンライン強化, およびCycleGAN増強が葉病分類の改善に有効であることを示す。
論文 参考訳(メタデータ) (2024-01-11T09:22:36Z) - Performance of GAN-based augmentation for deep learning COVID-19 image
classification [57.1795052451257]
ディープラーニングを医療分野に適用する上で最大の課題は、トレーニングデータの提供である。
データ拡張は、限られたデータセットに直面した時に機械学習で使用される典型的な方法論である。
本研究は, 新型コロナウイルスの胸部X線画像セットを限定して, StyleGAN2-ADAモデルを用いて訓練するものである。
論文 参考訳(メタデータ) (2023-04-18T15:39:58Z) - Stacking Ensemble Learning in Deep Domain Adaptation for Ophthalmic
Image Classification [61.656149405657246]
ドメイン適応は、十分なラベルデータを取得することが困難な画像分類タスクに有効である。
本稿では,3つのドメイン適応手法を拡張することで,アンサンブル学習を積み重ねるための新しい手法SELDAを提案する。
Age-Related Eye Disease Study (AREDS)ベンチマーク眼科データセットを用いた実験結果から,提案モデルの有効性が示された。
論文 参考訳(メタデータ) (2022-09-27T14:19:00Z) - Harmonizing Pathological and Normal Pixels for Pseudo-healthy Synthesis [68.5287824124996]
そこで本研究では,新しいタイプの識別器であるセグメンタを提案し,病変の正確な特定と擬似健康画像の視覚的品質の向上を図っている。
医用画像強調に生成画像を適用し,低コントラスト問題に対処するために拡張結果を利用する。
BraTSのT2モダリティに関する総合的な実験により、提案手法は最先端の手法よりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2022-03-29T08:41:17Z) - AlignTransformer: Hierarchical Alignment of Visual Regions and Disease
Tags for Medical Report Generation [50.21065317817769]
本稿では,Align Hierarchical Attention (AHA)とMulti-Grained Transformer (MGT)モジュールを含むAlign Transformerフレームワークを提案する。
パブリックなIU-XrayとMIMIC-CXRデータセットの実験は、AlignTransformerが2つのデータセットの最先端メソッドと競合する結果が得られることを示している。
論文 参考訳(メタデータ) (2022-03-18T13:43:53Z) - ElixirNet: Relation-aware Network Architecture Adaptation for Medical
Lesion Detection [90.13718478362337]
本稿では,1)TruncatedRPNが正負値と負値のバランスをとること,2)Auto-lesion Blockが自動的に医療画像にカスタマイズされ,地域提案間の関係認識操作が組み込まれること,3)Relation Transferモジュールが意味的関係を組み込むこと,の3つのコンポーネントを含む新しいElixirNetを紹介した。
DeepLesionとKits19の実験では、ElixirNetの有効性が証明され、パラメータが少なくてFPNよりも感度と精度が向上した。
論文 参考訳(メタデータ) (2020-03-03T05:29:49Z) - LeafGAN: An Effective Data Augmentation Method for Practical Plant
Disease Diagnosis [2.449909275410288]
LeafGANは、健康な画像からの変換によって、さまざまな病気の画像を生成する。
注意機構により、我々のモデルは様々な背景を持つ画像から関連領域のみを変換できる。
論文 参考訳(メタデータ) (2020-02-24T07:36:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。