論文の概要: Robust Pollen Imagery Classification with Generative Modeling and Mixup
Training
- arxiv url: http://arxiv.org/abs/2102.13143v1
- Date: Thu, 25 Feb 2021 19:39:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-01 22:04:00.890980
- Title: Robust Pollen Imagery Classification with Generative Modeling and Mixup
Training
- Title(参考訳): ジェネラティブモデリングと混合トレーニングによるロバスト花粉画像分類
- Authors: Jaideep Murkute
- Abstract要約: 本論文では,花粉の航空画像分類を一般化できる,堅牢な深層学習フレームワークを提案する。
我々は,畳み込みニューラルネットワークを用いた花粉の粒度分類手法を開発し,ディープラーニングのベストプラクティスを組み合わせることで,より一般化する。
提案されたアプローチは、ICPR-2020 Pollen Grain Classification Challengeの最終ランキングで4位となった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep learning approaches have shown great success in image classification
tasks and can aid greatly towards the fast and reliable classification of
pollen grain aerial imagery. However, often-times deep learning methods in the
setting of natural images can suffer generalization problems and yield poor
performance on unseen test distribution. In this work, we present and a robust
deep learning framework that can generalize well for pollen grain
aerobiological imagery classification. We develop a convolutional neural
network-based pollen grain classification approach and combine some of the best
practices in deep learning for better generalization. In addition to
commonplace approaches like data-augmentation and weight regularization, we
utilize implicit regularization methods like manifold mixup to allow learning
of smoother decision boundaries. We also make use of proven state-of-the-art
architectural choices like EfficientNet convolutional neural networks. Inspired
by the success of generative modeling with variational autoencoders, we train
models with a richer learning objective which can allow the model to focus on
the relevant parts of the image. Finally, we create an ensemble of neural
networks, for the robustness of the test set predictions. Based on our
experiments, we show improved generalization performance as measured with a
weighted F1-score with the aforementioned approaches. The proposed approach
earned a fourth-place in the final rankings in the ICPR-2020 Pollen Grain
Classification Challenge; with a 0.972578 weighted F1 score,0.950828 macro
average F1 scores, and 0.972877 recognition accuracy.
- Abstract(参考訳): 深層学習アプローチは画像分類タスクにおいて大きな成功を収めており、花粉の航空画像の高速かつ信頼性の高い分類に大きく貢献することができる。
しかし、自然画像の設定におけるディープラーニング手法はしばしば一般化問題に悩まされ、目に見えないテスト分布では性能が低下する。
本研究では,花粉のエアロビオロジカルな画像分類によく応用できる,堅牢なディープラーニングフレームワークを提案する。
我々は,畳み込みニューラルネットワークを用いた花粉の粒度分類手法を開発し,ディープラーニングのベストプラクティスを組み合わせることで,より一般化する。
データ拡張やウェイト正規化といった一般的なアプローチに加えて、マニホールドミックスアップのような暗黙的な正規化手法を使用して、よりスムーズな意思決定境界の学習を可能にします。
また、EfficientNet畳み込みニューラルネットワークのような実績のある最先端のアーキテクチャの選択も活用しています。
可変オートエンコーダによる生成モデリングの成功に触発され、モデルが画像の関連部分に集中できるように、より豊かな学習目標を持つモデルをトレーニングします。
最後に、テストセット予測の堅牢性のために、ニューラルネットワークのアンサンブルを作成します。
実験の結果,上記の手法と重み付けしたf1-scoreで測定した一般化性能が向上した。
提案手法は、ICPR-2020 Pollen Grain Classification Challengeの最終ランキングで4位を獲得し、0.972578ウェイトF1スコア、0.950828マクロ平均F1スコア、0.972877認識精度を獲得しました。
関連論文リスト
- FaFCNN: A General Disease Classification Framework Based on Feature
Fusion Neural Networks [4.097623533226476]
本稿では,機能認識型統合相関ニューラルネットワーク (FaFCNN) を提案する。
実験結果から,事前学習による強化特徴を用いた訓練により,無作為森林法よりも高い性能向上が得られた。
論文 参考訳(メタデータ) (2023-07-24T04:23:08Z) - Forward-Forward Contrastive Learning [4.465144120325802]
医用画像分類のための新しい事前学習手法として,前向きコントラスト学習(FFCL)を提案する。
FFCLは、肺炎分類タスクにおける既存の事前訓練モデルよりも、ImageNet Pretrained ResNet-18よりも3.69%の精度で性能が向上している。
論文 参考訳(メタデータ) (2023-05-04T15:29:06Z) - Performance of GAN-based augmentation for deep learning COVID-19 image
classification [57.1795052451257]
ディープラーニングを医療分野に適用する上で最大の課題は、トレーニングデータの提供である。
データ拡張は、限られたデータセットに直面した時に機械学習で使用される典型的な方法論である。
本研究は, 新型コロナウイルスの胸部X線画像セットを限定して, StyleGAN2-ADAモデルを用いて訓練するものである。
論文 参考訳(メタデータ) (2023-04-18T15:39:58Z) - Leveraging Angular Information Between Feature and Classifier for
Long-tailed Learning: A Prediction Reformulation Approach [90.77858044524544]
分類器の重みを再バランスすることなく、包含角度で認識確率を再構成する。
予測形式再構成の性能向上に着想を得て, この角度予測の異なる特性について検討する。
CIFAR10/100-LT と ImageNet-LT を事前学習することなく、ピアメソッド間で最高の性能を得ることができる。
論文 参考訳(メタデータ) (2022-12-03T07:52:48Z) - Traditional Classification Neural Networks are Good Generators: They are
Competitive with DDPMs and GANs [104.72108627191041]
従来のニューラルネットワーク分類器は、最先端の生成モデルに匹敵する高品質な画像を生成することができることを示す。
マスクをベースとした再構成モジュールを提案し, 意味的勾配を意識し, 可視画像の合成を行う。
また,本手法は,画像テキスト基盤モデルに関して,テキスト・画像生成にも適用可能であることを示す。
論文 参考訳(メタデータ) (2022-11-27T11:25:35Z) - Decoupled Mixup for Generalized Visual Recognition [71.13734761715472]
視覚認識のためのCNNモデルを学習するための新しい「デカップリング・ミクスアップ」手法を提案する。
本手法は,各画像を識別領域と雑音発生領域に分離し,これらの領域を均一に組み合わせてCNNモデルを訓練する。
実験結果から,未知のコンテキストからなるデータに対する本手法の高一般化性能を示す。
論文 参考訳(メタデータ) (2022-10-26T15:21:39Z) - Adaptive Convolutional Dictionary Network for CT Metal Artifact
Reduction [62.691996239590125]
本稿では,金属人工物削減のための適応畳み込み辞書ネットワーク(ACDNet)を提案する。
我々のACDNetは、トレーニングデータを介して、アーティファクトフリーCT画像の事前を自動で学習し、入力されたCT画像ごとに表現カーネルを適応的に調整することができる。
本手法は,モデルに基づく手法の明確な解釈可能性を継承し,学習に基づく手法の強力な表現能力を維持する。
論文 参考訳(メタデータ) (2022-05-16T06:49:36Z) - Application of Transfer Learning and Ensemble Learning in Image-level
Classification for Breast Histopathology [9.037868656840736]
CAD(Computer-Aided Diagnosis)では、従来の分類モデルでは、主に1つのネットワークを使って特徴を抽出する。
本稿では良性病変と悪性病変のバイナリ分類のための画像レベルラベルに基づく深層アンサンブルモデルを提案する。
結果: アンサンブルネットワークモデルにおいて、画像レベルのバイナリ分類は9,8.90%の精度を達成する。
論文 参考訳(メタデータ) (2022-04-18T13:31:53Z) - Efficient and Robust Classification for Sparse Attacks [34.48667992227529]
我々は、画像認識、自然言語処理、マルウェア検出の領域において効果的な攻撃として示されてきた$ell$-normで束縛された摂動を考える。
我々は,「トランケーション」と「アドリアル・トレーニング」を組み合わせた新しい防衛手法を提案する。
得られた洞察に触発され、これらのコンポーネントをニューラルネットワーク分類器に拡張する。
論文 参考訳(メタデータ) (2022-01-23T21:18:17Z) - Pollen Grain Microscopic Image Classification Using an Ensemble of
Fine-Tuned Deep Convolutional Neural Networks [2.824133171517646]
花粉の微粒化を4つのカテゴリに分類するためのアンサンブル手法を提案する。
我々は、4つの最先端の微調整畳み込みニューラルネットワークの融合に基づく分類戦略を開発する。
我々は、ICPR 2020 Pollen Grain Classification Challengeトレーニングデータセットで94.48%の精度と重み付きF1スコア94.54%を得る。
論文 参考訳(メタデータ) (2020-11-15T01:25:46Z) - Learning to Learn Parameterized Classification Networks for Scalable
Input Images [76.44375136492827]
畳み込みニューラルネットワーク(CNN)は、入力解像度の変化に関して予測可能な認識動作を持たない。
我々はメタラーナーを用いて、様々な入力スケールのメインネットワークの畳み込み重みを生成する。
さらに、異なる入力解像度に基づいて、モデル予測よりもフライでの知識蒸留を利用する。
論文 参考訳(メタデータ) (2020-07-13T04:27:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。