論文の概要: Deep Learning for Automatic Quality Grading of Mangoes: Methods and
Insights
- arxiv url: http://arxiv.org/abs/2011.11378v1
- Date: Mon, 23 Nov 2020 13:09:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-22 02:19:25.725490
- Title: Deep Learning for Automatic Quality Grading of Mangoes: Methods and
Insights
- Title(参考訳): マンゴーの自動品質グレーディングのための深層学習:方法と展望
- Authors: Shih-Lun Wu, Hsiao-Yen Tung, Yu-Lun Hsu
- Abstract要約: 本論文は,コンピュータビジョンの深層学習技術である様々な畳み込みニューラルネットワーク(CNN)を用いて,グレーディングタスクにアプローチする。
Mask R-CNN(バックグラウンド削除用)、ImageNetチャレンジの過去の多くの勝者、すなわちAlexNet、VGGs、ResNetsが含まれる。
この論文は、サリエンシマップと主成分分析(PCA)の助けを借りて、モデルの動作に関する説明可能な洞察を提供する。
- 参考スコア(独自算出の注目度): 1.0742675209112622
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The quality grading of mangoes is a crucial task for mango growers as it
vastly affects their profit. However, until today, this process still relies on
laborious efforts of humans, who are prone to fatigue and errors. To remedy
this, the paper approaches the grading task with various convolutional neural
networks (CNN), a tried-and-tested deep learning technology in computer vision.
The models involved include Mask R-CNN (for background removal), the numerous
past winners of the ImageNet challenge, namely AlexNet, VGGs, and ResNets; and,
a family of self-defined convolutional autoencoder-classifiers (ConvAE-Clfs)
inspired by the claimed benefit of multi-task learning in classification tasks.
Transfer learning is also adopted in this work via utilizing the ImageNet
pretrained weights. Besides elaborating on the preprocessing techniques,
training details, and the resulting performance, we go one step further to
provide explainable insights into the model's working with the help of saliency
maps and principal component analysis (PCA). These insights provide a succinct,
meaningful glimpse into the intricate deep learning black box, fostering trust,
and can also be presented to humans in real-world use cases for reviewing the
grading results.
- Abstract(参考訳): マンゴーの品質向上は、マンゴー栽培者が利益に大きな影響を与えるため、重要な課題である。
しかし、このプロセスはいまだに、疲労やエラーに悩まされている人間の残酷な努力に依存している。
これを解決するために,コンピュータビジョンの深層学習技術である様々な畳み込みニューラルネットワーク(CNN)を用いて,グレーディングタスクにアプローチする。
関連するモデルには、imagenet challengeの多くの過去の勝者である、alexnet、vggs、resnetsのマスクr-cnn(背景除去)、そして分類タスクにおけるマルチタスク学習の主張に触発された自己定義畳み込みオートエンコーダ分類器(convae-clfs)が含まれる。
また、この研究では、ImageNet事前学習重みを利用して転送学習が採用されている。
事前処理技術、トレーニングの詳細、そして結果のパフォーマンスについて実験するのに加えて、私たちはさらに一歩進んで、サリエンシマップと主成分分析(PCA)の助けを借りて、モデルの動作に関する説明可能な洞察を提供します。
これらの洞察は、複雑な深層学習のブラックボックスを簡潔かつ有意義に垣間見ることができ、信頼を育み、また、評価結果をレビューするために現実世界のユースケースで人間に提示することもできる。
関連論文リスト
- Towards Scalable and Versatile Weight Space Learning [51.78426981947659]
本稿では,重み空間学習におけるSANEアプローチを紹介する。
ニューラルネットワーク重みのサブセットの逐次処理に向けて,超表現の概念を拡張した。
論文 参考訳(メタデータ) (2024-06-14T13:12:07Z) - CogCoM: Train Large Vision-Language Models Diving into Details through Chain of Manipulations [61.21923643289266]
カオス・オブ・マニピュレーション(Chain of Manipulations)は、視覚言語モデル(Vision-Language Models)が、エビデンスを段階的に解決するメカニズムである。
トレーニング後、モデルは外部ツールを介さずに、本質的な操作(グラウンド、ズームインなど)を積極的に行うことで、様々な視覚的問題を解決することができる。
トレーニングされたモデルである textbfCogCoM は、4つのカテゴリの9つのベンチマークで最先端のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2024-02-06T18:43:48Z) - CAManim: Animating end-to-end network activation maps [0.2509487459755192]
本稿では,CNN予測に対するエンドユーザの理解の拡大と集中を目的とした,CAManimという新しいXAI可視化手法を提案する。
また,Remove and Debias(ROAD)尺度に基づいて,新たな定量的評価法を提案する。
これは、解釈可能で堅牢で透明なモデルアセスメント方法論に対する需要の増加に対応するために、先行研究に基づいている。
論文 参考訳(メタデータ) (2023-12-19T01:07:36Z) - Look-Ahead Selective Plasticity for Continual Learning of Visual Tasks [9.82510084910641]
タスク境界において,タスクが終了し,他のタスク開始時に発生する新しいメカニズムを提案する。
CIFAR10やTinyImagenetなどのコンピュータビジョンデータセットのベンチマークで提案手法を評価する。
論文 参考訳(メタデータ) (2023-11-02T22:00:23Z) - Differentiable Weight Masks for Domain Transfer [2.008400316189417]
コンピュータビジョンにおけるディープラーニングモデルの大きな欠点の1つは、モジュラー方式で複数の情報ソースを保持することができないことである。
本研究では,これら3つの重みマスキング手法について検討し,その課題に対する「鍛造」を緩和する能力について検討した。
異なるマスキング手法は、目標タスクのパフォーマンスに悪影響を及ぼすことなく、ソースタスクの知識を維持するためにトレードオフがあることが判明した。
論文 参考訳(メタデータ) (2023-08-26T20:45:52Z) - MOCA: Self-supervised Representation Learning by Predicting Masked Online Codebook Assignments [72.6405488990753]
自己教師付き学習は、ビジョントランスフォーマーネットワークの欲求を軽減できる。
所望のプロパティを統一する単段および単段のMOCAを提案する。
我々は,様々な評価プロトコルにおいて,低照度設定と強力な実験結果に対して,最先端の新たな結果を得る。
論文 参考訳(メタデータ) (2023-07-18T15:46:20Z) - PRSNet: A Masked Self-Supervised Learning Pedestrian Re-Identification
Method [2.0411082897313984]
本論文は, 強靭性を有する事前学習モデルを得るために, マスク再構築の前タスクを設計する。
センタロイドに基づいて三重項損失を改善することにより、ネットワークのトレーニング最適化を行う。
この手法は、既存の自己教師型学習歩行者再識別法よりも、Marker1501およびCUHK03データ上で約5%高いmAPを達成する。
論文 参考訳(メタデータ) (2023-03-11T07:20:32Z) - Explainability-aided Domain Generalization for Image Classification [0.0]
説明可能性文献から手法やアーキテクチャを適用することで、ドメインの一般化という困難な課題に対して最先端のパフォーマンスを達成できることを示す。
そこで我々は,勾配に基づくクラスアクティベーションマップを用いて学習中にネットワークが指導を受ける手法であるDivCAMを含む新しいアルゴリズムを開発し,多様な識別機能に焦点をあてる。
これらの手法は、説明可能性に加えて競合性能を提供するため、深層ニューラルネットワークアーキテクチャのロバスト性を改善するツールとして使用できると論じる。
論文 参考訳(メタデータ) (2021-04-05T02:27:01Z) - Auto-Rectify Network for Unsupervised Indoor Depth Estimation [119.82412041164372]
ハンドヘルド環境に現れる複雑な自我運動が,学習深度にとって重要な障害であることが確認された。
本稿では,相対回転を除去してトレーニング画像の修正を効果的に行うデータ前処理手法を提案する。
その結果、従来の教師なしSOTA法よりも、難易度の高いNYUv2データセットよりも優れていた。
論文 参考訳(メタデータ) (2020-06-04T08:59:17Z) - Multi-Task Learning for Dense Prediction Tasks: A Survey [87.66280582034838]
マルチタスク学習(MTL)技術は、性能、計算、メモリフットプリントに関する有望な結果を示している。
我々は、コンピュータビジョンにおけるMLLのための最先端のディープラーニングアプローチについて、よく理解された視点を提供する。
論文 参考訳(メタデータ) (2020-04-28T09:15:50Z) - Curriculum By Smoothing [52.08553521577014]
畳み込みニューラルネットワーク(CNN)は、画像分類、検出、セグメンテーションなどのコンピュータビジョンタスクにおいて顕著な性能を示している。
アンチエイリアスフィルタやローパスフィルタを用いてCNNの機能埋め込みを円滑化するエレガントなカリキュラムベースのスキームを提案する。
トレーニング中に特徴マップ内の情報量が増加するにつれて、ネットワークはデータのより優れた表現を徐々に学習することができる。
論文 参考訳(メタデータ) (2020-03-03T07:27:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。