論文の概要: Quality Detection of Stored Potatoes via Transfer Learning: A CNN and Vision Transformer Approach
- arxiv url: http://arxiv.org/abs/2601.00645v1
- Date: Fri, 02 Jan 2026 11:10:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-05 15:04:33.557205
- Title: Quality Detection of Stored Potatoes via Transfer Learning: A CNN and Vision Transformer Approach
- Title(参考訳): トランスファーラーニングによる貯蔵ポテトの品質検出:CNNと視覚変換器のアプローチ
- Authors: Shrikant Kapse, Priyankkumar Dhrangdhariya, Priya Kedia, Manasi Patwardhan, Shankar Kausley, Soumyadipta Maiti, Beena Rai, Shirish Karande,
- Abstract要約: 画像ベースのディープラーニングは、ストレージ中のポテトの品質を監視する、非侵襲的でスケーラブルなソリューションを提供する。
DenseNetは98.03%の精度で異常な性能を達成した。
現実的な意味としては、在庫管理の改善、価格戦略の相違、サプライチェーン全体の食品廃棄物の削減などが挙げられる。
- 参考スコア(独自算出の注目度): 5.4334298353938415
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image-based deep learning provides a non-invasive, scalable solution for monitoring potato quality during storage, addressing key challenges such as sprout detection, weight loss estimation, and shelf-life prediction. In this study, images and corresponding weight data were collected over a 200-day period under controlled temperature and humidity conditions. Leveraging powerful pre-trained architectures of ResNet, VGG, DenseNet, and Vision Transformer (ViT), we designed two specialized models: (1) a high-precision binary classifier for sprout detection, and (2) an advanced multi-class predictor to estimate weight loss and forecast remaining shelf-life with remarkable accuracy. DenseNet achieved exceptional performance, with 98.03% accuracy in sprout detection. Shelf-life prediction models performed best with coarse class divisions (2-5 classes), achieving over 89.83% accuracy, while accuracy declined for finer divisions (6-8 classes) due to subtle visual differences and limited data per class. These findings demonstrate the feasibility of integrating image-based models into automated sorting and inventory systems, enabling early identification of sprouted potatoes and dynamic categorization based on storage stage. Practical implications include improved inventory management, differential pricing strategies, and reduced food waste across supply chains. While predicting exact shelf-life intervals remains challenging, focusing on broader class divisions ensures robust performance. Future research should aim to develop generalized models trained on diverse potato varieties and storage conditions to enhance adaptability and scalability. Overall, this approach offers a cost-effective, non-destructive method for quality assessment, supporting efficiency and sustainability in potato storage and distribution.
- Abstract(参考訳): 画像ベースのディープラーニングは、ストレージ中のポテトの品質監視のための非侵襲的でスケーラブルなソリューションを提供する。
本研究では,温度および湿度の制御条件下で,200日間にわたって画像および対応する重量データを収集した。
ResNet,VGG,DenseNet,Vision Transformer (ViT) の強力な事前学習型アーキテクチャを活用して,(1)スプルート検出のための高精度バイナリ分類器,(2)重量損失を推定する高度なマルチクラス予測器,および残りの棚寿命を顕著な精度で予測する2つの特殊モデルを設計した。
DenseNetは98.03%の精度で異常な性能を達成した。
シェルフライフ予測モデルは、粗いクラス区分(2-5クラス)で最善を尽くし、89.83%以上の精度を達成したが、微妙な視覚的差異とクラス毎のデータ制限により、より細かな部門(6-8クラス)では精度が低下した。
これらの結果から,画像ベースモデルを自動ソート・インベントリシステムに統合し,発芽ジャガイモの早期同定と貯蔵段階に基づく動的分類を可能にする可能性が示唆された。
現実的な意味としては、在庫管理の改善、価格戦略の相違、サプライチェーン全体の食品廃棄物の削減などが挙げられる。
正確なシェルフライフ間隔を予測することは依然として難しいが、より広範なクラス分割に焦点を当てることによって、堅牢なパフォーマンスが保証される。
今後の研究は、多種多様なジャガイモ品種と貯蔵条件に基づいて訓練された汎用モデルを開発し、適応性とスケーラビリティを向上させることを目的としている。
全体として, ポテト貯蔵・流通における品質評価, 効率性, 持続可能性に対する費用対効果, 非破壊的手法を提供する。
関連論文リスト
- Investigating the Impact of Large-Scale Pre-training on Nutritional Content Estimation from 2D Images [0.0699049312989311]
画像から食物の栄養含量を推定することは、健康と食事のモニタリングに重要な意味を持つ重要な課題である。
本稿では,2次元画像のみを用いた栄養推定のためのディープラーニングモデルの性能に及ぼす大規模事前学習データセットの影響について検討する。
論文 参考訳(メタデータ) (2025-08-06T00:57:55Z) - Advancing Reliable Test-Time Adaptation of Vision-Language Models under Visual Variations [67.35596444651037]
視覚言語モデル(VLM)は、素晴らしいゼロショット機能を示すが、ラベル付きデータが利用できない場合、下流タスクの分散シフトに苦慮する。
本稿では,信頼性を両面から高めるReliable Test-Time Adaptation (ReTA)法を提案する。
論文 参考訳(メタデータ) (2025-07-13T05:37:33Z) - Boosting High Resolution Image Classification with Scaling-up
Transformers [3.987378367017207]
ICCV/CVPPA2023 Deep Nutrient Deficiency Challengeで2位を獲得した高解像度画像分類のための総合的なアプローチを提案する。
論文 参考訳(メタデータ) (2023-09-26T21:30:12Z) - Small-scale proxies for large-scale Transformer training instabilities [69.36381318171338]
我々は、小規模でトレーニングの安定性と不安定性を再現し、研究する方法を模索する。
学習速度とスケールによる損失の関係を計測することにより,これらの不安定性は,学習率の高いトレーニングにおいて,小さなモデルにも現れることを示す。
ウォームアップ,ウェイト崩壊,および$mu$Paramなどの手法を用いて,学習速度変化の桁数で同様の損失を被る小さなモデルを訓練する。
論文 参考訳(メタデータ) (2023-09-25T17:48:51Z) - Bridging Precision and Confidence: A Train-Time Loss for Calibrating
Object Detection [58.789823426981044]
本稿では,境界ボックスのクラス信頼度を予測精度に合わせることを目的とした,新たな補助損失定式化を提案する。
その結果,列車の走行時間損失はキャリブレーション基準を超過し,キャリブレーション誤差を低減させることがわかった。
論文 参考訳(メタデータ) (2023-03-25T08:56:21Z) - TWINS: A Fine-Tuning Framework for Improved Transferability of
Adversarial Robustness and Generalization [89.54947228958494]
本稿では,様々な分類タスクにおいて,逆向きに事前訓練されたモデルの微調整に焦点を当てる。
本稿では,TWINS(Two-WIng NormliSation)ファインチューニングフレームワークを提案する。
TWINSは、一般化とロバスト性の両方の観点から、幅広い画像分類データセットに有効であることが示されている。
論文 参考訳(メタデータ) (2023-03-20T14:12:55Z) - Selective classification using a robust meta-learning approach [28.460912135533988]
本稿では,補助ネットワークを用いて予測不確実性を捉えるインスタンス条件の再重み付け手法を提案する。
制御された実験において、このメタオブジェクトを通して様々な不確実性の概念を効果的に捉えていることを示す。
糖尿病網膜症では、最大3.4%/3.3%の精度でSOTAを上回り、選択的分類ではAUCが上昇する。
論文 参考訳(メタデータ) (2022-12-12T15:45:23Z) - Generalized Focal Loss: Learning Qualified and Distributed Bounding
Boxes for Dense Object Detection [85.53263670166304]
一段検出器は基本的に、物体検出を密度の高い分類と位置化として定式化する。
1段検出器の最近の傾向は、局所化の質を推定するために個別の予測分岐を導入することである。
本稿では, 上記の3つの基本要素, 品質推定, 分類, ローカライゼーションについて述べる。
論文 参考訳(メタデータ) (2020-06-08T07:24:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。