論文の概要: Enhancing Fruit and Vegetable Detection in Unconstrained Environment with a Novel Dataset
- arxiv url: http://arxiv.org/abs/2409.13330v1
- Date: Fri, 20 Sep 2024 08:46:03 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-07 07:40:00.684559
- Title: Enhancing Fruit and Vegetable Detection in Unconstrained Environment with a Novel Dataset
- Title(参考訳): 新たなデータセットを用いた非拘束環境における果実・野菜検出の促進
- Authors: Sandeep Khanna, Chiranjoy Chattopadhyay, Suman Kundu,
- Abstract要約: 本稿では,実環境における果実や野菜の検出とローカライズのためのエンドツーエンドパイプラインを提案する。
我々はFRUVEG67というデータセットをキュレートした。このデータセットには、制約のないシナリオでキャプチャされた67種類の果物や野菜の画像が含まれている。
Fruit and Vegetable Detection Network (FVDNet) は3つの異なるグリッド構成を持つYOLOv7のアンサンブルバージョンである。
- 参考スコア(独自算出の注目度): 4.498047714838568
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automating the detection of fruits and vegetables using computer vision is essential for modernizing agriculture, improving efficiency, ensuring food quality, and contributing to technologically advanced and sustainable farming practices. This paper presents an end-to-end pipeline for detecting and localizing fruits and vegetables in real-world scenarios. To achieve this, we have curated a dataset named FRUVEG67 that includes images of 67 classes of fruits and vegetables captured in unconstrained scenarios, with only a few manually annotated samples per class. We have developed a semi-supervised data annotation algorithm (SSDA) that generates bounding boxes for objects to label the remaining non-annotated images. For detection, we introduce the Fruit and Vegetable Detection Network (FVDNet), an ensemble version of YOLOv7 featuring three distinct grid configurations. We employ an averaging approach for bounding-box prediction and a voting mechanism for class prediction. We have integrated Jensen-Shannon divergence (JSD) in conjunction with focal loss to better detect smaller objects. Our experimental results highlight the superiority of FVDNet compared to previous versions of YOLO, showcasing remarkable improvements in detection and localization performance. We achieved an impressive mean average precision (mAP) score of 0.78 across all classes. Furthermore, we evaluated the efficacy of FVDNet using open-category refrigerator images, where it demonstrates promising results.
- Abstract(参考訳): コンピュータビジョンによる果物や野菜の検出の自動化は、農業の近代化、効率の向上、食品品質の確保、技術的に先進的で持続可能な農業慣行への貢献に不可欠である。
本稿では,実環境における果実や野菜の検出とローカライズのためのエンドツーエンドパイプラインを提案する。
これを実現するために、FRUVEG67というデータセットをキュレートした。このデータセットには、制約のないシナリオでキャプチャされた67種類の果物や野菜の画像が含まれており、クラス毎に手動で注釈付けされたサンプルはわずかである。
我々は,残りの非注釈画像にラベルをつけるためにオブジェクトのバウンディングボックスを生成する半教師付きデータアノテーションアルゴリズム(SSDA)を開発した。
Fruit and Vegetable Detection Network (FVDNet) は3つの異なるグリッド構成を持つYOLOv7のアンサンブルバージョンである。
我々は,境界ボックス予測に平均的アプローチ,およびクラス予測に投票機構を用いる。
我々は、より小さな物体をよりよく検出するために、焦点損失とともにJensen-Shannon divergence (JSD)を統合した。
実験の結果,従来のYOLOに比べてFVDNetの方が優れており,検出性能とローカライゼーション性能が著しく向上していることがわかった。
平均平均精度(mAP)は全クラスで0.78であった。
さらに,FVDNetの有効性をオープンカテゴリの冷凍機画像を用いて評価し,有望な結果を示した。
関連論文リスト
- Horticultural Temporal Fruit Monitoring via 3D Instance Segmentation and Re-Identification using Point Clouds [29.23207854514898]
本稿では,温室で収集した点群に時間とともに対処する,時間的果実モニタリングのための新しいアプローチを提案する。
本手法は,学習に基づくインスタンスセグメンテーション手法を用いて実の節分をポイントクラウド上で直接行う。
実のイチゴのデータセットを用いた実験結果から,本手法は果実の再同定方法よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-11-12T13:53:22Z) - AgRegNet: A Deep Regression Network for Flower and Fruit Density Estimation, Localization, and Counting in Orchards [3.0988265713549428]
本稿では,樹木果樹冠内の花と果実の密度,数,位置を推定する,深い回帰に基づくネットワークAgRegNetを提案する。
一般的なU-NetアーキテクチャにインスパイアされたAgRegNetは、エンコーダからデコーダへのスキップ接続と、エンコーダ機能抽出器としてConvNeXt-Tを改良したU字型ネットワークである。
論文 参考訳(メタデータ) (2024-09-25T22:19:32Z) - A pipeline for multiple orange detection and tracking with 3-D fruit
relocalization and neural-net based yield regression in commercial citrus
orchards [0.0]
本稿では,パイプラインとして実装されたビデオの果実数を利用した非侵襲的な代替手段を提案する。
そこで本研究では, 果実位置の3次元推定を利用した再局在化成分を導入する。
果実の少なくとも30%を正確に検出・追跡・数えることにより, 収率回帰器の精度は0.85である。
論文 参考訳(メタデータ) (2023-12-27T21:22:43Z) - Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - Augment and Criticize: Exploring Informative Samples for Semi-Supervised
Monocular 3D Object Detection [64.65563422852568]
我々は、一般的な半教師付きフレームワークを用いて、難解な単分子3次元物体検出問題を改善する。
我々は、ラベルのないデータから豊富な情報的サンプルを探索する、新しい、シンプルで効果的なAugment and Criticize'フレームワークを紹介します。
3DSeMo_DLEと3DSeMo_FLEXと呼ばれる2つの新しい検出器は、KITTIのAP_3D/BEV(Easy)を3.5%以上改善した。
論文 参考訳(メタデータ) (2023-03-20T16:28:15Z) - Panoptic Mapping with Fruit Completion and Pose Estimation for
Horticultural Robots [33.21287030243106]
植物や果実を高解像度でモニタリングすることは、農業の未来において重要な役割を担っている。
正確な3D情報は、自律収穫から正確な収量推定まで、農業における多様なロボット応用への道を開くことができる。
移動ロボットによって構築された3次元多次元マップにおいて,果実の完全な3次元形状とそのポーズを共同で推定する問題に対処する。
論文 参考訳(メタデータ) (2023-03-15T20:41:24Z) - Weakly and Semi-Supervised Detection, Segmentation and Tracking of Table
Grapes with Limited and Noisy Data [7.754321012552764]
現代のアルゴリズムはデータに飢えており、最高のパフォーマンスの教師付きアプローチを適用するのに十分なデータを集めることは必ずしも不可能である。
本稿では,精密農業応用における最先端検出・分節化に必要なデータを削減するために,弱教師付きソリューションを提案する。
我々は,ラベル付き画像がほとんどなく,非常に単純なラベル付けで高い性能を達成できる新しいモデルをいかに訓練できるかを示す。
論文 参考訳(メタデータ) (2022-08-27T12:58:42Z) - End-to-end deep learning for directly estimating grape yield from
ground-based imagery [53.086864957064876]
本研究は, ブドウ畑の収量推定に深層学習と併用した近位画像の応用を実証する。
オブジェクト検出、CNN回帰、トランスフォーマーモデルという3つのモデルアーキテクチャがテストされた。
本研究は,ブドウの収量予測における近位画像と深層学習の適用性を示した。
論文 参考訳(メタデータ) (2022-08-04T01:34:46Z) - Facilitated machine learning for image-based fruit quality assessment in
developing countries [68.8204255655161]
自動画像分類は食品科学における教師あり機械学習の一般的な課題である。
事前学習型視覚変換器(ViT)に基づく代替手法を提案する。
標準的なデバイス上で限られたリソースで簡単に実装できる。
論文 参考訳(メタデータ) (2022-07-10T19:52:20Z) - Potato Crop Stress Identification in Aerial Images using Deep
Learning-based Object Detection [60.83360138070649]
本稿では, 深層ニューラルネットワークを用いたジャガイモの空中画像解析手法を提案する。
主な目的は、植物レベルでの健康作物とストレス作物の自動空間認識を実証することである。
実験により、フィールド画像中の健康植物とストレス植物を識別し、平均Dice係数0.74を達成できることを示した。
論文 参考訳(メタデータ) (2021-06-14T21:57:40Z) - 3DIoUMatch: Leveraging IoU Prediction for Semi-Supervised 3D Object
Detection [76.42897462051067]
3DIoUMatchは屋内および屋外の場面両方に適当3D目的の検出のための新しい半監視された方法です。
教師と教師の相互学習の枠組みを活用し,ラベル付けされていない列車の情報を擬似ラベルの形で伝達する。
本手法は,ScanNetとSUN-RGBDのベンチマークにおける最先端の手法を,全てのラベル比で有意差で継続的に改善する。
論文 参考訳(メタデータ) (2020-12-08T11:06:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。