論文の概要: Foundation Model-Based Apple Ripeness and Size Estimation for Selective Harvesting
- arxiv url: http://arxiv.org/abs/2502.01850v1
- Date: Mon, 03 Feb 2025 21:55:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-05 14:59:09.967062
- Title: Foundation Model-Based Apple Ripeness and Size Estimation for Selective Harvesting
- Title(参考訳): ファンデーションモデルに基づく選択的ハーベスティングのためのAppleの剛性とサイズ推定
- Authors: Keyi Zhu, Jiajia Li, Kaixiang Zhang, Chaaran Arunachalam, Siddhartha Bhattacharya, Renfu Lu, Zhaojian Li,
- Abstract要約: 本研究では,効率的なリンゴ熟度とサイズ推定のための基礎モデルに基づく新しいフレームワークを提案する。
我々は,RGBDをベースとしたFuji apple画像データセット2枚をキュレートし,果実の色とイメージキャプチャの日付に基づいて熟成のための拡張アノテーション("Ripe" vs. "Unripe")を統合した。
その結果得られた包括的データセットであるFuji-Ripeness-Sizeデータセットには、4,027の画像と16,257個のアノテートされたリンゴの熟度とサイズラベルが含まれている。
- 参考スコア(独自算出の注目度): 8.944833667187913
- License:
- Abstract: Harvesting is a critical task in the tree fruit industry, demanding extensive manual labor and substantial costs, and exposing workers to potential hazards. Recent advances in automated harvesting offer a promising solution by enabling efficient, cost-effective, and ergonomic fruit picking within tight harvesting windows. However, existing harvesting technologies often indiscriminately harvest all visible and accessible fruits, including those that are unripe or undersized. This study introduces a novel foundation model-based framework for efficient apple ripeness and size estimation. Specifically, we curated two public RGBD-based Fuji apple image datasets, integrating expanded annotations for ripeness ("Ripe" vs. "Unripe") based on fruit color and image capture dates. The resulting comprehensive dataset, Fuji-Ripeness-Size Dataset, includes 4,027 images and 16,257 annotated apples with ripeness and size labels. Using Grounding-DINO, a language-model-based object detector, we achieved robust apple detection and ripeness classification, outperforming other state-of-the-art models. Additionally, we developed and evaluated six size estimation algorithms, selecting the one with the lowest error and variation for optimal performance. The Fuji-Ripeness-Size Dataset and the apple detection and size estimation algorithms are made publicly available, which provides valuable benchmarks for future studies in automated and selective harvesting.
- Abstract(参考訳): ハーベスティングは果樹産業において重要な課題であり、広範囲な手作業と実質的なコストを要求し、労働者を潜在的な危険に晒す。
自動収穫の最近の進歩は、厳密な収穫窓の中で効率よく、費用効率よく、人間工学的な果実を摘み取ることを可能にして、有望な解決策を提供する。
しかし、既存の収穫技術は、未熟または小粒の果実を含む、目に見える、アクセスしやすいすべての果実を無差別に収穫することが多い。
本研究では,効率的なリンゴ熟度とサイズ推定のための基礎モデルに基づく新しいフレームワークを提案する。
具体的には,2つの公開RGBDベースのFuji apple画像データセットをキュレートし,果実の色とイメージキャプチャの日付に基づいて,熟成のための拡張アノテーション("Ripe" vs. "Unripe")を統合する。
その結果得られた包括的データセットであるFuji-Ripeness-Size Datasetには、4,027の画像と16,257個のアノテートされたリンゴの熟度とサイズラベルが含まれている。
言語モデルに基づく物体検出装置である Grounding-DINO を用いて、ロバストなリンゴ検出と熟度分類を実現し、他の最先端モデルよりも優れていた。
さらに、6つのサイズ推定アルゴリズムを開発し、最適な性能を得るために、最も低い誤差と変動のあるものを選択した。
このFuji-Ripeness-Size Datasetとリンゴ検出とサイズ推定アルゴリズムが公開されており、自動収穫および選択収穫における将来の研究に有用なベンチマークを提供する。
関連論文リスト
- AgRegNet: A Deep Regression Network for Flower and Fruit Density Estimation, Localization, and Counting in Orchards [3.0988265713549428]
本稿では,樹木果樹冠内の花と果実の密度,数,位置を推定する,深い回帰に基づくネットワークAgRegNetを提案する。
一般的なU-NetアーキテクチャにインスパイアされたAgRegNetは、エンコーダからデコーダへのスキップ接続と、エンコーダ機能抽出器としてConvNeXt-Tを改良したU字型ネットワークである。
論文 参考訳(メタデータ) (2024-09-25T22:19:32Z) - MetaFruit Meets Foundation Models: Leveraging a Comprehensive Multi-Fruit Dataset for Advancing Agricultural Foundation Models [10.11552909915055]
今回紹介するMetaFruitは,4,248のイメージと248,015のラベル付きインスタンスからなる,公開可能な最大規模のマルチクラスフルーツデータセットである。
本研究では, 先進的ビジョン基礎モデル(VFM)を応用したオープンセット果実検出システムを提案する。
論文 参考訳(メタデータ) (2024-05-14T00:13:47Z) - Precise Apple Detection and Localization in Orchards using YOLOv5 for Robotic Harvesting Systems [0.0]
対象検出モデル YOLOv5 を用いたリンゴ検出と位置推定のための新しい手法を提案する。
以上の結果から, YOLOv5モデルではリンゴ検出精度が約85%向上した。
論文 参考訳(メタデータ) (2024-05-10T06:17:00Z) - S$^3$AD: Semi-supervised Small Apple Detection in Orchard Environments [3.1979650133817206]
作物検出は、自動収量推定や果物の摘みなど、精密農業用途に不可欠である。
本研究では,リンゴ検出タスクを半教師付きで再構築することで課題に対処する。
14,667個のアノテートリンゴインスタンスと4,440個の未ラベル画像からなる105個のラベル付き画像からなる、大規模で高解像度のデータセットMADを提供する。
また,小型リンゴの検出の難易度を高めるため,コンテキストアテンションと選択タイリングに基づく半スーパービジョン型小型アップル検出システムS$3$ADを提案する。
論文 参考訳(メタデータ) (2023-11-08T21:25:27Z) - HarvestNet: A Dataset for Detecting Smallholder Farming Activity Using
Harvest Piles and Remote Sensing [50.4506590177605]
HarvestNetは、2020-2023年のエチオピアのティグレイとアムハラの農場の存在をマッピングするためのデータセットである。
本研究は,多くの小作システムの特徴ある収穫杭の検出に基づく新しい手法を提案する。
本研究は, 農作物のリモートセンシングが, 食品の安全地帯において, よりタイムリーかつ正確な農地評価に寄与することが示唆された。
論文 参考訳(メタデータ) (2023-08-23T11:03:28Z) - Exploring the Effectiveness of Dataset Synthesis: An application of
Apple Detection in Orchards [68.95806641664713]
本研究では,リンゴ樹の合成データセットを生成するための安定拡散2.1-baseの有用性について検討する。
我々は、現実世界のリンゴ検出データセットでリンゴを予測するために、YOLOv5mオブジェクト検出モデルを訓練する。
その結果、実世界の画像でトレーニングされたベースラインモデルと比較して、生成データでトレーニングされたモデルはわずかに性能が劣っていることがわかった。
論文 参考訳(メタデータ) (2023-06-20T09:46:01Z) - Fruit Ripeness Classification: a Survey [59.11160990637616]
食品を格付けするための特徴記述子を多用する多くの自動的手法が提案されている。
機械学習とディープラーニング技術がトップパフォーマンスの手法を支配している。
ディープラーニングは生のデータで操作できるため、複雑なエンジニアリング機能を計算する必要がなくなる。
論文 参考訳(メタデータ) (2022-12-29T19:32:20Z) - Apple Counting using Convolutional Neural Networks [22.504279159923765]
果樹園のような現実の環境でのイメージから、正確で信頼性の高い果実や野菜の数を推定することは、難しい問題である。
コンボリューショナルニューラルネットワークを訓練することにより,画像から果実を数えることを多クラス分類問題として定式化し,その問題を解決する。
当社のネットワークは、最大94%の精度で、4つのデータセットのうち3つでパフォーマンスを向上しています。
論文 参考訳(メタデータ) (2022-08-24T14:13:40Z) - End-to-end deep learning for directly estimating grape yield from
ground-based imagery [53.086864957064876]
本研究は, ブドウ畑の収量推定に深層学習と併用した近位画像の応用を実証する。
オブジェクト検出、CNN回帰、トランスフォーマーモデルという3つのモデルアーキテクチャがテストされた。
本研究は,ブドウの収量予測における近位画像と深層学習の適用性を示した。
論文 参考訳(メタデータ) (2022-08-04T01:34:46Z) - Facilitated machine learning for image-based fruit quality assessment in
developing countries [68.8204255655161]
自動画像分類は食品科学における教師あり機械学習の一般的な課題である。
事前学習型視覚変換器(ViT)に基づく代替手法を提案する。
標準的なデバイス上で限られたリソースで簡単に実装できる。
論文 参考訳(メタデータ) (2022-07-10T19:52:20Z) - Potato Crop Stress Identification in Aerial Images using Deep
Learning-based Object Detection [60.83360138070649]
本稿では, 深層ニューラルネットワークを用いたジャガイモの空中画像解析手法を提案する。
主な目的は、植物レベルでの健康作物とストレス作物の自動空間認識を実証することである。
実験により、フィールド画像中の健康植物とストレス植物を識別し、平均Dice係数0.74を達成できることを示した。
論文 参考訳(メタデータ) (2021-06-14T21:57:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。