論文の概要: MetaFruit Meets Foundation Models: Leveraging a Comprehensive Multi-Fruit Dataset for Advancing Agricultural Foundation Models
- arxiv url: http://arxiv.org/abs/2407.04711v1
- Date: Tue, 14 May 2024 00:13:47 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-22 16:25:52.689698
- Title: MetaFruit Meets Foundation Models: Leveraging a Comprehensive Multi-Fruit Dataset for Advancing Agricultural Foundation Models
- Title(参考訳): MetaFruitとファンデーションモデル: 総合的なマルチフルーツデータセットを活用して農業ファンデーションモデルを改善する
- Authors: Jiajia Li, Kyle Lammers, Xunyuan Yin, Xiang Yin, Long He, Renfu Lu, Zhaojian Li,
- Abstract要約: 今回紹介するMetaFruitは,4,248のイメージと248,015のラベル付きインスタンスからなる,公開可能な最大規模のマルチクラスフルーツデータセットである。
本研究では, 先進的ビジョン基礎モデル(VFM)を応用したオープンセット果実検出システムを提案する。
- 参考スコア(独自算出の注目度): 10.11552909915055
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Fruit harvesting poses a significant labor and financial burden for the industry, highlighting the critical need for advancements in robotic harvesting solutions. Machine vision-based fruit detection has been recognized as a crucial component for robust identification of fruits to guide robotic manipulation. Despite considerable progress in leveraging deep learning and machine learning techniques for fruit detection, a common shortfall is the inability to swiftly extend the developed models across different orchards and/or various fruit species. Additionally, the limited availability of pertinent data further compounds these challenges. In this work, we introduce MetaFruit, the largest publicly available multi-class fruit dataset, comprising 4,248 images and 248,015 manually labeled instances across diverse U.S. orchards. Furthermore, this study proposes an innovative open-set fruit detection system leveraging advanced Vision Foundation Models (VFMs) for fruit detection that can adeptly identify a wide array of fruit types under varying orchard conditions. This system not only demonstrates remarkable adaptability in learning from minimal data through few-shot learning but also shows the ability to interpret human instructions for subtle detection tasks. The performance of the developed foundation model is comprehensively evaluated using several metrics, which outperforms the existing state-of-the-art algorithms in both our MetaFruit dataset and other open-sourced fruit datasets, thereby setting a new benchmark in the field of agricultural technology and robotic harvesting. The MetaFruit dataset and detection framework are open-sourced to foster future research in vision-based fruit harvesting, marking a significant stride toward addressing the urgent needs of the agricultural sector.
- Abstract(参考訳): 果実の収穫は、産業にとって大きな労働力と財政的な負担となり、ロボット収穫ソリューションの進歩に対する重要な必要性を強調している。
機械ビジョンに基づく果物検出は、ロボット操作をガイドする果物の堅牢な識別に重要な要素として認識されている。
深層学習と機械学習の技術を果物の検出に活用する大きな進歩にもかかわらず、共通する欠点は、様々な果樹園および/または様々な果樹種で開発モデルを迅速に拡張できないことである。
さらに、関連するデータの可用性の制限により、これらの課題はさらに複雑になる。
本研究では,4,248枚の画像と248,015枚の手動ラベル付きインスタンスを米国内の果樹園に分散した,公開可能な最大規模のマルチクラスフルーツデータセットであるMetaFruitを紹介する。
さらに, 異なる果樹条件下での広範囲な果実の識別が可能な, 先進的視覚基盤モデル(VFM)を利用した, 革新的オープンセット果実検出システムを提案する。
このシステムは、最小限のデータから数ショットの学習を通して学習する際の顕著な適応性を示すだけでなく、微妙な検出タスクのために人間の指示を解釈する能力を示す。
開発した基盤モデルの性能は,MetaFruitデータセットと他のオープンソースフルーツデータセットの両方において,既存の最先端アルゴリズムよりも優れており,農業技術とロボット収穫の分野における新たなベンチマークが設定されている。
MetaFruitデータセットと検出フレームワークは、ビジョンベースの果物収穫の今後の研究を促進するために、オープンソースとして公開されている。
関連論文リスト
- Foundation Model-Based Apple Ripeness and Size Estimation for Selective Harvesting [8.944833667187913]
本研究では,効率的なリンゴ熟度とサイズ推定のための基礎モデルに基づく新しいフレームワークを提案する。
我々は,RGBDをベースとしたFuji apple画像データセット2枚をキュレートし,果実の色とイメージキャプチャの日付に基づいて熟成のための拡張アノテーション("Ripe" vs. "Unripe")を統合した。
その結果得られた包括的データセットであるFuji-Ripeness-Sizeデータセットには、4,027の画像と16,257個のアノテートされたリンゴの熟度とサイズラベルが含まれている。
論文 参考訳(メタデータ) (2025-02-03T21:55:02Z) - Raspberry PhenoSet: A Phenology-based Dataset for Automated Growth Detection and Yield Estimation [1.2661567777618703]
7つの発達段階にまたがるラズベリー果実の検出とセグメンテーションのための表現学ベースのデータセットであるRaspberry PhenoSetを紹介した。
このデータセットには1,853枚の高解像度画像が含まれており、これは文学の中で最高品質であり、垂直農場で制御された人工照明の下で撮影された。
YOLOv8, YOLOv10, RT-DETR, Mask R-CNNなど,最先端のディープラーニングモデルをベンチマークして, データセットのパフォーマンスを総合的に評価した。
論文 参考訳(メタデータ) (2024-11-01T18:34:26Z) - RoDE: Linear Rectified Mixture of Diverse Experts for Food Large Multi-Modal Models [96.43285670458803]
Uni-Foodは、さまざまな食品ラベルを持つ10万以上の画像からなる統合食品データセットである。
Uni-Foodは、食品データ分析に対するより包括的なアプローチを提供するように設計されている。
本稿では,食品関連マルチタスキングの課題に対処するため,新しいリニア・リクティフィケーション・ミックス・オブ・ディバース・エキスパート (RoDE) アプローチを提案する。
論文 参考訳(メタデータ) (2024-07-17T16:49:34Z) - Few-Shot Fruit Segmentation via Transfer Learning [4.616529139444651]
移動学習を用いた内野果実のセマンティックセマンティックセマンティックセマンティクスフレームワークを開発した。
都会のシーン解析における同様の成功を機に,我々は特別事前学習を提案する。
プレトレーニングモデルでは, 地上に落ちてきた果実と木上の果実の区別が可能であることを示す。
論文 参考訳(メタデータ) (2024-05-04T04:05:59Z) - Capture the Flag: Uncovering Data Insights with Large Language Models [90.47038584812925]
本研究では,Large Language Models (LLMs) を用いてデータの洞察の発見を自動化する可能性について検討する。
そこで本稿では,データセット内の意味的かつ関連する情報(フラグ)を識別する能力を測定するために,フラグを捕捉する原理に基づく新しい評価手法を提案する。
論文 参考訳(メタデータ) (2023-12-21T14:20:06Z) - Fusion-Driven Tree Reconstruction and Fruit Localization: Advancing Precision in Agriculture [2.338903291171288]
本研究では,RGB画像,LiDAR,IMUデータの相乗効果を利用して複雑な木復元を行う手法を提案する。
制御された環境と実際の桃果樹園の両方で実験が行われた。
論文 参考訳(メタデータ) (2023-10-23T17:44:59Z) - Food Image Classification and Segmentation with Attention-based Multiple
Instance Learning [51.279800092581844]
本稿では,食品画像分類とセマンティックセグメンテーションモデルを訓練するための弱教師付き方法論を提案する。
提案手法は、注意に基づくメカニズムと組み合わせて、複数のインスタンス学習アプローチに基づいている。
提案手法の有効性を検証するため,FoodSeg103データセット内の2つのメタクラスについて実験を行った。
論文 参考訳(メタデータ) (2023-08-22T13:59:47Z) - Empowering Agrifood System with Artificial Intelligence: A Survey of the Progress, Challenges and Opportunities [86.89427012495457]
我々は、AI技術がアグリフードシステムをどう変え、現代のアグリフード産業に貢献するかをレビューする。
本稿では,農業,畜産,漁業において,アグリフードシステムにおけるAI手法の進歩について概説する。
我々は、AIで現代のアグリフードシステムを変革するための潜在的な課題と有望な研究機会を強調します。
論文 参考訳(メタデータ) (2023-05-03T05:16:54Z) - Fruit Ripeness Classification: a Survey [59.11160990637616]
食品を格付けするための特徴記述子を多用する多くの自動的手法が提案されている。
機械学習とディープラーニング技術がトップパフォーマンスの手法を支配している。
ディープラーニングは生のデータで操作できるため、複雑なエンジニアリング機能を計算する必要がなくなる。
論文 参考訳(メタデータ) (2022-12-29T19:32:20Z) - Semantic Image Segmentation with Deep Learning for Vine Leaf Phenotyping [59.0626764544669]
本研究では,ブドウの葉のイメージを意味的にセグメント化するためにDeep Learning法を用いて,葉の表現型自動検出システムを開発した。
私たちの研究は、成長や開発のような動的な特性を捉え定量化できる植物ライフサイクルのモニタリングに寄与します。
論文 参考訳(メタデータ) (2022-10-24T14:37:09Z) - Generative Adversarial Networks for Image Augmentation in Agriculture: A
Systematic Review [5.639656362091594]
2014年にコンピュータビジョンコミュニティで発明されたGAN(Generative Adversarial Network)は、優れたデータ表現を学習できる新しいアプローチスイートを提供する。
本稿では, GAN アーキテクチャの進化を概観するとともに, 農業への導入を体系的に検討する。
論文 参考訳(メタデータ) (2022-04-10T15:33:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。