論文の概要: AppleGrowthVision: A large-scale stereo dataset for phenological analysis, fruit detection, and 3D reconstruction in apple orchards
- arxiv url: http://arxiv.org/abs/2505.14029v1
- Date: Tue, 20 May 2025 07:29:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-21 14:49:52.859569
- Title: AppleGrowthVision: A large-scale stereo dataset for phenological analysis, fruit detection, and 3D reconstruction in apple orchards
- Title(参考訳): AppleGrowthVision:リンゴ果樹の表現学的分析、果実検出、および3D再構成のための大規模ステレオデータセット
- Authors: Laura-Sophia von Hirschhausen, Jannes S. Magnusson, Mykyta Kovalenko, Fredrik Boye, Tanay Rawat, Peter Eisert, Anna Hilsmann, Sebastian Pretzsch, Sebastian Bosse,
- Abstract要約: 2つのサブセットからなる大規模データセットであるAppleGrowthVisionを提案する。
第1弾はブランデンブルク(ドイツ)の農場から収集された高解像度ステレオ画像9,317枚を含む。
第2のサブセットはブランデンブルクの同じ農場から1,125枚の濃密に注釈付けされた画像と、合計で31,084個のリンゴのラベルを含むピルニッツ(Pillnitz)の1枚で構成されている。
AppleGrowthVisionは、農業的に検証された成長段階のステレオ画像データを提供し、正確な表現学的分析と3D再構成を可能にする。
- 参考スコア(独自算出の注目度): 3.9494466926597487
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep learning has transformed computer vision for precision agriculture, yet apple orchard monitoring remains limited by dataset constraints. The lack of diverse, realistic datasets and the difficulty of annotating dense, heterogeneous scenes. Existing datasets overlook different growth stages and stereo imagery, both essential for realistic 3D modeling of orchards and tasks like fruit localization, yield estimation, and structural analysis. To address these gaps, we present AppleGrowthVision, a large-scale dataset comprising two subsets. The first includes 9,317 high resolution stereo images collected from a farm in Brandenburg (Germany), covering six agriculturally validated growth stages over a full growth cycle. The second subset consists of 1,125 densely annotated images from the same farm in Brandenburg and one in Pillnitz (Germany), containing a total of 31,084 apple labels. AppleGrowthVision provides stereo-image data with agriculturally validated growth stages, enabling precise phenological analysis and 3D reconstructions. Extending MinneApple with our data improves YOLOv8 performance by 7.69 % in terms of F1-score, while adding it to MinneApple and MAD boosts Faster R-CNN F1-score by 31.06 %. Additionally, six BBCH stages were predicted with over 95 % accuracy using VGG16, ResNet152, DenseNet201, and MobileNetv2. AppleGrowthVision bridges the gap between agricultural science and computer vision, by enabling the development of robust models for fruit detection, growth modeling, and 3D analysis in precision agriculture. Future work includes improving annotation, enhancing 3D reconstruction, and extending multimodal analysis across all growth stages.
- Abstract(参考訳): ディープラーニングは、精密農業のためのコンピュータビジョンを変えてきたが、リンゴ果樹園のモニタリングは、データセットの制約によって制限されている。
多様な現実的なデータセットの欠如と、密集した異質なシーンに注釈をつけるのが困難である。
既存のデータセットは、果樹園のリアルな3Dモデリングや、果実の局在化、収量推定、構造解析に不可欠な、異なる成長段階とステレオ画像を見渡せる。
これらのギャップに対処するため、AppleGrowthVisionという2つのサブセットからなる大規模データセットを提示する。
第1弾はブランデンブルク(ドイツ)の農場から収集された高解像度ステレオ画像9,317枚を含む。
第2のサブセットはブランデンブルクの同じ農場から1,125枚の濃密に注釈付けされた画像と、合計で31,084個のリンゴのラベルを含むピルニッツ(Pillnitz)の1枚で構成されている。
AppleGrowthVisionは、農業的に検証された成長段階のステレオ画像データを提供し、正確な表現学的分析と3D再構成を可能にする。
私たちのデータでMinneAppleを拡張することで、F1スコアの点でYOLOv8のパフォーマンスが7.69%向上し、MinneAppleにそれを追加することで、より高速なR-CNN F1スコアが31.06%向上した。
さらに、VGG16、ResNet152、DenseNet201、MobileNetv2の6つのBBCHステージが95%以上の精度で予測された。
AppleGrowthVisionは、果物の検出、成長モデリング、精密農業における3D分析のための堅牢なモデルの開発を可能にすることで、農業科学とコンピュータビジョンのギャップを埋める。
今後の作業には、アノテーションの改善、3D再構成の強化、すべての成長段階にわたるマルチモーダル分析の拡張などが含まれる。
関連論文リスト
- Enhancing Fruit and Vegetable Detection in Unconstrained Environment with a Novel Dataset [4.498047714838568]
本稿では,実環境における果実や野菜の検出とローカライズのためのエンドツーエンドパイプラインを提案する。
我々はFRUVEG67というデータセットをキュレートした。このデータセットには、制約のないシナリオでキャプチャされた67種類の果物や野菜の画像が含まれている。
Fruit and Vegetable Detection Network (FVDNet) は3つの異なるグリッド構成を持つYOLOv7のアンサンブルバージョンである。
論文 参考訳(メタデータ) (2024-09-20T08:46:03Z) - A Dataset and Benchmark for Shape Completion of Fruits for Agricultural Robotics [30.46518628656399]
本稿では,農業用視覚システムのための3次元形状補完データセットを提案する。
果実の3次元形状を推定するためのRGB-Dデータセットを提供する。
論文 参考訳(メタデータ) (2024-07-18T09:07:23Z) - Implicit-Zoo: A Large-Scale Dataset of Neural Implicit Functions for 2D Images and 3D Scenes [65.22070581594426]
Implicit-Zoo"は、この分野の研究と開発を容易にするために、数千のGPUトレーニング日を必要とする大規模なデータセットである。
1)トランスモデルのトークン位置を学習すること、(2)NeRFモデルに関して直接3Dカメラが2D画像のポーズを取ること、である。
これにより、画像分類、セマンティックセグメンテーション、および3次元ポーズ回帰の3つのタスクすべてのパフォーマンスが向上し、研究のための新たな道が開けることになる。
論文 参考訳(メタデータ) (2024-06-25T10:20:44Z) - Leveraging Large-Scale Pretrained Vision Foundation Models for
Label-Efficient 3D Point Cloud Segmentation [67.07112533415116]
本稿では3Dポイントクラウドセグメンテーションタスクに様々な基礎モデルを適用する新しいフレームワークを提案する。
我々のアプローチでは、異なる大きな視覚モデルを用いて2次元セマンティックマスクの初期予測を行う。
本研究では,ロバストな3Dセマンティックな擬似ラベルを生成するために,投票による全ての結果を効果的に組み合わせたセマンティックなラベル融合戦略を提案する。
論文 参考訳(メタデータ) (2023-11-03T15:41:15Z) - HarvestNet: A Dataset for Detecting Smallholder Farming Activity Using
Harvest Piles and Remote Sensing [50.4506590177605]
HarvestNetは、2020-2023年のエチオピアのティグレイとアムハラの農場の存在をマッピングするためのデータセットである。
本研究は,多くの小作システムの特徴ある収穫杭の検出に基づく新しい手法を提案する。
本研究は, 農作物のリモートセンシングが, 食品の安全地帯において, よりタイムリーかつ正確な農地評価に寄与することが示唆された。
論文 参考訳(メタデータ) (2023-08-23T11:03:28Z) - Panoptic Mapping with Fruit Completion and Pose Estimation for
Horticultural Robots [33.21287030243106]
植物や果実を高解像度でモニタリングすることは、農業の未来において重要な役割を担っている。
正確な3D情報は、自律収穫から正確な収量推定まで、農業における多様なロボット応用への道を開くことができる。
移動ロボットによって構築された3次元多次元マップにおいて,果実の完全な3次元形状とそのポーズを共同で推定する問題に対処する。
論文 参考訳(メタデータ) (2023-03-15T20:41:24Z) - End-to-end deep learning for directly estimating grape yield from
ground-based imagery [53.086864957064876]
本研究は, ブドウ畑の収量推定に深層学習と併用した近位画像の応用を実証する。
オブジェクト検出、CNN回帰、トランスフォーマーモデルという3つのモデルアーキテクチャがテストされた。
本研究は,ブドウの収量予測における近位画像と深層学習の適用性を示した。
論文 参考訳(メタデータ) (2022-08-04T01:34:46Z) - Geometry-Aware Fruit Grasping Estimation for Robotic Harvesting in
Orchards [6.963582954232132]
幾何認識ネットワークであるA3Nは、エンドツーエンドのインスタンスセグメンテーションと把握推定を行うために提案されている。
我々は,フィールド環境下での果実の認識と検索をロボットが正確に行うことができるグローバル・ローカル・スキャン・ストラテジーを実装した。
全体として、ロボットシステムは、収穫実験において70%から85%の範囲で収穫の成功率を達成する。
論文 参考訳(メタデータ) (2021-12-08T16:17:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。