論文の概要: ViViD-5K: Vineyard vision dataset for field-based berry detection and segmentation and grape cluster closure estimation
- arxiv url: http://arxiv.org/abs/2605.24353v1
- Date: Sat, 23 May 2026 02:30:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:17.948494
- Title: ViViD-5K: Vineyard vision dataset for field-based berry detection and segmentation and grape cluster closure estimation
- Title(参考訳): ViViD-5K:Vineyard Vision dataset for field-based berry detection and segmentation and grape cluster closure Estimation
- Authors: Xiangzhi Tong, Chengrui Zhang, Mac Flaherty, Andre Matteo Garcia, Dominic Gorman, Jonathan Jaramillo, Justine E. Vanden Heuvel, Yu Jiang,
- Abstract要約: クラスター閉鎖は、ブドウ園の管理において重要な特徴であり、病気のリスクに影響を与える。
伝統的な視覚的採点法は、労働集約的で主観的であり、時間分解能が欠如している。
大規模インフィールドVineyard VisionデータセットであるViViD-5kについて,648,000個のベリーセントロイドと,13種類のブドウ品種にまたがるクラスタセグメンテーションマスクについて紹介する。
ポイントベースのベリーローカライゼーションとSegment Anythingを用いたプロンプトベースのセグメンテーションを組み合わせた2段階のビジュアルパイプラインであるGrapeSAMを導入し,次にトランスフォーマーベースのクラスタセグメンテーションを紹介する。
- 参考スコア(独自算出の注目度): 7.764774369757902
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Cluster closure, defined as the progressive filling of gaps between the berries in a grape bunch, is a key trait in vineyard management, impacting disease risk. However, traditional visual scoring methods are labor-intensive, subjective, and lack temporal resolution. Existing datasets rarely support fine-grained berry-level analysis, limiting the development of robust deep learning models. In this work, we present ViViD-5k, a large-scale in-field Vineyard Vision Dataset containing 5,000 images with dense annotations, including over 648,000 berry centroids and cluster segmentation masks spanning 13 grape varieties. Building on this dataset, we introduce GrapeSAM, a two-stage visual pipeline that combines point-based berry localization with prompt-based segmentation using Segment Anything, followed by transformer-based cluster segmentation. The pipeline enables automated, in-field estimation of cluster closure with minimal supervision. Quantitative results demonstrate strong segmentation and counting accuracy across diverse conditions, while visualizations confirm robustness on both in-domain and out-of-domain samples. This work provides a scalable and objective alternative to manual compactness scoring and supports high-throughput grape phenotyping with enhanced spatial detail.
- Abstract(参考訳): クラスター閉鎖は、ブドウの群れ内のベリー間のギャップを段階的に埋めることとして定義されており、ブドウ園の管理において重要な特徴であり、病気のリスクに影響を与える。
しかし、従来の視覚的採点法は労働集約的で主観的であり、時間分解能が欠如している。
既存のデータセットは、きめ細かいベリーレベルの分析をほとんどサポートしておらず、堅牢なディープラーニングモデルの開発を制限している。
そこで本研究では,648,000種以上のベリーセンタロイドと,13種のブドウにまたがるクラスタセグメンテーションマスクを含む,5,000枚の画像を含む大規模インフィールドVineyard Vision DatasetのViViD-5kについて述べる。
このデータセット上に構築されたGrapeSAMは、ポイントベースのベリーローカライゼーションとSegment Anythingを使ったプロンプトベースのセグメンテーションを組み合わせた2段階のビジュアルパイプラインで、続いてトランスフォーマーベースのクラスタセグメンテーションを行う。
このパイプラインは、最小限の監視でクラスタクロージャの自動、フィールド内推定を可能にする。
定量分析の結果,領域内サンプルと領域外サンプルの両方で高いセグメンテーションと精度が得られた。
この研究は手動のコンパクト性スコアリングに代わるスケーラブルで客観的な代替手段を提供し、空間的詳細性を高めた高スループットブドウの表現を支援する。
関連論文リスト
- DINOv3 Visual Representations for Blueberry Perception Toward Robotic Harvesting [10.977118601343797]
この研究は、DINOv3をブルーベリーロボット収穫関連視覚タスクの冷凍バックボーンとして評価する。
果実や青果物のセグメンテーションや、果物やクラスターの検出が含まれる。
全体として、DINOv3はエンドツーエンドのタスクモデルではなく、セマンティックなバックボーンと見なされている。
論文 参考訳(メタデータ) (2026-03-02T22:01:25Z) - Segment Anything for comprehensive analysis of grapevine cluster architecture and berry properties [0.0]
本研究では,2次元クラスタ画像における個々のベリーの同定において,SAMの精度が高いことを示す。
ヒトの識別したベリーとSAMの予測の相関は非常に強い。
論文 参考訳(メタデータ) (2024-03-19T17:37:18Z) - Classification of grapevine varieties using UAV hyperspectral imaging [0.0]
ブドウ品種の分類は、精密ブドウ栽培において関連する表現型課題である。
無人航空機(UAV)は、ハイパースペクトルデータの収集に対して、より効率的で禁止的でないアプローチを提供する。
本研究では,17種類の赤と白のブドウ品種を分類するために,畳み込みニューラルネットワーク(CNN)を提案する。
論文 参考訳(メタデータ) (2024-01-23T15:35:50Z) - Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。
クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。
提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-30T00:32:47Z) - Concept Drift and Long-Tailed Distribution in Fine-Grained Visual Categorization: Benchmark and Method [84.68818879525568]
コンセプションドリフトとLong-Tailed Distributionデータセットを提案する。
インスタンスの特徴は時間によって異なり、長い尾の分布を示す傾向がある。
本稿ではCDLTに関連する学習課題に対処する機能組換えフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-04T12:42:45Z) - Domain-Generalizable Multiple-Domain Clustering [55.295300263404265]
本研究は、教師なし領域一般化の問題を、ラベル付きサンプルが存在しない場合(完全に教師なし)に一般化する。
我々は複数のソースドメインからラベルのないサンプルを付与し、サンプルを意味的に関連するクラスタに割り当てる共有予測器を学習することを目指している。
評価は、これまで見つからなかったドメインのクラスタ割り当てを予測することで行われる。
論文 参考訳(メタデータ) (2023-01-31T10:24:50Z) - Weakly and Semi-Supervised Detection, Segmentation and Tracking of Table
Grapes with Limited and Noisy Data [7.754321012552764]
現代のアルゴリズムはデータに飢えており、最高のパフォーマンスの教師付きアプローチを適用するのに十分なデータを集めることは必ずしも不可能である。
本稿では,精密農業応用における最先端検出・分節化に必要なデータを削減するために,弱教師付きソリューションを提案する。
我々は,ラベル付き画像がほとんどなく,非常に単純なラベル付けで高い性能を達成できる新しいモデルをいかに訓練できるかを示す。
論文 参考訳(メタデータ) (2022-08-27T12:58:42Z) - End-to-end deep learning for directly estimating grape yield from
ground-based imagery [53.086864957064876]
本研究は, ブドウ畑の収量推定に深層学習と併用した近位画像の応用を実証する。
オブジェクト検出、CNN回帰、トランスフォーマーモデルという3つのモデルアーキテクチャがテストされた。
本研究は,ブドウの収量予測における近位画像と深層学習の適用性を示した。
論文 参考訳(メタデータ) (2022-08-04T01:34:46Z) - Bamboo: Building Mega-Scale Vision Dataset Continually with
Human-Machine Synergy [69.07918114341298]
大規模データセットはコンピュータビジョンにおいて重要な役割を果たす。
既存のデータセットはラベルシステムに従って収集されるか、サンプルを区別せずに盲目的に収集される。
我々は,包括的ラベルシステム上で,積極的に注釈付きかつ継続的な高品質な視覚データセットの構築を提唱する。
論文 参考訳(メタデータ) (2022-03-15T13:01:00Z) - Anomaly Clustering: Grouping Images into Coherent Clusters of Anomaly
Types [60.45942774425782]
我々は異常クラスタリングを導入し、その目標はデータを異常型の一貫性のあるクラスタにまとめることである。
これは異常検出とは違い、その目標は異常を通常のデータから分割することである。
パッチベースの事前訓練されたディープ埋め込みとオフザシェルフクラスタリング手法を用いた,単純で効果的なクラスタリングフレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-21T23:11:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。