論文の概要: An RGB-D Image Dataset for Lychee Detection and Maturity Classification for Robotic Harvesting
- arxiv url: http://arxiv.org/abs/2510.16800v1
- Date: Sun, 19 Oct 2025 11:47:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 00:56:39.151479
- Title: An RGB-D Image Dataset for Lychee Detection and Maturity Classification for Robotic Harvesting
- Title(参考訳): ロボットハーベスティングのためのライチー検出と成熟度分類のためのRGB-D画像データセット
- Authors: Zhenpeng Zhang, Yi Wang, Shanglei Chai, Yingying Liu, Zekai Xie, Wenhao Huang, Pengyu Li, Zipei Luo, Dajiang Lu, Yibin Tian,
- Abstract要約: ライチー(Lychee)は、高価値の亜熱帯の果実である。
視覚に基づく収穫ロボットの採用は生産性を著しく向上させる。
現在、一貫して包括的なアノテートされたオープンソースのlycheeデータセットは存在しない。
- 参考スコア(独自算出の注目度): 20.028328464541456
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Lychee is a high-value subtropical fruit. The adoption of vision-based harvesting robots can significantly improve productivity while reduce reliance on labor. High-quality data are essential for developing such harvesting robots. However, there are currently no consistently and comprehensively annotated open-source lychee datasets featuring fruits in natural growing environments. To address this, we constructed a dataset to facilitate lychee detection and maturity classification. Color (RGB) images were acquired under diverse weather conditions, and at different times of the day, across multiple lychee varieties, such as Nuomici, Feizixiao, Heiye, and Huaizhi. The dataset encompasses three different ripeness stages and contains 11,414 images, consisting of 878 raw RGB images, 8,780 augmented RGB images, and 1,756 depth images. The images are annotated with 9,658 pairs of lables for lychee detection and maturity classification. To improve annotation consistency, three individuals independently labeled the data, and their results were then aggregated and verified by a fourth reviewer. Detailed statistical analyses were done to examine the dataset. Finally, we performed experiments using three representative deep learning models to evaluate the dataset. It is publicly available for academic
- Abstract(参考訳): ライチー(Lychee)は、高価値の亜熱帯の果実である。
視覚に基づく収穫ロボットの採用は、労働への依存を減らしながら生産性を著しく向上させる。
高品質なデータは、このような収穫ロボットの開発に不可欠である。
しかし、現在、自然の生育環境で果物を特徴とする、一貫して包括的な注釈付けされたオープンソースのライチーデータセットは存在しない。
そこで我々は,ライチー検出と成熟度分類を容易にするデータセットを構築した。
色(RGB)画像は、様々な気象条件下で取得され、その日の異なる時期には、ヌオミチ、フィジキアオ、ハイ、フアイジなどの複数のリスキー品種にまたがって取得された。
データセットは3つの異なる熟成段階を含み、11,414の画像を含み、878の生のRGB画像、8,780のRGB画像、1,756の深度画像で構成されている。
画像には、ライチー検出と成熟度分類のための9,658対のラブルが注釈付けされている。
アノテーションの一貫性を改善するために、3人の個人が独立してデータをラベル付けし、その結果を第4のレビュアーが集計して検証した。
データセットを調べるために詳細な統計分析を行った。
最後に,3つの代表的なディープラーニングモデルを用いて実験を行い,データセットの評価を行った。
学術的にも公開されている。
関連論文リスト
- Bridging the Gap Between Ideal and Real-world Evaluation: Benchmarking AI-Generated Image Detection in Challenging Scenarios [54.07895223545793]
本稿では,実世界ロバストネスデータセット(RRDataset)を導入し,3次元にわたる検出モデルの包括的評価を行う。
RRDatasetには7つの主要なシナリオの高品質なイメージが含まれている。
我々はRRDataset上で17の検出器と10の視覚言語モデル(VLM)をベンチマークし、大規模な人間実験を行った。
論文 参考訳(メタデータ) (2025-09-11T06:15:52Z) - Tomato Multi-Angle Multi-Pose Dataset for Fine-Grained Phenotyping [10.807010511060042]
TomatoMAPはSolanum lycopersicumの包括的なデータセットである。
我々のデータセットには64,464枚のRGB画像が含まれており、4つのカメラ高度角から12の異なる植物ポーズを捉えています。
我々は,3,616個の高解像度画像サブセットをピクセル単位で意味づけし,細粒度表現のためのインスタンスセグメンテーションアノテーションを提供する。
論文 参考訳(メタデータ) (2025-07-15T12:56:13Z) - Attention-Based Ensemble Learning for Crop Classification Using Landsat 8-9 Fusion [3.342115421418929]
本研究は,中部パンジャブの灌水地域における作物被覆の同定に焦点をあてる。
データ収集は2つの段階で実行された。
第2段階では、ラベル付きデータセットを構築するために、各ジオコードフィールドのLandsat 8-9画像を取得する。
論文 参考訳(メタデータ) (2025-06-23T06:09:39Z) - Merging synthetic and real embryo data for advanced AI predictions [69.07284335967019]
我々は、作成した2つのデータセットを用いて、2つの生成モデルをトレーニングし、既存の1つのデータセットを使用して、様々な細胞レベルで合成胚画像を生成する。
これらは実画像と組み合わせて、胚細胞ステージ予測のための分類モデルを訓練した。
その結果,実データと合成画像を組み合わせることで分類性能が向上し,実データのみをトレーニングした場合の94.5%に比べて97%の精度が得られた。
論文 参考訳(メタデータ) (2024-12-02T08:24:49Z) - SatSynth: Augmenting Image-Mask Pairs through Diffusion Models for Aerial Semantic Segmentation [69.42764583465508]
我々は,地球観測における注釈付きデータの不足に対処するために,生成的画像拡散の可能性を探る。
我々の知る限りでは、衛星セグメンテーションのための画像と対応するマスクの両方を最初に生成する。
論文 参考訳(メタデータ) (2024-03-25T10:30:22Z) - Learning from Synthetic Data for Visual Grounding [55.21937116752679]
そこで本研究では,SynGroundが市販のビジョン・アンド・ランゲージモデルのローカライズ能力を向上できることを示す。
SynGroundで生成されたデータは、事前訓練されたALBEFモデルとBLIPモデルのポインティングゲーム精度をそれぞれ4.81%、絶対パーセンテージポイント17.11%向上させる。
論文 参考訳(メタデータ) (2024-03-20T17:59:43Z) - Detection of Spider Mites on Labrador Beans through Machine Learning
Approaches Using Custom Datasets [0.0]
本研究では, 実環境下で収集したRGBおよびNIRデータを, JAI FS-1600D-10GEカメラを用いて, RGBNデータセットを構築することで, 植物病検出のための視覚機械学習手法を提案する。
YOLOv8とシーケンシャルCNNを用いた2段階早期植物病検出モデルを用いて、部分ラベル付きデータセットのトレーニングを行い、単一段階のエンドツーエンドセグメンテーションモデルと比較して3.6%のmAP増加を示した。
ResNet15とシーケンシャルCNNモデルを用いたRGBと比較して、RGBNを用いて平均6.25%の検証精度が向上した。
論文 参考訳(メタデータ) (2024-02-12T18:57:06Z) - Stable Diffusion for Data Augmentation in COCO and Weed Datasets [5.81198182644659]
生成モデルは、コンピュータビジョンからインテリアデザインまで、さまざまなタスクに影響を与えている。強力な拡散モデルであるStable Diffusionは、テキストプロンプトや参照画像から複雑な詳細を持つ高解像度画像の作成を可能にする。
本研究は,7つの共通カテゴリーと3つの広く分布する雑草を評価した結果,安定拡散の有効性について検討した。
画像スパースデータセットの強化において,安定拡散の可能性を示した。
論文 参考訳(メタデータ) (2023-12-07T02:23:32Z) - End-to-end deep learning for directly estimating grape yield from
ground-based imagery [53.086864957064876]
本研究は, ブドウ畑の収量推定に深層学習と併用した近位画像の応用を実証する。
オブジェクト検出、CNN回帰、トランスフォーマーモデルという3つのモデルアーキテクチャがテストされた。
本研究は,ブドウの収量予測における近位画像と深層学習の適用性を示した。
論文 参考訳(メタデータ) (2022-08-04T01:34:46Z) - Classification of Seeds using Domain Randomization on Self-Supervised
Learning Frameworks [0.0]
鍵となるボトルネックは、畳み込みニューラルネットワーク(CNN)をトレーニングする大量のラベル付きデータの必要性である。
この研究は、これを達成するために、コントラスト学習とドメインランダム化の概念を活用している。
実世界の画像の表象的サンプル作物から生成された合成画像の使用は、大量のテスト対象の必要性を軽減する。
論文 参考訳(メタデータ) (2021-03-29T12:50:06Z) - Random Network Distillation as a Diversity Metric for Both Image and
Text Generation [62.13444904851029]
我々は、どんな種類のデータにも、どんな種類のデータにも、自然にも適用できる新しい多様性指標を開発した。
私たちはこのメトリクスを画像とテキストの両方で検証し、デプロイします。
論文 参考訳(メタデータ) (2020-10-13T22:03:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。