論文の概要: YOLO26-RipeLoc Lite: A lightweight architecture for tomato ripeness detection and picking point localization in greenhouse robotic harvesting
- arxiv url: http://arxiv.org/abs/2605.27129v1
- Date: Tue, 26 May 2026 15:00:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:42.283543
- Title: YOLO26-RipeLoc Lite: A lightweight architecture for tomato ripeness detection and picking point localization in greenhouse robotic harvesting
- Title(参考訳): YOLO26-RipeLoc Lite:温室ロボット収穫におけるトマトの熟度検出とピックポイントの局所化のための軽量アーキテクチャ
- Authors: Rajmeet Singh, Manveen Kaur, Shahpour Alirezaee, Irfan Hussain,
- Abstract要約: 本稿では,温室トマトの同時検出,熟度分類,中心位置定位のためのYOLO26-RipeLoc Liteを提案する。
YOLO26-RipeLoc Liteは92.9%のmAP@0.5(95.2%のリップ、90.6%のアンリップ)を達成し、全ての評価されたアーキテクチャの中で最高精度(95.2%)を達成している。
- 参考スコア(独自算出の注目度): 1.5466093929120728
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In greenhouse tomato production, automated harvesting requires accurate detection of ripe tomatoes, ripeness classification, and precise picking-point localization for robotic end-effectors. This paper proposes YOLO26-RipeLoc Lite, a lightweight deep learning architecture based on YOLO26 for simultaneous detection, ripeness classification, and center-point localization of greenhouse tomatoes. The model introduces three modifications: (1) a Lightweight Feature Pyramid Network (LFPN) with depthwise separable convolutions for efficient multi-scale fusion, (2) a Ripeness-Aware Attention Module (RAAM) with dual pooling and a learnable ripeness bias vector for enhanced color-texture discrimination, and (3) a Compact Detection Head (CDH) with shared convolutions and an integrated center-point regression branch for direct grasp planning. The model is evaluated on a custom dataset of 1,500 images with 6,227 instances (3,566 ripe, 2,661 unripe) from the SILAL greenhouse, Abu Dhabi, UAE. YOLO26-RipeLoc Lite achieves mAP@0.5 of 92.9% (95.2% ripe, 90.6% unripe) with the highest precision (95.2%) among all evaluated architectures using only 2.38M parameters. Post-training BatchNorm pruning at 30% reduces parameters to ~1.8M with negligible accuracy loss. Ablation studies confirm that greenhouse-aware HSV augmentation provides the largest improvement (+2.02 pp mAP@50), backbone freezing achieves peak precision (93.8%), and 3-phase progressive unfreezing yields the best localization quality (mAP@50:95 of 64.6%). Comparisons with YOLOv8n/s, YOLO11n/s, YOLO12n/s, and YOLO26s confirm superior accuracy-efficiency: 2.9 pp higher precision than YOLO12n with 7.0% fewer parameters and integrated center-point localization for robotic end-effector guidance.
- Abstract(参考訳): 温室トマト生産では、自動収穫には、熟したトマトの正確な検出、熟度分類、ロボットエンドエフェクターの正確なピックポイント位置決めが必要である。
本稿では, YOLO26に基づく軽量ディープラーニングアーキテクチャであるYOLO26-RipeLoc Liteを提案する。
本モデルでは,(1)高効率マルチスケール核融合のための深度分離可能な畳み込みを有する軽量特徴ピラミッドネットワーク(LFPN),(2)双対プーリングを備えたリピーネス意識モジュール(RAAM),およびカラーテクスチャ識別を向上するための学習可能なリピーネスバイアスベクター,(3)共有畳み込みを用いたコンパクト検出ヘッド(CDH),および直接把握計画のための統合センターポイント回帰ブランチの3つの変更を導入する。
このモデルは、UAEのアブダビにあるSILALの温室から、6,227のインスタンス(3,566リピー、2,661アンリピー)を持つ1500の画像のカスタムデータセットで評価されている。
YOLO26-RipeLoc Liteは92.9%のmAP@0.5(95.2%のリップ、90.6%のアンリップ)を達成し、全ての評価されたアーキテクチャの中では238万のパラメータしか使用していない。
トレーニング後のBatchNormプルーニングの30%は、パラメータを無視できる精度の損失で~1.8Mに削減する。
アブレーション研究により、温室効果のあるHSV増強が最大の改善(+2.02ppmAP@50)、背骨凍結がピーク精度(93.8%)、そして3相進行凍結が最高の局所化品質(64.6%のmAP@50:95)をもたらすことが確認された。
YOLOv8n/s, YOLO11n/s, YOLO12n/s, YOLO26sと比較すると精度は良好である。
関連論文リスト
- Delta-Based Neural Architecture Search: LLM Fine-Tuning via Code Diffs [48.83701310501069]
大規模言語モデル(LLM)は、ニューラルアーキテクチャ生成の強力な可能性を示している。
既存のアプローチは、ゼロから完全なモデル実装を生成します。
我々はデルタ符号生成法を提案し、細調整されたLLMはコンパクトな統一差分を生成する。
論文 参考訳(メタデータ) (2026-05-06T13:32:05Z) - GDA-YOLO11: Amodal Instance Segmentation for Occlusion-Robust Robotic Fruit Harvesting [3.088218970976369]
本稿では,新しいアモーダルセグメンテーションモデル GDA-YOLO11 を用いた収穫フレームワークを提案する。
収量率は92.59%、85.18%、48.14%、22.22%に達する。
論文 参考訳(メタデータ) (2026-02-27T11:56:33Z) - A Comparative Benchmark of Real-time Detectors for Blueberry Detection towards Precision Orchard Management [2.667064587590596]
本研究では,先進的リアルタイム物体検出器の比較ベンチマーク解析を行った。
このデータセットは、2022-2023シーズンにスマートフォンで収集された671枚の天蓋画像からなる。
YOLOモデルのうち、YOLOv12mはmAP@50の93.3%で最高の精度を達成した。
論文 参考訳(メタデータ) (2025-09-24T21:42:24Z) - An Improved YOLOv8 Approach for Small Target Detection of Rice Spikelet Flowering in Field Environments [1.0288898584996287]
そこで本研究では,改良型YOLOv8オブジェクト検出モデルに基づく水稲の穂花認識手法を提案する。
BiFPNは、オリジナルのPANet構造を置き換えることで、機能融合を強化し、マルチスケールの機能利用を改善する。
フィールド条件下でのコメ開花のデータセットが公開されていないため、高解像度のRGBカメラとデータ拡張技術が用いられている。
論文 参考訳(メタデータ) (2025-07-28T04:01:29Z) - YOLOv13: Real-Time Object Detection with Hypergraph-Enhanced Adaptive Visual Perception [58.06752127687312]
高精度で軽量な物体検出器YOLOv13を提案する。
ハイパーグラフに基づく適応相関強化(HyperACE)機構を提案する。
また,FullPAD(Full-Pipeline Aggregation-and-Distribution)パラダイムを提案する。
論文 参考訳(メタデータ) (2025-06-21T15:15:03Z) - Assessing the Capability of YOLO- and Transformer-based Object Detectors for Real-time Weed Detection [0.0]
YOLOv8, YOLOv9, YOLOv10, RT-DETRのすべての利用可能なモデルは、実地状況の画像を用いて訓練され、評価される。
その結果、評価された指標では、全てのモデルが等しくよく機能するのに対し、YOLOv9モデルは強いリコールスコアの点で際立っていることがわかった。
RT-DETRモデル、特にRT-DETR-lは、データセット1では82.44 %、データセット2では81.46 %の精度で優れている。
論文 参考訳(メタデータ) (2025-01-29T02:39:57Z) - EATFormer: Improving Vision Transformer Inspired by Evolutionary Algorithm [111.17100512647619]
本稿では、実証された実用的な進化的アルゴリズム(EA)と類似したビジョントランスフォーマーの合理性を説明する。
本稿では,EA ベースのトランス (EAT) ブロックのみを含む新しいピラミッド EATFormer バックボーンを提案する。
画像分類,下流タスク,説明実験に関する大規模かつ定量的な実験は,我々のアプローチの有効性と優位性を示すものである。
論文 参考訳(メタデータ) (2022-06-19T04:49:35Z) - Alexa Teacher Model: Pretraining and Distilling Multi-Billion-Parameter
Encoders for Natural Language Understanding Systems [63.713297451300086]
本研究では,700Mから9.3Bまでの非埋め込みパラメータ数を持つ事前学習エンコーダの大規模実験結果について述べる。
その後、17M-170Mパラメータからより小さなモデルに蒸留し、仮想アシスタントシステムの自然言語理解(NLU)コンポーネントに応用した。
論文 参考訳(メタデータ) (2022-06-15T20:44:23Z) - Non-Parametric Adaptive Network Pruning [125.4414216272874]
アルゴリズム設計を簡略化するノンパラメトリックモデリングを導入。
顔認識コミュニティに触発されて,メッセージパッシングアルゴリズムを用いて,適応的な例示数を求める。
EPrunerは「重要」フィルタを決定する際にトレーニングデータへの依存を壊します。
論文 参考訳(メタデータ) (2021-01-20T06:18:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。