論文の概要: A Comparative Study of Modern Object Detectors for Robust Apple Detection in Orchard Imagery
- arxiv url: http://arxiv.org/abs/2604.09996v1
- Date: Sat, 11 Apr 2026 02:56:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:15.785397
- Title: A Comparative Study of Modern Object Detectors for Robust Apple Detection in Orchard Imagery
- Title(参考訳): オーチャード画像におけるロバストアップル検出用モダン物体検出器の比較検討
- Authors: Mohammed Asad, Ajai Kumar Gautam, Priyanshu Dhiman, Rishi Raj Prajapati,
- Abstract要約: 本研究は,AppleBBCH81データセットを用いた単一クラスリンゴ検出のベンチマークを確立する。
検証分割では、YOLOv10nが最も厳格なローカライゼーション性能を達成する。
YOLOv10nは最高F1スコアを獲得し、RT-DETR-Lは非常に高いリコールを達成できるが、精度は低い。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate apple detection in orchard images is important for yield prediction, fruit counting, robotic harvesting, and crop monitoring. However, changing illumination, leaf clutter, dense fruit clusters, and partial occlusion make detection difficult. To provide a fair and reproducible comparison, this study establishes a controlled benchmark for single-class apple detection on the public AppleBBCH81 dataset using one deterministic train, validation, and test split and a unified evaluation protocol across six representative detectors: YOLOv10n, YOLO11n, RT-DETR-L, Faster R-CNN (ResNet50-FPN), FCOS (ResNet50-FPN), and SSDLite320 (MobileNetV3-Large). Performance is evaluated primarily using COCO-style mAP@0.5 and mAP@0.5:0.95, and threshold-dependent behavior is further analyzed using precision-recall curves and fixed-threshold precision, recall, and F1-score at IoU = 0.5. On the validation split, YOLO11n achieves the best strict localization performance with mAP@0.5:0.95 = 0.6065 and mAP@0.5 = 0.9620, followed closely by RT-DETR-L and YOLOv10n. At a fixed operating point with confidence >= 0.05, YOLOv10n attains the highest F1-score, whereas RT-DETR-L achieves very high recall but low precision because of many false positives at low confidence. These findings show that detector selection for orchard deployment should be guided not only by localization-aware accuracy but also by threshold robustness and the requirements of the downstream task.
- Abstract(参考訳): 果樹園画像におけるリンゴの正確な検出は、収穫予測、果実の数え上げ、ロボット収穫、作物のモニタリングに重要である。
しかし, 照度, 落葉, 濃厚果房, 部分閉塞などの変化は, 検出を困難にしている。
本研究は,AppleBBCH81データセット上で,1つの決定論的トレイン,検証,テストスプリットを用いた単一クラスリンゴ検出のための制御ベンチマークと,YOLOv10n, YOLO11n, RT-DETR-L, Faster R-CNN (ResNet50-FPN), FCOS (ResNet50-FPN), SSDLite320 (MobileNetV3-Large) の6つの代表検出器を対象とした統一評価プロトコルを確立する。
主にCOCO式mAP@0.5とmAP@0.5:0.95を用いて評価し、IoU = 0.5で精度-リコール曲線と固定閾値精度、リコール、F1スコアを用いてしきい値依存性の挙動を解析した。
検証分割で、YOLO11nはmAP@0.5:0.95 = 0.6065、mAP@0.5 = 0.9620、RT-DETR-LとYOLOv10nで、最も厳密なローカライゼーション性能を達成する。
信頼度 >= 0.05 の固定動作点において、YOLOv10n は F1 スコアが最も高く、RT-DETR-L は低い信頼度で多くの偽陽性があるため、非常に高いリコールを達成できるが、精度は低い。
これらの結果から, 果樹園展開のための検出器選択は, 位置認識精度だけでなく, しきい値の堅牢性や下流作業の要求によっても導かれることが示唆された。
関連論文リスト
- BloomNet: Exploring Single vs. Multiple Object Annotation for Flower Recognition Using YOLO Variants [0.0]
本稿では, YOLOv5s, YOLOv8n/s/m, YOLOv12nなどのYOLOアーキテクチャを2つのアノテーション条件下でのオブジェクト検出のためにベンチマークする。
6つの異なる花種の2,816枚の高解像度写真からなるFloralSixデータセットも導入された。
論文 参考訳(メタデータ) (2026-02-20T19:47:45Z) - CVeDRL: An Efficient Code Verifier via Difficulty-aware Reinforcement Learning [57.24524263804788]
コード検証は、LLMベースのコード生成の検証後において重要な役割を果たす。
既存の教師付き微調整手法は、データの不足、高い失敗率、推論効率の低下に悩まされている。
機能的な報酬しか持たない単純RLは、難しいブランチやサンプルに対して効果的な単体テストを生成することができないことを示す。
論文 参考訳(メタデータ) (2026-01-30T10:33:29Z) - N-EIoU-YOLOv9: A Signal-Aware Bounding Box Regression Loss for Lightweight Mobile Detection of Rice Leaf Diseases [0.6280530476948474]
N EIoU YOLOv9は信号認識ボックス回帰損失に基づく軽量検出フレームワークである。
提案した損失は,非単調焦点と非結合幅と高さ最適化を組み合わせることで局所化勾配を推定する。
このデザインは農業病の画像でよく見られる小・低コントラストターゲットに対して特に有効である。
論文 参考訳(メタデータ) (2026-01-14T05:13:36Z) - Vision-Based Driver Drowsiness Monitoring: Comparative Analysis of YOLOv5-v11 Models [0.0]
ドライバーの眠気は道路事故の重要な要因であり、毎年数千人の死者と負傷の原因となっている。
本稿では,コンピュータビジョンに基づくYOLOアルゴリズムに着目し,リアルタイムで非侵襲的な眠気検出手法の総合評価を行う。
論文 参考訳(メタデータ) (2025-09-22T08:30:02Z) - A Lightweight and Robust Framework for Real-Time Colorectal Polyp Detection Using LOF-Based Preprocessing and YOLO-v11n [2.4896276458398785]
本研究では,ポリプ検出のための新しい,軽量で効率的なフレームワークを提案する。
ノイズの多いデータをフィルタリングするLocal Outlier Factorアルゴリズムと、YOLO-v11nディープラーニングモデルを組み合わせる。
従来のYOLO法と比較して精度と効率が向上した。
論文 参考訳(メタデータ) (2025-07-14T23:36:54Z) - RF-DETR Object Detection vs YOLOv12 : A Study of Transformer-based and CNN-based Architectures for Single-Class and Multi-Class Greenfruit Detection in Complex Orchard Environments Under Label Ambiguity [0.8488322025656239]
本研究では,RF-DETRオブジェクト検出ベースモデルとYOLOv12オブジェクト検出モデル構成の詳細な比較を行う。
単一クラス (greenfruit) とマルチクラス (occluded and non-ococuded greenfruits) アノテーションを備えたカスタムデータセットが開発された。
DINOv2のバックボーンと変形可能なアテンションを利用するRF-DETRモデルは、グローバルなコンテキストモデリングにおいて優れている。
YOLOv12はCNNベースの注意をローカル特徴抽出の強化に利用し、計算効率とエッジデプロイメントに最適化した。
論文 参考訳(メタデータ) (2025-04-17T17:08:11Z) - Robust Fine-tuning of Zero-shot Models via Variance Reduction [56.360865951192324]
微調整ゼロショットモデルの場合、このデシドラトゥムは細調整モデルで、分布内(ID)と分布外(OOD)の両方で優れる。
トレードオフを伴わずに最適なIDとOODの精度を同時に達成できるサンプルワイズアンサンブル手法を提案する。
論文 参考訳(メタデータ) (2024-11-11T13:13:39Z) - Guided Score identity Distillation for Data-Free One-Step Text-to-Image Generation [62.30570286073223]
拡散に基づくテキスト・画像生成モデルは、テキスト記述と整合した画像を生成する能力を実証している。
本研究では, 実データにアクセスすることなく, 事前学習した拡散モデルの効率的な蒸留を可能にする, データフリーガイド蒸留法を提案する。
データフリー蒸留法は, 1ステップ生成装置で生成した合成画像のみをトレーニングすることにより, FIDとCLIPのスコアを急速に向上させ, 競争力のあるCLIPスコアを維持しつつ, 最先端のFID性能を実現する。
論文 参考訳(メタデータ) (2024-06-03T17:44:11Z) - Towards General Robustness Verification of MaxPool-based Convolutional Neural Networks via Tightening Linear Approximation [51.235583545740674]
MaxLinは、線形近似が厳密なMaxPoolベースのCNNの堅牢性検証器である。
我々は、MNIST、CIFAR-10、Tiny ImageNetデータセットでトレーニングされたLeNetやネットワークを含むオープンソースのベンチマークでMaxLinを評価した。
論文 参考訳(メタデータ) (2024-06-02T10:33:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。