Fugu-MT 論文翻訳(概要): Comprehensive Performance Evaluation of YOLOv12, YOLO11, YOLOv10, YOLOv9 and YOLOv8 on Detecting and Counting Fruitlet in Complex Orchard Environments

論文の概要: Comprehensive Performance Evaluation of YOLOv12, YOLO11, YOLOv10, YOLOv9 and YOLOv8 on Detecting and Counting Fruitlet in Complex Orchard Environments

arxiv url: http://arxiv.org/abs/2407.12040v7
Date: Tue, 25 Feb 2025 23:00:05 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-27 15:24:45.994833
Title: Comprehensive Performance Evaluation of YOLOv12, YOLO11, YOLOv10, YOLOv9 and YOLOv8 on Detecting and Counting Fruitlet in Complex Orchard Environments
Title（参考訳）: 複雑なオーチャード環境下での果実の検出と測定におけるYOLOv12, YOLO11, YOLOv10, YOLOv9, YOLOv8の総合的性能評価
Authors: Ranjan Sapkota, Zhichao Meng, Martin Churuvija, Xiaoqiang Du, Zenghong Ma, Manoj Karkee,
Abstract要約: 本研究は, YOLOv8, YOLOv9, YOLOv10, YOLO11( or YOLOv11) および YOLOv12 オブジェクト検出アルゴリズムの性能評価を行った。 YOLOv12lは、他の全てのYOLOモデルと比較して0.90のリコール率を記録した。 YOLOv11nは2.4msで最高速度を達成し、YOLOv8n (4.1ms)、YOLOv9 Gelan-s (11.5ms)、YOLOv10n (5.5ms)、YOLOv12nを上回った。
参考スコア（独自算出の注目度）: 0.9565934024763958
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This study systematically performed an extensive real-world evaluation of the performances of all configurations of YOLOv8, YOLOv9, YOLOv10, YOLO11( or YOLOv11), and YOLOv12 object detection algorithms in terms of precision, recall, mean Average Precision at 50\% Intersection over Union (mAP@50), and computational speeds including pre-processing, inference, and post-processing times immature green apple (or fruitlet) detection in commercial orchards. Additionally, this research performed and validated in-field counting of the fruitlets using an iPhone and machine vision sensors. Among the configurations, YOLOv12l recorded the highest recall rate at 0.90, compared to all other configurations of YOLO models. Likewise, YOLOv10x achieved the highest precision score of 0.908, while YOLOv9 Gelan-c attained a precision of 0.903. Analysis of mAP@0.50 revealed that YOLOv9 Gelan-base and YOLOv9 Gelan-e reached peak scores of 0.935, with YOLO11s and YOLOv12l following closely at 0.933 and 0.931, respectively. For counting validation using images captured with an iPhone 14 Pro, the YOLO11n configuration demonstrated outstanding accuracy, recording RMSE values of 4.51 for Honeycrisp, 4.59 for Cosmic Crisp, 4.83 for Scilate, and 4.96 for Scifresh; corresponding MAE values were 4.07, 3.98, 7.73, and 3.85. Similar performance trends were observed with RGB-D sensor data. Moreover, sensor-specific training on Intel Realsense data significantly enhanced model performance. YOLOv11n achieved highest inference speed of 2.4 ms, outperforming YOLOv8n (4.1 ms), YOLOv9 Gelan-s (11.5 ms), YOLOv10n (5.5 ms), and YOLOv12n (4.6 ms), underscoring its suitability for real-time object detection applications. (YOLOv12 architecture, YOLOv11 Architecture, YOLOv12 object detection, YOLOv11 object detecion, YOLOv12 segmentation)
Abstract（参考訳）: 本研究は, YOLOv8, YOLOv9, YOLOv10, YOLOv11(またはYOLOv11), YOLOv12オブジェクト検出アルゴリズムを, 精度, リコール, 平均平均平均平均精度50\%の連邦間断面積(mAP@50), および前処理, 推論, 後処理時間などの計算速度で, 全構成のYOLOv8, YOLOv9, YOLOv10, YOLOv11(またはYOLOv11), YOLOv12オブジェクト検出アルゴリズムの性能評価を行った。さらに,本研究では,iPhoneおよびマシンビジョンセンサを用いて,果実のフィールド内計測を行い,検証した。 YOLOv12lのリコールレートは、他の全てのYOLOモデルと比較して0.90だった。また、YOLOv10xは0.908で最高点を獲得し、YOLOv9 Gelan-cは0.903で最高点に達した。 mAP@0.50の分析の結果, YOLOv9 Gelan-base と YOLOv9 Gelan-e は 0.935 となり, YOLO11s と YOLOv12l はそれぞれ 0.933 と 0.931 に近かった。 iPhone 14 Proで撮影した画像を用いた検証では、YOLO11nの構成では、HoneycrispのRMSE値が4.51、Cosmic Crispの4.59、Scilateの4.83、Sifreshの4.96、対応するMAE値が4.07、3.98、7.73、および3.85であった。 RGB-Dセンサーデータでも同様のパフォーマンス傾向が観察された。さらに、Intel Realsenseデータに対するセンサ固有のトレーニングにより、モデルパフォーマンスが大幅に向上した。 YOLOv11nは2.4msで最高速度を達成し、YOLOv8n (4.1ms)、YOLOv9 Gelan-s (11.5ms)、YOLOv10n (5.5ms)、YOLOv12n (4.6ms)を上回り、リアルタイムオブジェクト検出アプリケーションに適合していると評価した。 (YOLOv12アーキテクチャ、YOLOv11アーキテクチャ、YOLOv12オブジェクト検出、YOLOv11オブジェクトデテシオン、YOLOv12セグメンテーション)

関連論文リスト

YOLOE: Real-Time Seeing Anything [64.35836518093342]
YOLOEは、様々なオープンプロンプト機構をまたいだ検出とセグメンテーションを、単一の高効率モデルに統合する。 YOLOEの例外的なゼロショット性能と高い推論効率と訓練コストの低い転送性。
論文参考訳（メタデータ） (2025-03-10T15:42:59Z)
Improved YOLOv12 with LLM-Generated Synthetic Data for Enhanced Apple Detection and Benchmarking Against YOLOv11 and YOLOv10 [0.4143603294943439]
YOLOv12nは0.916で最高精度、0.969で最高リコール、0.978で最高平均平均精度(mAP@50)を達成した。この技術は、農業分野における広範な手動データ収集の必要性を減らし、コスト効率のよいソリューションも提供した。
論文参考訳（メタデータ） (2025-02-26T20:24:01Z)
YOLOv12: Attention-Centric Real-Time Object Detectors [38.507511985479006]
本稿では,従来のCNNをベースとしたYOLOフレームワークであるYOLOv12を提案する。 YOLOv12は、競合速度の精度で、一般的なリアルタイムオブジェクト検出器を全て上回っている。
論文参考訳（メタデータ） (2025-02-18T04:20:14Z)
Evaluating the Evolution of YOLO (You Only Look Once) Models: A Comprehensive Benchmark Study of YOLO11 and Its Predecessors [0.0]
本研究では,YOLOv3から最新のYOLO11まで,YOLO(You Only Look Once)アルゴリズムのベンチマーク解析を行った。トラフィックシグネチャ(さまざまなオブジェクトサイズを持つ)、アフリカ野生生物(多彩なアスペクト比と画像当たりのオブジェクトの少なくとも1つのインスタンス)、および船と船舶(単一のクラスの小さなオブジェクトを持つ)の3つの多様なデータセットでパフォーマンスを評価する。
論文参考訳（メタデータ） (2024-10-31T20:45:00Z)
Comparing YOLO11 and YOLOv8 for instance segmentation of occluded and non-occluded immature green fruits in complex orchard environment [0.4143603294943439]
本研究は、果樹園における未成熟リンゴのYOLO11とYOLOv8のインスタンスセグメンテーション機能に焦点を当てた。 YOLO11n-セグはすべてのカテゴリーで最高のマスク精度を達成し、スコアは0.831であった。 YOLO11m-segは、ボックスとマスクのセグメンテーションで最高スコアを記録した。
論文参考訳（メタデータ） (2024-10-24T00:12:20Z)
YOLO11 and Vision Transformers based 3D Pose Estimation of Immature Green Fruits in Commercial Apple Orchards for Robotic Thinning [0.4143603294943439]
商業用果樹果樹における未熟リンゴ(フルーツレット)の3次元ポーズ推定法を開発した。 YOLO11オブジェクト検出とポーズ推定アルゴリズムとViT(Vision Transformers)を併用して深度推定を行う。 YOLO11nは、ボックス精度と精度の点で、YOLO11とYOLOv8のすべての構成を上回った。
論文参考訳（メタデータ） (2024-10-21T17:00:03Z)
YOLOv10: Real-Time End-to-End Object Detection [68.28699631793967]
リアルタイムオブジェクト検出の分野では,YOLOが主流のパラダイムとして浮上している。非最大抑圧(NMS)による処理後ハマーによるYOLOのエンドツーエンドデプロイメントへの依存。 YOLOの総合的効率-精度駆動型モデル設計戦略を紹介する。
論文参考訳（メタデータ） (2024-05-23T11:44:29Z)
YOLO-World: Real-Time Open-Vocabulary Object Detection [87.08732047660058]
オープン語彙検出機能でYOLOを強化する革新的なアプローチであるYOLO-Worldを紹介する。提案手法は,ゼロショット方式で広範囲の物体を高効率で検出する。 YOLO-WorldはV100上で52.0 FPSの35.4 APを達成した。
論文参考訳（メタデータ） (2024-01-30T18:59:38Z)
YOLO-MS: Rethinking Multi-Scale Representation Learning for Real-time Object Detection [80.11152626362109]
YOLO-MSと呼ばれる効率的かつ高性能な物体検出器を提供する。私たちは、他の大規模なデータセットに頼ることなく、MS COCOデータセット上でYOLO-MSをスクラッチからトレーニングします。私たちの仕事は、他のYOLOモデルのプラグイン・アンド・プレイ・モジュールとしても使えます。
論文参考訳（メタデータ） (2023-08-10T10:12:27Z)
YOLOv6 v3.0: A Full-Scale Reloading [9.348857966505111]
ネットワークアーキテクチャとトレーニングスキームに関して,多数の新たな拡張を施したYOLOv6を更新する。 YOLOv6-Nは、NVIDIA Tesla T4 GPUでテストされた1187 FPSのスループットでCOCOデータセットで37.5%APに達した。 YOLOv6-Sは484 FPSで45.0%のAPを攻撃し、他の主流検出器よりも高速である。
論文参考訳（メタデータ） (2023-01-13T14:46:46Z)
A lightweight and accurate YOLO-like network for small target detection in Aerial Imagery [94.78943497436492]
小型ターゲット検出のためのシンプルで高速で効率的なネットワークであるYOLO-Sを提案する。 YOLO-SはDarknet20をベースとした小さな特徴抽出器と、バイパスと連結の両方を通じて接続をスキップする。 YOLO-Sはパラメータサイズが87%減少し、約半分のFLOPがYOLOv3となり、低消費電力の産業用アプリケーションに実用化された。
論文参考訳（メタデータ） (2022-04-05T16:29:49Z)
Workshop on Autonomous Driving at CVPR 2021: Technical Report for Streaming Perception Challenge [57.647371468876116]
本稿では,現実的な自律運転シナリオのためのリアルタイム2次元物体検出システムについて紹介する。私たちの検出器は、YOLOXと呼ばれる新しい設計のYOLOモデルで構築されています。 Argoverse-HDデータセットでは,検出のみのトラック/トラックで2位を7.8/6.1上回る41.0ストリーミングAPを達成した。
論文参考訳（メタデータ） (2021-07-27T06:36:06Z)
YOLOX: Exceeding YOLO Series in 2021 [25.734980783220976]
我々は、YOLO検出器をアンカーフリーに切り換え、他の高度な検出技術を実行する。 0.91Mパラメータと1.08G FLOPしか持たないYOLO-Nanoでは、COCOで25.3%のAPが取得でき、NanoDetを1.8%上回っている。 YOLOv4-CSP, YOLOv5-Lとほぼ同じパラメータを持つYOLOX-Lでは、Tesla V100で68.9 FPSの速度でCOCOで50.0%APを達成する。
論文参考訳（メタデータ） (2021-07-18T12:55:11Z)
PP-YOLO: An Effective and Efficient Implementation of Object Detector [44.189808709103865]
本稿では, 相対的に効率と効率のバランスの取れた物体検出器を実装した。 YOLOv3が実際に広く利用されていることを踏まえ, YOLOv3に基づく新しい物体検出器を開発した。本論文のすべての実験はPaddlePaddleに基づいて行われるので、PP-YOLOと呼ぶ。
論文参考訳（メタデータ） (2020-07-23T16:06:16Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。