Fugu-MT 論文翻訳(概要): A Comprehensive Review of YOLO Architectures in Computer Vision: From YOLOv1 to YOLOv8 and YOLO-NAS

論文の概要: A Comprehensive Review of YOLO Architectures in Computer Vision: From YOLOv1 to YOLOv8 and YOLO-NAS

arxiv url: http://arxiv.org/abs/2304.00501v7
Date: Sun, 4 Feb 2024 22:38:15 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-07 06:53:27.412368
Title: A Comprehensive Review of YOLO Architectures in Computer Vision: From YOLOv1 to YOLOv8 and YOLO-NAS
Title（参考訳）: コンピュータビジョンにおけるYOLOアーキテクチャの概要:YOLOv1からYOLOv8とYOLO-NAS
Authors: Juan Terven and Diana Cordova-Esparza
Abstract要約: YOLOは、ロボット工学、無人運転車、およびビデオ監視アプリケーションのための中心的なリアルタイムオブジェクト検出システムとなっている。本稿では,YOLOの進化を包括的に分析し,元のYOLOからYOLOv8,YOLO-NAS,YOLOをトランスフォーマーとしたYOLOまでの各イテレーションにおけるイノベーションとコントリビューションについて検討する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: YOLO has become a central real-time object detection system for robotics, driverless cars, and video monitoring applications. We present a comprehensive analysis of YOLO's evolution, examining the innovations and contributions in each iteration from the original YOLO up to YOLOv8, YOLO-NAS, and YOLO with Transformers. We start by describing the standard metrics and postprocessing; then, we discuss the major changes in network architecture and training tricks for each model. Finally, we summarize the essential lessons from YOLO's development and provide a perspective on its future, highlighting potential research directions to enhance real-time object detection systems.
Abstract（参考訳）: YOLOは、ロボット工学、無人運転車、ビデオ監視アプリケーションのための中心的なリアルタイムオブジェクト検出システムになっている。本稿では、YOLOの進化を総合的に分析し、元のYOLOからYOLOv8, YOLO-NAS, YOLOをトランスフォーマーで比較した。まず、標準メトリクスと後処理を説明し、次に、ネットワークアーキテクチャにおける大きな変化と各モデルに対するトレーニングトリックについて論じる。最後に, YOLOの開発から重要な教訓を要約し, リアルタイム物体検出システムの実現に向けた研究の方向性を明らかにする。

関連論文リスト

YOLOA: Real-Time Affordance Detection via LLM Adapter [96.61111291833544]
Affordance Detectionは、インボディードAIにおける基本的な"ハウツーハウ"の課題に共同で対処することを目的としている。本稿では、オブジェクト検出と空き学習を協調的に扱うリアルタイムな空き検出モデルであるYOLO Affordance(YOLOA)を紹介する。 ADG-Det と IIT-Heat のベンチマーク実験により,YOLOA がリアルタイム性能を維持しながら最先端の精度を実現していることが示された。
論文参考訳（メタデータ） (2025-12-03T03:53:31Z)
Ultralytics YOLO Evolution: An Overview of YOLO26, YOLO11, YOLOv8 and YOLOv5 Object Detectors for Computer Vision and Pattern Recognition [3.2882817259131403]
本稿では、対象検出器のUltralytics YOLO(You Only Look Once)ファミリーについて概観する。レビューは、最新のリリースであるYOLO26(またはYOLOv26)から始まる。本論文は,密接なシーン制限,ハイブリッドCNN-Transformer統合,オープン語彙検出,エッジ認識トレーニングアプローチなど,課題と今後の方向性を明らかにする。
論文参考訳（メタデータ） (2025-10-06T23:28:44Z)
YOLOv1 to YOLOv11: A Comprehensive Survey of Real-Time Object Detection Innovations and Challenges [0.0]
YOLO(You Only Look Once)モデルは、統合されたエンドツーエンド検出フレームワークを通じて、リアルタイム視覚アプリケーションのランドスケープを変換します。本稿では, アーキテクチャの革新, パフォーマンスベンチマーク, 拡張機能, 実世界のユースケースを取り上げ, YOLOファミリーの総合的なレビューを行う。我々は、YOLOモデルの進化を批判的に分析し、様々なコンピュータビジョン領域にまたがる影響を拡大する新たな研究方向について議論する。
論文参考訳（メタデータ） (2025-08-04T05:13:51Z)
YOLO-Count: Differentiable Object Counting for Text-to-Image Generation [49.79896127854202]
YOLO-Countは、一般的なカウント問題に対処し、テキスト・ツー・イメージ(T2I)生成のための正確な量制御を可能にする、微分可能なオープン語彙オブジェクトカウントモデルである。コアコントリビューションは、オブジェクトサイズと空間分布のバリエーションを考慮に入れた、新しい回帰ターゲットである「心電図」である。
論文参考訳（メタデータ） (2025-08-01T15:51:39Z)
YOLOE: Real-Time Seeing Anything [64.35836518093342]
YOLOEは、様々なオープンプロンプト機構をまたいだ検出とセグメンテーションを、単一の高効率モデルに統合する。 YOLOEの例外的なゼロショット性能と高い推論効率と訓練コストの低い転送性。
論文参考訳（メタデータ） (2025-03-10T15:42:59Z)
ODverse33: Is the New YOLO Version Always Better? A Multi Domain benchmark from YOLO v5 to v11 [6.553031877558699]
主要な疑問は、新しいYOLOバージョンのリリース頻度の増加にある。各YOLOバージョンの中核となるイノベーションはどのようなもので、これらの変更が実際のパフォーマンス向上にどのように変換されるのか? 本稿では、YOLOv1からYOLOv11への重要なイノベーションを要約し、ODverse33と呼ばれる包括的なベンチマークを導入し、実世界のマルチドメインアプリケーションにおけるモデル改善の実践的影響について検討する。
論文参考訳（メタデータ） (2025-02-20T06:57:58Z)
YOLOv8 to YOLO11: A Comprehensive Architecture In-depth Comparative Review [0.0]
本研究では,最新の4つのYOLOモデルについて,包括的かつ詳細なアーキテクチャ比較を行った。分析の結果、YOLOの各バージョンはアーキテクチャと特徴抽出が改善されているが、特定のブロックは変更されていないことがわかった。
論文参考訳（メタデータ） (2025-01-23T05:57:13Z)
YOLOv1 to YOLOv10: The fastest and most accurate real-time object detection systems [13.925576406783991]
本稿では、最新の技術的観点から、YOLOシリーズの特徴を再検討する。我々は,過去10年間のYOLOシリーズの提案手法が,その後の技術の発展にどのように影響しているかを,より詳しく検討する。
論文参考訳（メタデータ） (2024-08-18T02:11:00Z)
Hyper-YOLO: When Visual Object Detection Meets Hypergraph Computation [74.65906322148997]
本稿では,画像特徴量間の複雑な高次相関を捉えるためにハイパーグラフ計算を統合する新しいオブジェクト検出手法を提案する。 Hyper-YOLOは、高度なYOLOv8-NとYOLOv9Tを12%のtextval$と9%のAPMoonLabの改善で大幅に上回っている。
論文参考訳（メタデータ） (2024-08-09T01:21:15Z)
YOLOv5, YOLOv8 and YOLOv10: The Go-To Detectors for Real-time Vision [0.6662800021628277]
本稿では、YOLOv5, YOLOv8, YOLOv10に着目し、YOLO(You Only Look Once)オブジェクト検出アルゴリズムの進化に焦点を当てた。これらのバージョンにまたがるエッジデプロイメントのアーキテクチャの進歩、パフォーマンスの改善、適合性を分析します。
論文参考訳（メタデータ） (2024-07-03T10:40:20Z)
Comprehensive Performance Evaluation of YOLO11, YOLOv10, YOLOv9 and YOLOv8 on Detecting and Counting Fruitlet in Complex Orchard Environments [0.9565934024763958]
本研究は, 商業果樹園における緑果検出のためのYOLOv8, YOLOv9, YOLOv10, YOLO11の全構成(Total 22)を対象に, You Only Look Once (YOLO) オブジェクト検出アルゴリズムを広範囲に評価した。この研究は、iPhoneとマシンビジョンセンサーを使って、Scifresh、Scilate、Honeycrisp、Cosmic Crispの4種類のリンゴをフィールドで数えたことも検証した。
論文参考訳（メタデータ） (2024-07-01T17:59:55Z)
YOLOv10 to Its Genesis: A Decadal and Comprehensive Review of The You Only Look Once (YOLO) Series [6.751138557596013]
本研究は, YOLOv10からYOLOv9, YOLOv8, その後のバージョンに至るまで, YOLOアルゴリズムが導入した進歩について検討する。この研究は、自動車安全、医療、工業製造、監視、農業の5つの重要な分野におけるYOLOの変革的な影響を強調している。
論文参考訳（メタデータ） (2024-06-12T06:41:23Z)
YOLOv10: Real-Time End-to-End Object Detection [68.28699631793967]
リアルタイムオブジェクト検出の分野では,YOLOが主流のパラダイムとして浮上している。非最大抑圧(NMS)による処理後ハマーによるYOLOのエンドツーエンドデプロイメントへの依存。 YOLOの総合的効率-精度駆動型モデル設計戦略を紹介する。
論文参考訳（メタデータ） (2024-05-23T11:44:29Z)
YOLO-World: Real-Time Open-Vocabulary Object Detection [87.08732047660058]
オープン語彙検出機能でYOLOを強化する革新的なアプローチであるYOLO-Worldを紹介する。提案手法は,ゼロショット方式で広範囲の物体を高効率で検出する。 YOLO-WorldはV100上で52.0 FPSの35.4 APを達成した。
論文参考訳（メタデータ） (2024-01-30T18:59:38Z)
YOLO-MS: Rethinking Multi-Scale Representation Learning for Real-time Object Detection [80.11152626362109]
YOLO-MSと呼ばれる効率的かつ高性能な物体検出器を提供する。私たちは、他の大規模なデータセットに頼ることなく、MS COCOデータセット上でYOLO-MSをスクラッチからトレーニングします。私たちの仕事は、他のYOLOモデルのプラグイン・アンド・プレイ・モジュールとしても使えます。
論文参考訳（メタデータ） (2023-08-10T10:12:27Z)
SSMTL++: Revisiting Self-Supervised Multi-Task Learning for Video Anomaly Detection [108.57862846523858]
自己教師型マルチタスク学習フレームワークを再考し、元の手法にいくつかのアップデートを提案する。マルチヘッド・セルフアテンション・モジュールを導入することで3次元畳み込みバックボーンを近代化する。モデルをさらに改良するために,セグメントマップの予測などの自己指導型学習タスクについて検討した。
論文参考訳（メタデータ） (2022-07-16T19:25:41Z)
A lightweight and accurate YOLO-like network for small target detection in Aerial Imagery [94.78943497436492]
小型ターゲット検出のためのシンプルで高速で効率的なネットワークであるYOLO-Sを提案する。 YOLO-SはDarknet20をベースとした小さな特徴抽出器と、バイパスと連結の両方を通じて接続をスキップする。 YOLO-Sはパラメータサイズが87%減少し、約半分のFLOPがYOLOv3となり、低消費電力の産業用アプリケーションに実用化された。
論文参考訳（メタデータ） (2022-04-05T16:29:49Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。