論文の概要: VajraV1 -- The most accurate Real Time Object Detector of the YOLO family
- arxiv url: http://arxiv.org/abs/2512.13834v1
- Date: Mon, 15 Dec 2025 19:16:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-17 16:49:26.462038
- Title: VajraV1 -- The most accurate Real Time Object Detector of the YOLO family
- Title(参考訳): VajraV1 - YOLOファミリーの最も正確なリアルタイムオブジェクト検出器
- Authors: Naman Balbir Singh Makkar,
- Abstract要約: この技術報告では、既存のYOLOベースの検出器に対するアーキテクチャ強化を導入するVajraV1モデルアーキテクチャについて紹介する。
VajraV1は、従来のYOLOモデルからの効果的な設計選択を組み合わせることで、最先端の精度を実現する。
COCO検証セットでは、VajraV1-Nanoが44.3% mAPを獲得し、YOLOv12-Nを3.7%、YOLOv13-Nを2.7%上回っている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent years have seen significant advances in real-time object detection, with the release of YOLOv10, YOLO11, YOLOv12, and YOLOv13 between 2024 and 2025. This technical report presents the VajraV1 model architecture, which introduces architectural enhancements over existing YOLO-based detectors. VajraV1 combines effective design choices from prior YOLO models to achieve state-of-the-art accuracy among real-time object detectors while maintaining competitive inference speed. On the COCO validation set, VajraV1-Nano achieves 44.3% mAP, outperforming YOLOv12-N by 3.7% and YOLOv13-N by 2.7% at latency competitive with YOLOv12-N and YOLOv11-N. VajraV1-Small achieves 50.4% mAP, exceeding YOLOv12-S and YOLOv13-S by 2.4%. VajraV1-Medium achieves 52.7% mAP, outperforming YOLOv12-M by 0.2%. VajraV1-Large achieves 53.7% mAP, surpassing YOLOv13-L by 0.3%. VajraV1-Xlarge achieves 56.2% mAP, outperforming all existing real-time object detectors.
- Abstract(参考訳): 近年では、2024年から2025年の間にYOLOv10、YOLO11、YOLOv12、YOLOv13がリリースされ、リアルタイム物体検出が大幅に進歩している。
この技術報告では、既存のYOLOベースの検出器に対するアーキテクチャ強化を導入するVajraV1モデルアーキテクチャについて紹介する。
VajraV1は、従来のYOLOモデルからの効果的な設計選択を組み合わせることで、競合する推論速度を維持しながら、リアルタイムオブジェクト検出器の最先端の精度を実現する。
COCO検証セットでは、VajraV1-Nanoが44.3% mAPを獲得し、YOLOv12-Nを3.7%、YOLOv13-Nを2.7%上回った。
VajraV1-Smallは50.4%のmAPを達成し、YOLOv12-SとYOLOv13-Sを2.4%上回る。
VajraV1-Mediumは52.7%のmAPを達成し、YOLOv12-Mを0.2%上回る。
VajraV1-Large は 53.7% mAP に達し、YOLOv13-L を 0.3% 上回っている。
VajraV1-Xlargeは56.2%のmAPを達成し、既存の全てのリアルタイム物体検出器より優れている。
関連論文リスト
- YOLO-DS: Fine-Grained Feature Decoupling via Dual-Statistic Synergy Operator for Object Detection [55.58092342624062]
DSO(Dual-Statistic Synergy Operator)を中心に構築されたYOLO-DSを提案する。
YOLO-DSは、チャネル平均とピーク平均差を共同でモデル化することにより、オブジェクトの特徴を分離する。
MS-COCOベンチマークでは、YOLO-DSは5つのモデルスケールでYOLOv8を上回っている。
論文 参考訳(メタデータ) (2026-01-26T05:50:32Z) - YOLO-Drone: An Efficient Object Detection Approach Using the GhostHead Network for Drone Images [0.0]
本稿では,GhostHead Network と呼ばれる YOLOv11 アルゴリズムのヘッドネットワークの拡張について紹介する。
この改良を取り入れたモデルはYOLO-Droneと呼ばれている。
実験の結果, YOLO-Droneは従来のYOLOv11に比べて精度, リコール, F1-Score, mAP (0.5) などのキー検出精度を著しく向上した。
論文 参考訳(メタデータ) (2025-11-14T02:32:57Z) - YOLOv13: Real-Time Object Detection with Hypergraph-Enhanced Adaptive Visual Perception [58.06752127687312]
高精度で軽量な物体検出器YOLOv13を提案する。
ハイパーグラフに基づく適応相関強化(HyperACE)機構を提案する。
また,FullPAD(Full-Pipeline Aggregation-and-Distribution)パラダイムを提案する。
論文 参考訳(メタデータ) (2025-06-21T15:15:03Z) - Improved YOLOv12 with LLM-Generated Synthetic Data for Enhanced Apple Detection and Benchmarking Against YOLOv11 and YOLOv10 [0.4143603294943439]
YOLOv12nは0.916で最高精度、0.969で最高リコール、0.978で最高平均平均精度(mAP@50)を達成した。
この技術は、農業分野における広範な手動データ収集の必要性を減らし、コスト効率のよいソリューションも提供した。
論文 参考訳(メタデータ) (2025-02-26T20:24:01Z) - YOLO Evolution: A Comprehensive Benchmark and Architectural Review of YOLOv12, YOLO11, and Their Previous Versions [0.0]
本研究は, YOLOv3から最新のYOLOv12への包括的実験評価である。
考慮すべき課題は、さまざまなオブジェクトサイズ、多様なアスペクト比、単一クラスの小さなオブジェクトである。
分析では各YOLOバージョンの特徴的長所と短所を強調した。
論文 参考訳(メタデータ) (2024-10-31T20:45:00Z) - YOLO11 and Vision Transformers based 3D Pose Estimation of Immature Green Fruits in Commercial Apple Orchards for Robotic Thinning [0.4143603294943439]
商業用果樹果樹における未熟リンゴ(フルーツレット)の3次元ポーズ推定法を開発した。
YOLO11(またはYOLOv11)オブジェクト検出とポーズ推定アルゴリズムとViT(Vision Transformers)を併用して深度推定を行う。
YOLO11nは、ボックス精度と精度の点で、YOLO11とYOLOv8のすべての構成を上回った。
論文 参考訳(メタデータ) (2024-10-21T17:00:03Z) - Comprehensive Performance Evaluation of YOLOv12, YOLO11, YOLOv10, YOLOv9 and YOLOv8 on Detecting and Counting Fruitlet in Complex Orchard Environments [0.9565934024763958]
本研究は, YOLOv8, YOLOv9, YOLOv10, YOLO11( or YOLOv11) および YOLOv12 オブジェクト検出アルゴリズムの性能評価を行った。
YOLOv12lは、他の全てのYOLOモデルと比較して0.90のリコール率を記録した。
YOLOv11nは2.4msで最高速度を達成し、YOLOv8n (4.1ms)、YOLOv9 Gelan-s (11.5ms)、YOLOv10n (5.5ms)、YOLOv12nを上回った。
論文 参考訳(メタデータ) (2024-07-01T17:59:55Z) - YOLOv10: Real-Time End-to-End Object Detection [68.28699631793967]
リアルタイムオブジェクト検出の分野では,YOLOが主流のパラダイムとして浮上している。
非最大抑圧(NMS)による処理後ハマーによるYOLOのエンドツーエンドデプロイメントへの依存。
YOLOの総合的効率-精度駆動型モデル設計戦略を紹介する。
論文 参考訳(メタデータ) (2024-05-23T11:44:29Z) - YOLO-World: Real-Time Open-Vocabulary Object Detection [87.08732047660058]
オープン語彙検出機能でYOLOを強化する革新的なアプローチであるYOLO-Worldを紹介する。
提案手法は,ゼロショット方式で広範囲の物体を高効率で検出する。
YOLO-WorldはV100上で52.0 FPSの35.4 APを達成した。
論文 参考訳(メタデータ) (2024-01-30T18:59:38Z) - YOLO-MS: Rethinking Multi-Scale Representation Learning for Real-time Object Detection [63.36722419180875]
YOLO-MSと呼ばれる効率的かつ高性能な物体検出器を提供する。
私たちは、他の大規模なデータセットに頼ることなく、MS COCOデータセット上でYOLO-MSをスクラッチからトレーニングします。
私たちの作業は、他のYOLOモデルのプラグイン・アンド・プレイモジュールとしても機能します。
論文 参考訳(メタデータ) (2023-08-10T10:12:27Z) - A lightweight and accurate YOLO-like network for small target detection
in Aerial Imagery [94.78943497436492]
小型ターゲット検出のためのシンプルで高速で効率的なネットワークであるYOLO-Sを提案する。
YOLO-SはDarknet20をベースとした小さな特徴抽出器と、バイパスと連結の両方を通じて接続をスキップする。
YOLO-Sはパラメータサイズが87%減少し、約半分のFLOPがYOLOv3となり、低消費電力の産業用アプリケーションに実用化された。
論文 参考訳(メタデータ) (2022-04-05T16:29:49Z) - YOLOX: Exceeding YOLO Series in 2021 [25.734980783220976]
我々は、YOLO検出器をアンカーフリーに切り換え、他の高度な検出技術を実行する。
0.91Mパラメータと1.08G FLOPしか持たないYOLO-Nanoでは、COCOで25.3%のAPが取得でき、NanoDetを1.8%上回っている。
YOLOv4-CSP, YOLOv5-Lとほぼ同じパラメータを持つYOLOX-Lでは、Tesla V100で68.9 FPSの速度でCOCOで50.0%APを達成する。
論文 参考訳(メタデータ) (2021-07-18T12:55:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。