論文の概要: Real-Time On-the-Go Annotation Framework Using YOLO for Automated Dataset Generation
- arxiv url: http://arxiv.org/abs/2512.01165v1
- Date: Mon, 01 Dec 2025 00:54:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.618011
- Title: Real-Time On-the-Go Annotation Framework Using YOLO for Automated Dataset Generation
- Title(参考訳): YOLOを用いたリアルタイムオンザゴーアノテーションフレームワークによるデータセット自動生成
- Authors: Mohamed Abdallah Salem, Ahmed Harb Rabia,
- Abstract要約: 本稿では,エッジデバイス上にデプロイされたYOLOモデルを利用した新しいリアルタイムアノテーション手法を提案する。
我々の分析には詳細な統計テストと学習力学が含まれており、事前訓練された構成と単クラス構成の顕著な利点を示している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Efficient and accurate annotation of datasets remains a significant challenge for deploying object detection models such as You Only Look Once (YOLO) in real-world applications, particularly in agriculture where rapid decision-making is critical. Traditional annotation techniques are labor-intensive, requiring extensive manual labeling post data collection. This paper presents a novel real-time annotation approach leveraging YOLO models deployed on edge devices, enabling immediate labeling during image capture. To comprehensively evaluate the efficiency and accuracy of our proposed system, we conducted an extensive comparative analysis using three prominent YOLO architectures (YOLOv5, YOLOv8, YOLOv12) under various configurations: single-class versus multi-class annotation and pretrained versus scratch-based training. Our analysis includes detailed statistical tests and learning dynamics, demonstrating significant advantages of pretrained and single-class configurations in terms of model convergence, performance, and robustness. Results strongly validate the feasibility and effectiveness of our real-time annotation framework, highlighting its capability to drastically reduce dataset preparation time while maintaining high annotation quality.
- Abstract(参考訳): データセットの効率的かつ正確なアノテーションは、現実のアプリケーション、特に迅速な意思決定が重要な農業において、You Only Look Once (YOLO)のようなオブジェクト検出モデルをデプロイする上で、依然として重要な課題である。
従来のアノテーション技術は労働集約的であり、大量の手作業によるデータ収集を必要とする。
本稿では,エッジデバイス上にデプロイされたYOLOモデルを利用して,画像キャプチャ中に即時ラベリングを可能にする,新しいリアルタイムアノテーション手法を提案する。
提案システムの有効性と精度を網羅的に評価するために,3つのYOLOアーキテクチャ (YOLOv5, YOLOv8, YOLOv12) を多種多様な構成で比較検討した。
我々の分析には、詳細な統計テストと学習力学が含まれており、モデル収束性、性能、堅牢性の観点から、事前訓練済みおよび単クラス構成の顕著な利点を示す。
その結果,高アノテーション品質を維持しつつデータセット作成時間を劇的に短縮する能力を強調し,リアルタイムアノテーションフレームワークの有効性と有効性を強く検証した。
関連論文リスト
- Analysis of Transferability Estimation Metrics for Surgical Phase Recognition [3.3285108719932555]
微調整された事前学習モデルは現代の機械学習の基盤となり、限られたラベル付きデータで実践者がハイパフォーマンスを達成できるようになった。
専門的アノテーションが特に時間がかかり費用がかかる外科的ビデオ解析では、下流タスクに最適な事前学習モデルを特定することが重要かつ困難である。
我々は,2つの多様なデータセット上で,LogME,H-Score,TransRateの3つの代表的な指標の総合ベンチマークを行った。
論文 参考訳(メタデータ) (2025-08-22T18:05:33Z) - A Review of YOLOv12: Attention-Based Enhancements vs. Previous Versions [0.5639904484784127]
YOLOv12は、リアルタイムのパフォーマンスを維持しながら注意ベースの拡張をうまく組み込む、新しいアプローチを導入している。
本稿では、計算効率のよい自己注意領域を含む、YOLOv12のアーキテクチャ革新を包括的にレビューする。
従来のYOLOバージョンと競合するオブジェクト検出器に対してYOLOv12をベンチマークし、精度、推論速度、計算効率の改善点を分析した。
論文 参考訳(メタデータ) (2025-04-16T11:40:55Z) - Underlying Semantic Diffusion for Effective and Efficient In-Context Learning [113.4003355229632]
Underlying Semantic Diffusion (US-Diffusion)は、セマンティック学習、計算効率、文脈内学習能力を高める拡張拡散モデルである。
本稿では,フィードバック信号を利用したフィードバック支援学習(FAL)フレームワークを提案する。
また,高雑音レベルの時間ステップで高密度サンプリングを行うためのプラグイン・アンド・プレイの効率的なサンプリング戦略(ESS)を提案する。
論文 参考訳(メタデータ) (2025-03-06T03:06:22Z) - YOLOv12: A Breakdown of the Key Architectural Features [0.5639904484784127]
YOLOv12は、単一ステージのリアルタイム物体検出において重要な進歩である。
最適化されたバックボーン(R-ELAN)、分離可能な7x7の畳み込み、およびFlashAttention駆動のエリアベースアテンションが組み込まれている。
レイテンシに敏感なアプリケーションと高精度なアプリケーションの両方にスケーラブルなソリューションを提供する。
論文 参考訳(メタデータ) (2025-02-20T17:08:43Z) - Context is Key: A Benchmark for Forecasting with Essential Textual Information [87.3175915185287]
コンテキスト is Key" (CiK) は、数値データを多種多様なテキストコンテキストと組み合わせた予測ベンチマークである。
我々は,統計モデル,時系列基礎モデル,LLMに基づく予測モデルなど,さまざまなアプローチを評価する。
提案手法は,提案するベンチマークにおいて,他の試験手法よりも優れる簡易かつ効果的なLCMプロンプト法である。
論文 参考訳(メタデータ) (2024-10-24T17:56:08Z) - Imposing Consistency for Optical Flow Estimation [73.53204596544472]
プロキシタスクによる一貫性の導入は、データ駆動学習を強化することが示されている。
本稿では,光フロー推定のための新しい,効果的な整合性戦略を提案する。
論文 参考訳(メタデータ) (2022-04-14T22:58:30Z) - Weakly Supervised Video Salient Object Detection [79.51227350937721]
本稿では,relabeled relabeled "fixation guided scribble annotations" に基づく最初の弱教師付きビデオサリエント物体検出モデルを提案する。
効果的なマルチモーダル学習と長期時間文脈モデリングを実現するために,「アプレンス・モーション・フュージョン・モジュール」と双方向のConvLSTMベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2021-04-06T09:48:38Z) - Interactive Weak Supervision: Learning Useful Heuristics for Data
Labeling [19.24454872492008]
弱監督は、基礎的な真理ラベルなしでラベル付きデータセットを作成するための有望な代替手段を提供する。
本稿では,対話型弱監督のための最初のフレームワークを開発し,その手法が反復を提案し,ユーザフィードバックから学習する。
私たちの実験は、非常に競争力のあるテストセット性能を達成するモデルのトレーニングに少数のフィードバックが必要であることを示しています。
論文 参考訳(メタデータ) (2020-12-11T00:10:38Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。