論文の概要: Do Generative Metrics Predict YOLO Performance? An Evaluation Across Models, Augmentation Ratios, and Dataset Complexity
- arxiv url: http://arxiv.org/abs/2602.18525v1
- Date: Fri, 20 Feb 2026 03:02:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-24 17:42:02.136343
- Title: Do Generative Metrics Predict YOLO Performance? An Evaluation Across Models, Augmentation Ratios, and Dataset Complexity
- Title(参考訳): 生成メトリクスはYOLO性能を予測するか? モデル、増大率、データセットの複雑さを評価する
- Authors: Vasile Marian, Yong-Bin Kang, Alexander Buddery,
- Abstract要約: 本報告では, YOLOv11の合成増強の制御された評価法について述べる。
実際のトレーニングスプリットの10%から150%の増大率に対して, GAN, 拡散, ハイブリッドベースの6つのジェネレータをベンチマークした。
データセット生成/拡張設定毎に、マッチしたサイズのブートストラッププロトコルで事前トレーニングデータセットメトリクスを計算する。
- 参考スコア(独自算出の注目度): 43.338311770275745
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Synthetic images are increasingly used to augment object-detection training sets, but reliably evaluating a synthetic dataset before training remains difficult: standard global generative metrics (e.g., FID) often do not predict downstream detection mAP. We present a controlled evaluation of synthetic augmentation for YOLOv11 across three single-class detection regimes -- Traffic Signs (sparse/near-saturated), Cityscapes Pedestrian (dense/occlusion-heavy), and COCO PottedPlant (multi-instance/high-variability). We benchmark six GAN-, diffusion-, and hybrid-based generators over augmentation ratios from 10% to 150% of the real training split, and train YOLOv11 both from scratch and with COCO-pretrained initialization, evaluating on held-out real test splits (mAP@0.50:0.95). For each dataset-generator-augmentation configuration, we compute pre-training dataset metrics under a matched-size bootstrap protocol, including (i) global feature-space metrics in both Inception-v3 and DINOv2 embeddings and (ii) object-centric distribution distances over bounding-box statistics. Synthetic augmentation yields substantial gains in the more challenging regimes (up to +7.6% and +30.6% relative mAP in Pedestrian and PottedPlant, respectively) but is marginal in Traffic Signs and under pretrained fine-tuning. To separate metric signal from augmentation quantity, we report both raw and augmentation-controlled (residualized) correlations with multiple-testing correction, showing that metric-performance alignment is strongly regime-dependent and that many apparent raw associations weaken after controlling for augmentation level.
- Abstract(参考訳): 合成画像は、オブジェクト検出トレーニングセットの強化にますます使用されているが、トレーニング前に合成データセットを確実に評価することは困難である。
本報告では, 交通標識(希少/中飽和), 都市景観歩行者(デンス/隠蔽重), COCO PottedPlant(多変量/高変量)の3つの単一クラス検出系を対象に, YOLOv11の合成増強の制御評価を行った。
実際のトレーニングスプリットの10%から150%の増倍率に対して, GAN, 拡散, ハイブリッドベースの6つのジェネレータをベンチマークし, YOLOv11をスクラッチとCOCO事前初期化の両方で訓練し, 保留実テストスプリット(mAP@0.50:0.95)を評価した。
データセットジェネレータ拡張設定毎に、マッチしたサイズのブートストラッププロトコルで事前トレーニングされたデータセットメトリクスを計算します。
i) Inception-v3 と DINOv2 の埋め込みにおけるグローバルな特徴空間メトリクス
(ii) 境界ボックス統計上の対象中心分布距離。
合成増強はより困難な体制(ペデストリアンでは+7.6%、ポッテッドプラントでは+30.6%)でかなりの増加をもたらすが、交通標識と事前訓練された微調整の下では限界である。
拡張量からメートル法信号を分離するために,拡張度を制御した生・生の相関関係と多重検定補正の相関関係を報告し,メートル法性能アライメントが強く,拡張度を制御した後に明らかな生の関連が弱まることを示した。
関連論文リスト
- Enhancing Diversity and Feasibility: Joint Population Synthesis from Multi-source Data Using Generative Models [4.73459038844245]
本研究では,WGAN(Wasserstein Generative Adversarial Network)と勾配ペナルティを用いたマルチソースデータセットを同時に統合・合成する手法を提案する。
その結果,提案手法は逐次ベースラインより優れ,リコールは7%,精度は15%向上した。
合成個体群はエージェントベースモデル(ABM)のキー入力として機能するため、このマルチソース生成手法はABMの精度と信頼性を大幅に向上させる可能性がある。
論文 参考訳(メタデータ) (2026-02-17T00:02:30Z) - Silent Inconsistency in Data-Parallel Full Fine-Tuning: Diagnosing Worker-Level Optimization Misalignment [27.352639822596146]
クロスワーカーの損失と勾配のばらつきは、従来の監視信号では見えない。
本稿では,標準パイプラインで容易に利用できるトレーニング信号を用いて,作業者レベルの一貫性を定量化する,モデルに依存しない診断フレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-16T04:42:30Z) - Spanning Training Progress: Temporal Dual-Depth Scoring (TDDS) for Enhanced Dataset Pruning [50.809769498312434]
我々は、時間的デュアルディープス・スコーリング(TDDS)と呼ばれる新しいデータセット・プルーニング手法を提案する。
本手法は,10%のトレーニングデータで54.51%の精度を達成し,ランダム選択を7.83%以上,他の比較手法を12.69%以上上回る結果を得た。
論文 参考訳(メタデータ) (2023-11-22T03:45:30Z) - MELEP: A Novel Predictive Measure of Transferability in Multi-Label ECG Diagnosis [1.3654846342364306]
本稿では,事前学習したモデルから下流のECG診断タスクへの知識伝達の有効性を推定する手段であるMELEPを紹介する。
実験により、MELEPは、小・不均衡のECGデータに基づいて、事前学習した畳み込みと繰り返しの深部ニューラルネットワークの性能を予測できることを示した。
論文 参考訳(メタデータ) (2023-10-27T14:57:10Z) - Joint Metrics Matter: A Better Standard for Trajectory Forecasting [67.1375677218281]
マルチモーダル・トラジェクトリ・予測法 : シングルエージェント・メトリクス(マージナル・メトリクス)を用いた評価
余分な指標にのみ注目することは、グループとして明確に一緒に歩いている人々のために、軌跡の衝突や軌跡のばらつきといった、不自然な予測につながる可能性がある。
本稿では,JADE,JFDE,衝突速度といったマルチエージェントメトリクス(ジョイントメトリクス)に関して,最先端トラジェクトリ予測手法の総合評価を行った。
論文 参考訳(メタデータ) (2023-05-10T16:27:55Z) - Implicit Counterfactual Data Augmentation for Robust Learning [24.795542869249154]
本研究では, 突発的相関を除去し, 安定した予測を行うために, インプリシト・カウンセショナル・データ拡張法を提案する。
画像とテキストのデータセットをカバーする様々なバイアス付き学習シナリオで実験が行われてきた。
論文 参考訳(メタデータ) (2023-04-26T10:36:40Z) - Semi-supervised Contrastive Learning with Similarity Co-calibration [72.38187308270135]
SsCL(Semi-supervised Contrastive Learning)と呼ばれる新しいトレーニング戦略を提案する。
ssclは、自己教師付き学習におけるよく知られたコントラスト損失と、半教師付き学習におけるクロスエントロピー損失を組み合わせる。
SsCLはより差別的な表現を生じさせ,ショット学習に有益であることを示す。
論文 参考訳(メタデータ) (2021-05-16T09:13:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。