論文の概要: Train, Test, Re-evaluate: Schedule-Sensitive Evaluation of Generative Data for Hand Detection
- arxiv url: http://arxiv.org/abs/2606.01896v1
- Date: Mon, 01 Jun 2026 08:38:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:31.620606
- Title: Train, Test, Re-evaluate: Schedule-Sensitive Evaluation of Generative Data for Hand Detection
- Title(参考訳): 電車、テスト、再評価:手検出のための生成データのスケジュール感性評価
- Authors: Atmika Bhardwaj, Silvia Vock, Nico Steckhan,
- Abstract要約: 我々は6つのトレーニング・スケジュール体制の下でYOLOv8nハンド検出器を訓練する。
実験は、塗装されたアクセサリーデータから、実質的なリアルタイムデプロイの利点を抽出する。
- 参考スコア(独自算出の注目度): 0.5161531917413708
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generated (or synthetic) image data is increasingly used to augment or replace real training datasets when target imagery is scarce, expensive, or biased. For hand detection, particularly in occupational safety settings, public datasets mostly contain bare hands. This under-represents the variation in hand appearance introduced by gloves, tattoos, jewelry, and other personal protective equipment, creating a distribution shift that safety-critical applications encounter at deployment. We test whether generative inpainting, editing only the hand region of a real photograph to introduce accessories, can close this shift gap. On a paired dataset of real images and their synthetic counterparts, we train YOLOv8n hand detectors under six training-and-scheduling regimes (Experiments A-F, three random seeds each), evaluate every detector on a real test set and on a real-gloves-only test split, and report the mean average precision (mAP) at two overlap thresholds (mAP@0.5 and mAP@0.5:0.95) along with paired statistical tests. A two-stage experiment: train on real U synthetic data, then fine-tune the resulting weights on real-only at a lower learning rate, increases mAP@0.5 compared to the real-only baseline model on the standard real test set, and improves the real-gloves out-of-distribution gap. Another three-stage experiment preserves box-tightness best, reaching the highest mAP@0.5:0.95 of any other experiment in the study. The synthetic-data utility for safety-critical hand detection is determined by the training procedure, and simple multi-stage experiments extract substantial real-deployment benefit from inpainted accessory data.
- Abstract(参考訳): 生成された(あるいは合成された)画像データは、ターゲット画像が不足し、高価で、偏りがあるときに、実際のトレーニングデータセットを拡大または置き換えるために、ますます使用される。
手の検出、特に作業上の安全設定では、公開データセットは主に素手を含む。
このことは、手袋、タトゥー、宝石、その他の個人用防護具によって導入された手の外観の変化を過小評価し、安全クリティカルなアプリケーションが配置時に遭遇する分散シフトを生み出している。
実写写真の手領域のみを編集してアクセサリーを導入することで、このずれを解消できるかどうかを検証した。
実画像と合成画像のペアデータセットを用いて、6つの訓練・スケジューリング体制(実験A-F、3つのランダムシード)の下でYOLOv8nハンド検出器を訓練し、実検体と実検体のみのテスト分割ですべての検出器を評価し、平均平均精度(mAP@0.5とmAP@0.5:0.95)を2つの重み付きしきい値(mAP@0.5とmAP@0.5:0.95)で報告する。
2段階の実験では、実際のU合成データをトレーニングし、結果の重みをより低い学習速度でリアルタイムに調整し、標準の実検セットにおける実のみのベースラインモデルと比較してmAP@0.5を増大させ、リアルグローブのアウト・オブ・ディストリビューションギャップを改善する。
別の3段階の実験では、箱の厚さが最高であり、他の実験の中で最も高いmAP@0.5:0.95に達した。
本発明の安全クリティカル手指検出用合成データユーティリティは、トレーニング手順により決定され、簡易な多段階実験により、塗布されたアクセサリーデータから、実質的な実展開利益を抽出する。
関連論文リスト
- Few-Shot Synthetic Data Generation with Diffusion Models for Downstream Vision Tasks [36.94429692322632]
クラス不均衡は視覚認識において永続的な課題である。
稀なクラスの20~50個の実画像にLoRAアダプタを微調整する,軽量な合成データ拡張パイプラインを提案する。
論文 参考訳(メタデータ) (2026-05-12T10:11:57Z) - Synthetic Defect Image Generation for Power Line Insulator Inspection Using Multimodal Large Language Models [3.72557681438567]
ドローンの画像を定期的な検査に頼っている企業が増えているが、正確な欠陥型分類器の訓練は依然として難しい。
トレーニング不要な画像生成装置として,既製のマルチモーダル大言語モデル(MLLM)を用いて,このデータスカシティ設定に対処する。
現実的な低トレーニングデータ構造を持つ公開データセットを用いたセラミック絶縁体欠陥型分類の評価を行った。
論文 参考訳(メタデータ) (2026-03-09T08:06:27Z) - RealStats: A Rigorous Real-Only Statistical Framework for Fake Image Detection [3.4104142774745996]
本稿では,実画像に対して解釈可能な確率スコアを生成することに焦点を当てた,厳密で統計的に基盤付けられた偽画像検出フレームワークを提案する。
このフレームワークは汎用的でフレキシブルで、トレーニング不要で、多様な、進化する設定にわたって堅牢なフェイクイメージ検出に適している。
論文 参考訳(メタデータ) (2026-01-26T19:11:31Z) - Synthetic-to-Real Object Detection using YOLOv11 and Domain Randomization Strategies [0.0]
本稿では、合成データとドメインランダム化戦略のみを用いて、特定のオブジェクト(スープ缶)を検出するためのYOLOv11モデルを訓練することに焦点を当てる。
この方法論には、データ拡張、データセット合成、モデルスケーリングによる広範な実験が含まれる。
最高のパフォーマンス設定は、拡張され多様なデータセットでトレーニングされたYOLOv11lモデルで、競合の隠れテストセットで0.910のmAP@50を達成した。
論文 参考訳(メタデータ) (2025-09-18T15:08:54Z) - Testing Human-Hand Segmentation on In-Distribution and Out-of-Distribution Data in Human-Robot Interactions Using a Deep Ensemble Model [40.815678328617686]
我々は、IDデータとより挑戦的なOODシナリオの両方の下で、事前学習されたディープラーニングモデルの性能を評価することによって、新しいアプローチを提案する。
動作の速い手から指を横切る動作や動きのぼやけなど,特異かつ稀な条件を取り入れた。
その結果、産業用データセットでトレーニングされたモデルは、非工業用データセットでトレーニングされたモデルよりも優れていた。
論文 参考訳(メタデータ) (2025-01-13T21:52:46Z) - XLD: A Cross-Lane Dataset for Benchmarking Novel Driving View Synthesis [84.23233209017192]
本稿では,新しい駆動ビュー合成評価のための合成データセットを提案する。
トレーニングコースから逸脱した画像を1~4ドル(約1,400円)で撮影する。
我々は、フロントオンリーおよびマルチカメラ設定下で、既存のNVSアプローチを評価するための最初の現実的なベンチマークを確立する。
論文 参考訳(メタデータ) (2024-06-26T14:00:21Z) - From Fake to Real: Pretraining on Balanced Synthetic Images to Prevent Spurious Correlations in Image Recognition [64.59093444558549]
我々はFrom Fake to Realと呼ぶシンプルで簡単に実装できる2段階のトレーニングパイプラインを提案する。
実データと合成データを別々にトレーニングすることで、FFRは実データと合成データの統計的差異にモデルを公開しない。
実験の結果,FFRは3つのデータセットに対して,最先端のグループ精度を最大20%向上させることがわかった。
論文 参考訳(メタデータ) (2023-08-08T19:52:28Z) - Seamless Iterative Semi-Supervised Correction of Imperfect Labels in
Microscopy Images [57.42492501915773]
生体内試験は、医療機器の毒性に対する動物実験の代替手段である。
人間の疲労は、深層学習を魅力的なものにするために、エラー作成に重要な役割を果たします。
我々は、不完全ラベルのシームレス反復半監督補正(SISSI)を提案する。
本手法は,物体検出に適応的な早期学習補正技術を提供する。
論文 参考訳(メタデータ) (2022-08-05T18:52:20Z) - Inertial Hallucinations -- When Wearable Inertial Devices Start Seeing
Things [82.15959827765325]
環境支援型生活(AAL)のためのマルチモーダルセンサフュージョンの新しいアプローチを提案する。
我々は、標準マルチモーダルアプローチの2つの大きな欠点、限られた範囲のカバレッジ、信頼性の低下に対処する。
我々の新しいフレームワークは、三重項学習によるモダリティ幻覚の概念を融合させ、異なるモダリティを持つモデルを訓練し、推論時に欠落したセンサーに対処する。
論文 参考訳(メタデータ) (2022-07-14T10:04:18Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Federated Test-Time Adaptive Face Presentation Attack Detection with
Dual-Phase Privacy Preservation [100.69458267888962]
顔提示攻撃検出(fPAD)は、現代の顔認識パイプラインにおいて重要な役割を果たす。
法的およびプライバシー上の問題により、トレーニングデータ(実際の顔画像と偽画像)は、異なるデータソース間で直接共有することはできない。
本稿では,二相プライバシー保護フレームワークを用いたフェデレーションテスト時間適応顔提示検出を提案する。
論文 参考訳(メタデータ) (2021-10-25T02:51:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。