論文の概要: Synthetic Designed Experiments for Diagnosing Vision Model Failure
- arxiv url: http://arxiv.org/abs/2605.00832v1
- Date: Mon, 30 Mar 2026 02:52:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 06:56:26.432496
- Title: Synthetic Designed Experiments for Diagnosing Vision Model Failure
- Title(参考訳): 視覚モデル故障診断のための合成設計実験
- Authors: Krisanu Sarkar,
- Abstract要約: 現在のコンピュータビジョン用の合成データパイプラインは、下流モデルが本当に必要とするものを診断することなく、画像を生成する。
このオープンループパラダイムは、合成データを安価な実データとして扱い、ジェネレータの出力空間をランダムにサンプリングする。
これは基本的に、合成データのユニークな特性である、制御可能で独立したシーン要因のバリエーションを誤用している、と我々は主張する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Current synthetic data pipelines for computer vision generate images without diagnosing what the downstream model actually needs. This open-loop paradigm treats synthetic data as cheap real data, randomly sampling the generator's output space and hoping to cover the model's failure modes. We argue this fundamentally misuses synthetic data's unique property: the controllable, independent variation of scene factors.Drawing on the statistical theory of Design of Experiments (DoE), we propose Synthetic Designed Experiments for Representational Sufficiency (SDRS). SDRS treats the downstream model as a black-box system and the synthetic generator as an experimental apparatus. Using fractional factorial designs, SDRS efficiently audits a model's factor-sensitivity profile via ANOVA decomposition. It classifies failures into two actionable types: Type I gaps (coverage failures on underrepresented factor levels) and Type II gaps (reliance on spurious nuisance dependencies). The audit then prescribes targeted synthetic data to address each gap type. We validate SDRS on three experiments: (1) a controlled diagnostic on dSprites with planted biases, where the audit correctly identifies both gap types and targeted data improves accuracy from 49.9% to 79.0%; (2) a dense segmentation task on procedural scenes, where detecting background-complexity shortcuts and applying targeted data improves mIoU from 0.948 to 0.998; and (3) an entanglement detection experiment showing that the ANOVA audit identifies cross-factor contamination in imperfect generators. Finally, we show that per-factor invariance penalties can transfer sensitivity between factors, identifying an open problem for representation-level correction.
- Abstract(参考訳): 現在のコンピュータビジョン用の合成データパイプラインは、下流モデルが本当に必要とするものを診断することなく、画像を生成する。
このオープンループパラダイムは、合成データを安価な実データとして扱い、ジェネレータの出力空間をランダムにサンプリングし、モデルの障害モードをカバーすることを期待する。
本研究では, 合成データの特異な特性, 環境要因の制御可能かつ独立な変化を根本的に誤用していると論じ, 実験設計の統計的理論(DoE)に基づき, 表象十分性のための合成設計実験(SDRS)を提案する。
SDRSは、下流モデルをブラックボックスシステムとして、合成発電機を実験装置として扱う。
分数分解設計を用いて、SDRSはANOVA分解によりモデルの因子感受性プロファイルを効率的に監査する。
フェールを2つの実行可能なタイプに分類する。タイプIギャップ(表現不足の要素のカバレッジ障害)とタイプIIギャップ(素早いニュアンス依存に依存している)である。
監査は、それぞれのギャップタイプに対応するために、ターゲットとなる合成データを処方する。
SDRS は,(1)dSprites の植物バイアスによる制御診断,(2) ANOVA 監査が両ギャップタイプを正しく識別し,精度を 49.9% から 79.0% に向上する,(2) 背景複雑さのショートカットを検出し,ターゲットデータを適用して mIoU を 0.948 から 0.998 に改善する,(3) ANOVA 監査が不完全なジェネレータにおけるクロスファクタ汚染を識別する,エンタングルメント検出実験の3つの実験で検証される。
最後に,因子ごとの不等式が因子間の感度を伝達できることを示す。
関連論文リスト
- Function-Space Decoupled Diffusion for Forward and Inverse Modeling in Carbon Capture and Storage [65.51149575007149]
本稿では,Fun-DDPSについて述べる。Fun-DDPSは,関数空間拡散モデルと微分可能なニューラル演算子サロゲートを結合した生成フレームワークである。
Fun-DDPSは、ジョイントステートベースラインで観察される高周波アーティファクトから、物理的に一貫した実現をもたらす。
論文 参考訳(メタデータ) (2026-02-12T18:58:12Z) - Crucial-Diff: A Unified Diffusion Model for Crucial Image and Annotation Synthesis in Data-scarce Scenarios [65.97836905826145]
医療、産業、自動運転といったさまざまなシナリオにおけるデータの不足は、モデルの過度な適合とデータセットの不均衡につながる。
重要なサンプルを合成するドメインに依存しないフレームワークであるCrucial-Diffを提案する。
我々のフレームワークは多様な高品質なトレーニングデータを生成し、ピクセルレベルのAPは83.63%、F1-MAXは78.12%である。
論文 参考訳(メタデータ) (2025-07-14T04:41:38Z) - Generating on Generated: An Approach Towards Self-Evolving Diffusion Models [58.05857658085845]
再帰的自己改善(Recursive Self-Improvement、RSI)は、インテリジェンスシステムがその能力を自律的に改善することを可能にする。
本稿では、テキスト・画像拡散モデルにおけるRSIの適用について検討し、合成データによるトレーニング崩壊の課題に対処する。
論文 参考訳(メタデータ) (2025-02-14T07:41:47Z) - Leveraging Latent Diffusion Models for Training-Free In-Distribution Data Augmentation for Surface Defect Detection [9.784793380119806]
データ拡張のためのトレーニング不要な拡散型In-Distribution Anomaly GenerationパイプラインであるDIAGを紹介する。
従来の画像生成技術とは異なり、我々は、ドメインの専門家がモデルにマルチモーダルガイダンスを提供する、Human-in-the-loopパイプラインを実装している。
我々は、挑戦的なKSDD2データセットに対する最先端データ拡張アプローチに関して、DIAGの有効性と汎用性を実証する。
論文 参考訳(メタデータ) (2024-07-04T14:28:52Z) - Fault Detection and Monitoring using a Data-Driven Information-Based Strategy: Method, Theory, and Application [5.056456697289351]
本稿では,新しいコンセプトドリフト検出器に基づく情報駆動型故障検出手法を提案する。
本手法は,加法雑音モデルの入出力関係におけるドリフトの同定に適している。
提案したMIに基づく故障検出手法の理論的特性を実証する。
論文 参考訳(メタデータ) (2024-05-06T17:43:39Z) - A Comparison of Residual-based Methods on Fault Detection [6.675805308519987]
本研究では,産業システムにおける欠陥検出のための残差に基づく2つのアプローチを比較した。
性能評価は, 健康指標構築, 断層検出, 健康指標解釈の3つの課題に焦点をあてる。
その結果、両モデルとも平均20サイクルの遅延で故障を検出でき、偽陽性率を低く維持できることがわかった。
論文 参考訳(メタデータ) (2023-09-05T14:39:27Z) - Breaking the Spurious Causality of Conditional Generation via Fairness
Intervention with Corrective Sampling [77.15766509677348]
条件生成モデルは、トレーニングデータセットから急激な相関を継承することが多い。
これは別の潜在属性に対して不均衡なラベル条件分布をもたらす。
この問題を緩和するための一般的な2段階戦略を提案する。
論文 参考訳(メタデータ) (2022-12-05T08:09:33Z) - Fault Detection and Diagnosis with Imbalanced and Noisy Data: A Hybrid
Framework for Rotating Machinery [2.580765958706854]
回転機械製造システムの保守コスト低減には, 故障診断が重要な役割を担っている。
従来のフォールト検出および診断(FDD)フレームワークは、現実の状況に対処する際のパフォーマンスが劣っている。
本稿では、上記の3つのコンポーネントを用いて、効果的な信号ベースFDDシステムを実現するハイブリッドフレームワークを提案する。
論文 参考訳(メタデータ) (2022-02-09T01:09:59Z) - SUOD: Accelerating Large-Scale Unsupervised Heterogeneous Outlier
Detection [63.253850875265115]
外乱検出(OD)は、一般的なサンプルから異常物体を識別するための機械学習(ML)タスクである。
そこで我々は,SUODと呼ばれるモジュール型加速度システムを提案する。
論文 参考訳(メタデータ) (2020-03-11T00:22:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。