論文の概要: MathPhys-Guided Coarse-to-Fine Anomaly Synthesis with SQE-Driven Bi-Level Optimization for Anomaly Detection
- arxiv url: http://arxiv.org/abs/2504.12970v1
- Date: Thu, 17 Apr 2025 14:22:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-18 14:36:45.724521
- Title: MathPhys-Guided Coarse-to-Fine Anomaly Synthesis with SQE-Driven Bi-Level Optimization for Anomaly Detection
- Title(参考訳): SQE-Driven Bi-Level Optimization を用いたMathPhys-Guided Coarse-to-Fine Anomaly Synthesisによる異常検出
- Authors: Long Qian, Bingke Zhu, Yingying Chen, Ming Tang, Jinqiao Wang,
- Abstract要約: 異常検出はコンピュータビジョンにおいて重要な課題であるが、現実の欠陥画像の収集は本質的に困難である。
本研究では,Math-Physicsモデルガイダンスを用いて合成異常を生成する新しいパイプラインを提案する。
ひび割れ, 腐食, 変形の物理的モデリングを取り入れることで, 本手法は現実的な欠陥マスクを生成する。
- 参考スコア(独自算出の注目度): 30.77558600436759
- License:
- Abstract: Anomaly detection is a crucial task in computer vision, yet collecting real-world defect images is inherently difficult due to the rarity and unpredictability of anomalies. Consequently, researchers have turned to synthetic methods for training data augmentation. However, existing synthetic strategies (e.g., naive cut-and-paste or inpainting) overlook the underlying physical causes of defects, leading to inconsistent, low-fidelity anomalies that hamper model generalization to real-world complexities. In this thesis, we introduced a novel pipeline that generates synthetic anomalies through Math-Physics model guidance, refines them via a Coarse-to-Fine approach and employs a bi-level optimization strategy with a Synthesis Quality Estimator(SQE). By incorporating physical modeling of cracks, corrosion, and deformation, our method produces realistic defect masks, which are subsequently enhanced in two phases. The first stage (npcF) enforces a PDE-based consistency to achieve a globally coherent anomaly structure, while the second stage (npcF++) further improves local fidelity using wavelet transforms and boundary synergy blocks. Additionally, we leverage SQE-driven weighting, ensuring that high-quality synthetic samples receive greater emphasis during training. To validate our approach, we conducted comprehensive experiments on three widely adopted industrial anomaly detection benchmarks: MVTec AD, VisA, and BTAD. Across these datasets, the proposed pipeline achieves state-of-the-art (SOTA) results in both image-AUROC and pixel-AUROC, confirming the effectiveness of our MaPhC2F and BiSQAD.
- Abstract(参考訳): 異常検出はコンピュータビジョンにおいて重要な課題であるが、異常の希少性や予測不可能性のため、現実の欠陥画像の収集は本質的に困難である。
その結果、研究者はデータ拡張を訓練するための合成方法に転換した。
しかし、既存の合成戦略(例えば、ナイーブ・カット・アンド・ペーストや塗装)は、欠陥の根底にある物理的原因を見落とし、モデル一般化を現実の複雑さに妨げる不整合で低忠実な異常をもたらす。
そこで本論文では,Math-Physicsモデルガイダンスを用いて合成異常を発生させる新しいパイプラインを導入し,それらを粗大なアプローチで洗練し,合成品質推定器(SQE)を用いた二段階最適化戦略を採用した。
ひび割れ, 腐食, 変形の物理的モデリングを取り入れることで, 現実的な欠陥マスクを創出し, 次いで2段階に拡張した。
第1段階(npcF)は、PDEベースの一貫性を強制して、グローバルなコヒーレントな異常構造を実現する一方で、第2段階(npcF++)はウェーブレット変換と境界相乗効果ブロックを用いて局所的な忠実性を改善する。
さらに、SQEによる重み付けを活用し、高品質な合成サンプルがトレーニング中により強調されるようにした。
提案手法を検証するため, MVTec AD, VisA, BTADの3種類の産業異常検出ベンチマークを総合的に検討した。
これらのデータセット全体にわたって、提案したパイプラインは、イメージAUROCとピクセルAUROCの両方で、最新技術(SOTA)の結果を達成し、MaPhC2FとBiSQADの有効性を確認します。
関連論文リスト
- HFMF: Hierarchical Fusion Meets Multi-Stream Models for Deepfake Detection [4.908389661988192]
HFMFは総合的な2段階のディープフェイク検出フレームワークである。
視覚変換器と畳み込みネットを階層的特徴融合機構を通じて統合する。
私たちのアーキテクチャは、多様なデータセットベンチマークで優れたパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2025-01-10T00:20:29Z) - Progressive Boundary Guided Anomaly Synthesis for Industrial Anomaly Detection [1.5680795779726031]
教師なし異常検出法は, 通常の試料のみを応用して, 産業画像の表面欠陥を識別することができる。
本稿では, 補助的なテクスチャを伴わずに, 重要な特徴レベルの異常を指向的に合成できる新しいプログレッシブ・バウンダリ誘導型異常合成(PBAS)戦略を提案する。
本手法は,3つの産業用データセットの最先端性能と高速検出速度を実現する。
論文 参考訳(メタデータ) (2024-12-23T10:26:26Z) - Diffusion Prior Interpolation for Flexibility Real-World Face Super-Resolution [48.34173818491552]
拡散事前補間(DPI)は、一貫性と多様性のバランスをとることができ、事前訓練されたモデルにシームレスに統合することができる。
合成および実データに対して行われた広範な実験において、DPIはSOTA FSR法よりも優れていることを示した。
論文 参考訳(メタデータ) (2024-12-21T09:28:44Z) - Memory-efficient High-resolution OCT Volume Synthesis with Cascaded Amortized Latent Diffusion Models [48.87160158792048]
本稿では,高分解能CTボリュームをメモリ効率よく合成できるCA-LDM(Cascaded amortized Latent diffusion model)を提案する。
公開高解像度OCTデータセットを用いた実験により、我々の合成データは、既存の手法の能力を超越した、現実的な高解像度かつグローバルな特徴を持つことが示された。
論文 参考訳(メタデータ) (2024-05-26T10:58:22Z) - Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection [59.41026558455904]
具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。
本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
論文 参考訳(メタデータ) (2024-01-06T07:30:41Z) - Video Anomaly Detection via Spatio-Temporal Pseudo-Anomaly Generation : A Unified Approach [49.995833831087175]
本研究は,画像のマスキング領域にペンキを塗布することにより,汎用的な映像時間PAを生成する手法を提案する。
さらに,OCC設定下での現実世界の異常を検出するための単純な統合フレームワークを提案する。
提案手法は,OCC設定下での既存のPAs生成および再構築手法と同等に動作する。
論文 参考訳(メタデータ) (2023-11-27T13:14:06Z) - Achieving state-of-the-art performance in the Medical
Out-of-Distribution (MOOD) challenge using plausible synthetic anomalies [0.5677301320664404]
非教師付き異常検出(out-of-distribution detection)は、異常なサンプルを特定することを目的としている。
本手法は,局所的な合成異常を識別するためのセグメンテーションネットワークを訓練する自己教師型戦略に基づいている。
我々の貢献により, 合成異常発生プロセスが改善し, 合成異常がより均一になる。
論文 参考訳(メタデータ) (2023-08-02T20:16:13Z) - Data-driven generation of plausible tissue geometries for realistic
photoacoustic image synthesis [53.65837038435433]
光音響トモグラフィ(pat)は形態的および機能的組織特性を回復する可能性がある。
我々は,PATデータシミュレーションの新たなアプローチを提案し,これを「シミュレーションの学習」と呼ぶ。
我々は、意味的注釈付き医療画像データに基づいて訓練されたGAN(Generative Adversarial Networks)の概念を活用して、可塑性組織ジオメトリを生成する。
論文 参考訳(メタデータ) (2021-03-29T11:30:18Z) - Dueling Deep Q-Network for Unsupervised Inter-frame Eye Movement
Correction in Optical Coherence Tomography Volumes [5.371290280449071]
オプティカルコヒーレンス・トモグラフィー(OCT)では、個々のスライスを連続的に取得することで、運動アーティファクトにこのモダリティが生じる。
この画像モダリティの特徴であるスペックルノイズは、従来の登録技術が採用されている際に不正確となる。
本稿では、深層強化学習を用いて、フレーム間の動きを教師なしで補正することで、これらの課題に対処する。
論文 参考訳(メタデータ) (2020-07-03T07:14:30Z) - Uncertainty-Aware Blind Image Quality Assessment in the Laboratory and
Wild [98.48284827503409]
我々は,テキスト化BIQAモデルを開発し,それを合成的および現実的歪みの両方で訓練するアプローチを提案する。
我々は、多数の画像ペアに対してBIQAのためのディープニューラルネットワークを最適化するために、忠実度損失を用いる。
6つのIQAデータベースの実験は、実験室と野生動物における画像品質を盲目的に評価する学習手法の可能性を示唆している。
論文 参考訳(メタデータ) (2020-05-28T13:35:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。