論文の概要: Double Helix Diffusion for Cross-Domain Anomaly Image Generation
- arxiv url: http://arxiv.org/abs/2509.12787v1
- Date: Tue, 16 Sep 2025 08:06:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-17 17:50:52.957762
- Title: Double Helix Diffusion for Cross-Domain Anomaly Image Generation
- Title(参考訳): クロスドメイン異常画像生成のための二重ヘリックス拡散
- Authors: Linchun Wu, Qin Zou, Xianbiao Qi, Bo Du, Zhongyuan Wang, Qingquan Li,
- Abstract要約: 本稿ではDH-Diff(Double Helix Diffusion)について紹介する。DH-Diffは高忠実度異常画像と画素レベルのアノテーションマスクを同時に合成する新しいクロスドメイン生成フレームワークである。
DH-Diffは二重ヘリックスにインスパイアされたユニークなアーキテクチャを採用し、特徴分離、接続、マージのために異なるモジュールをサイクリングする。
大規模な実験により、DH-Diffは多様性と信頼性において最先端の手法を著しく上回り、下流異常検出性能は大幅に向上した。
- 参考スコア(独自算出の注目度): 47.093354259479234
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual anomaly inspection is critical in manufacturing, yet hampered by the scarcity of real anomaly samples for training robust detectors. Synthetic data generation presents a viable strategy for data augmentation; however, current methods remain constrained by two principal limitations: 1) the generation of anomalies that are structurally inconsistent with the normal background, and 2) the presence of undesirable feature entanglement between synthesized images and their corresponding annotation masks, which undermines the perceptual realism of the output. This paper introduces Double Helix Diffusion (DH-Diff), a novel cross-domain generative framework designed to simultaneously synthesize high-fidelity anomaly images and their pixel-level annotation masks, explicitly addressing these challenges. DH-Diff employs a unique architecture inspired by a double helix, cycling through distinct modules for feature separation, connection, and merging. Specifically, a domain-decoupled attention mechanism mitigates feature entanglement by enhancing image and annotation features independently, and meanwhile a semantic score map alignment module ensures structural authenticity by coherently integrating anomaly foregrounds. DH-Diff offers flexible control via text prompts and optional graphical guidance. Extensive experiments demonstrate that DH-Diff significantly outperforms state-of-the-art methods in diversity and authenticity, leading to significant improvements in downstream anomaly detection performance.
- Abstract(参考訳): 視覚異常検査は製造において重要であるが、ロバスト検出器の訓練のための実際の異常サンプルの不足によって妨げられている。
合成データ生成は、データ拡張のための実行可能な戦略を示すが、現在の方法には2つの主要な制限がある。
1) 通常の背景と構造的に整合しない異常の発生,及び
2) 合成画像とその対応するアノテーションマスク間の望ましくない特徴絡みの存在は, 出力の知覚的リアリズムを損なう。
本稿ではDH-Diff(Double Helix Diffusion)を提案する。DH-Diffは、高忠実度異常画像と画素レベルのアノテーションマスクを同時に合成する新しいクロスドメイン生成フレームワークである。
DH-Diffは二重ヘリックスにインスパイアされたユニークなアーキテクチャを採用し、特徴分離、接続、マージのために異なるモジュールをサイクリングする。
具体的には、ドメイン分離型アテンション機構は、画像とアノテーションの特徴を独立して拡張することで特徴の絡み合いを軽減し、セマンティックスコアマップアライメントモジュールは、異常なフォアグラウンドを整合的に統合することで構造的信頼性を確保する。
DH-Diffはテキストプロンプトによる柔軟な制御とオプションのグラフィカルガイダンスを提供する。
大規模な実験により、DH-Diffは多様性と信頼性において最先端の手法を著しく上回り、下流異常検出性能は大幅に向上した。
関連論文リスト
- Generate Aligned Anomaly: Region-Guided Few-Shot Anomaly Image-Mask Pair Synthesis for Industrial Inspection [53.137651284042434]
異常検査は製造業において重要な役割を担っているが、異常サンプルの不足は既存の方法の有効性を制限している。
本稿では,GAA (Generate grained Anomaly) を提案する。
GAAは少数のサンプルのみを用いて現実的で多様で意味的に整合した異常を発生させる。
論文 参考訳(メタデータ) (2025-07-13T12:56:59Z) - Virtual-mask Informed Prior for Sparse-view Dual-Energy CT Reconstruction [9.118267161536087]
摂動のチャネル間の高い相関を利用してスパースビュー再構成のための二重領域仮想マスクインフォーム拡散モデルを提案する。
実験結果から,本手法は複数のデータセットにまたがって優れた性能を示すことがわかった。
論文 参考訳(メタデータ) (2025-04-10T13:54:26Z) - FUSE: Label-Free Image-Event Joint Monocular Depth Estimation via Frequency-Decoupled Alignment and Degradation-Robust Fusion [63.87313550399871]
画像強調共同深度推定法は、頑健な知覚に相補的なモダリティを利用するが、一般化可能性の課題に直面している。
自己監督型転送(PST)と周波数デカップリング型フュージョンモジュール(FreDF)を提案する。
PSTは、画像基礎モデルと潜在空間アライメントによるクロスモーダルな知識伝達を確立する。
FreDFは、低周波構造成分から高周波エッジ特性を明示的に分離し、モード比周波数ミスマッチを解消する。
論文 参考訳(メタデータ) (2025-03-25T15:04:53Z) - HFMF: Hierarchical Fusion Meets Multi-Stream Models for Deepfake Detection [4.908389661988192]
HFMFは総合的な2段階のディープフェイク検出フレームワークである。
視覚変換器と畳み込みネットを階層的特徴融合機構を通じて統合する。
私たちのアーキテクチャは、多様なデータセットベンチマークで優れたパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2025-01-10T00:20:29Z) - Cross-Modal Learning for Anomaly Detection in Complex Industrial Process: Methodology and Benchmark [19.376814754500625]
複雑な産業プロセスにおける異常検出は、効率的で安定で安全な操作を確実にする上で重要な役割を担っている。
本稿では,マグネシウム溶融プロセスにおける視覚特徴(ビデオ)とプロセス変数(電流)の相関を探索し,異常検出を容易にするクロスモーダルトランスを提案する。
本稿では, マグネシウム溶融プロセスの先駆的なクロスモーダルベンチマークを行い, 同期的に取得したビデオデータと電流データを220万以上のサンプルで分析した。
論文 参考訳(メタデータ) (2024-06-13T11:40:06Z) - Generating and Reweighting Dense Contrastive Patterns for Unsupervised
Anomaly Detection [59.34318192698142]
我々は、先行のない異常発生パラダイムを導入し、GRADと呼ばれる革新的な教師なし異常検出フレームワークを開発した。
PatchDiffは、様々な種類の異常パターンを効果的に公開する。
MVTec ADとMVTec LOCOデータセットの両方の実験も、前述の観測をサポートする。
論文 参考訳(メタデータ) (2023-12-26T07:08:06Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - Unsupervised Two-Stage Anomaly Detection [18.045265572566276]
単一の画像からの異常検出は、異常データが常に稀で、予測不能な型を持つ可能性があるため、難しい。
本研究では,高忠実かつ異常のない再構成を生成する2段階アプローチを提案する。
提案手法は,4つの異常検出データセットの最先端性能を上回っている。
論文 参考訳(メタデータ) (2021-03-22T08:57:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。