論文の概要: CrackSegFlow: Controllable Flow Matching Synthesis for Generalizable Crack Segmentation with a 50K Image-Mask Benchmark
- arxiv url: http://arxiv.org/abs/2601.03637v3
- Date: Sun, 11 Jan 2026 17:32:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-13 15:02:56.368684
- Title: CrackSegFlow: Controllable Flow Matching Synthesis for Generalizable Crack Segmentation with a 50K Image-Mask Benchmark
- Title(参考訳): CrackSegFlow:50K画像マスクベンチマークによる一般化可能なき裂分割のための制御可能なフローマッチング合成
- Authors: Babak Asadi, Peiyang Wu, Mani Golparvar-Fard, Ramez Hajj,
- Abstract要約: CrackSegFlowは、マスクからの亀裂の合成画像をピクセルレベルのアライメントで描画する制御可能な合成法である。
以上の結果から,合成ペアの追加により,+5.37 mIoUと+5.13 F1のドメイン性能が向上し,ターゲットマスク統計によって誘導されるターゲット誘導クロスドメイン合成では+13.12 mIoUと+14.82 F1のドメイン性能が向上した。
- 参考スコア(独自算出の注目度): 0.27998963147546135
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Defect segmentation is central to computer vision based inspection of infrastructure assets during both construction and operation. However, deployment remains limited due to scarce pixel-level labels and domain shift across environments. We introduce CrackSegFlow, a controllable Flow Matching synthesis method that renders synthetic images of cracks from masks with pixel-level alignment. Our renderer combines topology-preserving mask injection with edge gating to maintain thin-structure continuity. Class-conditional FM samples masks for topology diversity, and CrackSegFlow renders aligned ground truth images from them. We further inject cracks onto crack-free backgrounds to diversify confounders and reduce false positives. Across five datasets and using a CNN-Transformer backbone, our results demonstrate that adding synthesized pairs improves in-domain performance by +5.37 mIoU and +5.13 F1, while target-guided cross-domain synthesis driven by target mask statistics adds +13.12 mIoU and +14.82 F1. We also release CSF-50K, a benchmark dataset comprising 50,000 image-mask pairs.
- Abstract(参考訳): 欠陥セグメンテーションは、建設と運用の両方において、コンピュータビジョンに基づくインフラ資産の検査の中心である。
しかしながら、ピクセルレベルのラベルの不足や、環境間のドメインシフトのため、デプロイメントは制限されている。
本稿では,マスクからのひび割れの合成画像を画素レベルのアライメントで描画する制御可能なフローマッチング合成法であるCrackSegFlowを紹介する。
我々のレンダラーは、トポロジー保存マスクインジェクションとエッジゲーティングを組み合わせることで、薄膜の連続性を維持する。
クラス条件のFMサンプルは、トポロジーの多様性をマスクし、CrackSegFlowはそれらから整列した真理画像を描画する。
クラックのない背景にひび割れを注入して、共同ファウンダーを多様化させ、偽陽性を減らす。
5つのデータセットとCNN-Transformerのバックボーンを用いて、合成ペアの追加はドメイン内のパフォーマンスを+5.37 mIoUと+5.13 F1で改善する一方、ターゲットマスク統計によって駆動されるターゲット誘導クロスドメイン合成は+13.12 mIoUと+14.82 F1で向上することを示した。
また、5万のイメージマスクペアからなるベンチマークデータセットであるCSF-50Kもリリースしました。
関連論文リスト
- MaskOpt: A Large-Scale Mask Optimization Dataset to Advance AI in Integrated Circuit Manufacturing [9.945697214043385]
提案するMaskOptは,45$Mathrmnm$ nodeの実際のIC設計から構築した大規模ベンチマークデータセットである。
我々は、ICマスク最適化のための最先端ディープラーニングモデルを評価し、ベンチマークを構築する。
論文 参考訳(メタデータ) (2025-12-18T05:53:45Z) - Diffusion-Guided Mask-Consistent Paired Mixing for Endoscopic Image Segmentation [57.37991748282666]
本稿では, 試料混合と拡散合成の強度を融合した拡散誘導型パラダイムを提案する。
各実画像について、合成対を同じマスクの下で生成し、その対をマスク一貫性ペアドミキシング(MCPMix)の制御可能な入力として使用する。
これは、共有幾何学の下で合成および実際の外観を円滑にブリッジする中間サンプルの連続的な族を生成する。
論文 参考訳(メタデータ) (2025-11-05T06:14:19Z) - High-Frequency Prior-Driven Adaptive Masking for Accelerating Image Super-Resolution [87.56382172827526]
高周波領域は再建に最も重要である。
本稿では,アクセラレーションのためのトレーニング不要適応マスキングモジュールを提案する。
本手法は,最先端モデルのFLOPを24~43%削減する。
論文 参考訳(メタデータ) (2025-05-11T13:18:03Z) - CoSimGen: Controllable Diffusion Model for Simultaneous Image and Mask Generation [1.9393128408121891]
既存の生成モデルは、高品質で同時画像マスク生成の必要性に対処できない。
本稿では,同時画像生成とマスク生成を同時に行うための拡散型フレームワークであるCoSimGenを提案する。
CoSimGenはすべてのデータセットで最先端のパフォーマンスを達成し、データセットで0.11、LPIPSで0.53の最低KIDを達成した。
論文 参考訳(メタデータ) (2025-03-25T13:48:22Z) - Bridge the Points: Graph-based Few-shot Segment Anything Semantically [79.1519244940518]
プレトレーニング技術の最近の進歩により、視覚基礎モデルの能力が向上した。
最近の研究はSAMをFew-shot Semantic segmentation (FSS)に拡張している。
本稿では,グラフ解析に基づく簡易かつ効果的な手法を提案する。
論文 参考訳(メタデータ) (2024-10-09T15:02:28Z) - CrackSCF: Lightweight Cascaded Fusion Network for Robust and Efficient Structural Crack Segmentation [36.93774494071781]
CrackSCFは、堅牢なクラックセグメンテーションを実現するために設計された軽量なカスケード核融合クラックネットワークである。
このアプローチは、最小の計算フットプリントで動作しながら、ローカルパターンを効率的にキャプチャする。
実験結果から,CrackSCF法は既存の手法よりも一貫して優れていることがわかった。
論文 参考訳(メタデータ) (2024-08-23T03:21:51Z) - Mask Propagation for Efficient Video Semantic Segmentation [63.09523058489429]
ビデオセマンティックベースライン劣化(VSS)は、ビデオシーケンス内の各ピクセルにセマンティックラベルを割り当てることを含む。
SSSSと呼ばれるVSSのための効率的なマスク伝搬フレームワークを提案する。
当社のフレームワークは,フレーム単位のMask2Formerと比較して最大4倍のFLOPを削減し,Cityscapes検証セット上では最大2% mIoUしか使用できない。
論文 参考訳(メタデータ) (2023-10-29T09:55:28Z) - You Can Mask More For Extremely Low-Bitrate Image Compression [80.7692466922499]
近年,学習画像圧縮(lic)法は大きな進歩を遂げている。
licメソッドは、画像圧縮に不可欠な画像構造とテクスチャコンポーネントを明示的に探索することができない。
原画像の構造とテクスチャに基づいて可視パッチをサンプリングするDA-Maskを提案する。
極めて低ビットレート圧縮のために, lic と lic のエンドツーエンドを統一する最初のフレームワークである, 単純で効果的なマスク付き圧縮モデル (MCM) を提案する。
論文 参考訳(メタデータ) (2023-06-27T15:36:22Z) - Recovering compressed images for automatic crack segmentation using
generative models [13.519853801218005]
本手法を用いて, 圧縮き裂画像の自動割断回収フレームワークを開発した。
我々の回復フレームワークは,既存の3つのCSアルゴリズムと比較した。
論文 参考訳(メタデータ) (2020-03-06T04:48:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。