論文の概要: CrackSegFlow: Controllable Flow-Matching Synthesis for Generalizable Crack Segmentation with the CSF-50K Benchmark
- arxiv url: http://arxiv.org/abs/2601.03637v1
- Date: Wed, 07 Jan 2026 06:28:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-09 02:15:23.302476
- Title: CrackSegFlow: Controllable Flow-Matching Synthesis for Generalizable Crack Segmentation with the CSF-50K Benchmark
- Title(参考訳): CrackSegFlow: CSF-50Kベンチマークによる一般化可能なき裂分割のための制御可能なフローマッチング合成
- Authors: Babak Asadi, Peiyang Wu, Mani Golparvar-Fard, Ramez Hajj,
- Abstract要約: CrackSegFlowは制御可能なフローマッチング合成フレームワークである。
バイナリマスクに条件付けされたフォトリアリスティックなクラック画像を生成する。
CrackSegFlowは決定論的サンプリングを大幅に高速化し、忠実度とマスクイメージアライメントを改善している。
- 参考スコア(独自算出の注目度): 0.27998963147546135
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automated crack segmentation is essential for scalable condition assessment of pavements and civil infrastructure, yet practical deployment is limited by scarce pixel-level labels and severe domain shift across sensors, illumination, textures, and annotation conventions. This paper presents CrackSegFlow, a controllable flow-matching synthesis framework that generates photorealistic crack images conditioned on binary masks while preserving strict mask-image alignment. The generator combines topology-preserving mask injection with boundary-gated modulation to maintain thin-structure continuity and suppress texture-driven false positives. A second class-conditional flow-matching model synthesizes crack masks with explicit control over crack coverage, enabling balanced, topology-diverse paired data without additional manual annotation. We further inject crack masks into crack-free backgrounds to diversify illumination and surface artifacts and reduce false positives caused by shadows, joints, and pavement markings. Experiments on five benchmarks spanning four asphalt datasets and the crack class of a concrete-domain dataset demonstrate consistent improvements under an established hybrid CNN--Transformer segmentation backbone and a fixed training protocol. With real plus synthesized pairs, in-domain performance improves on average by 5.37 mIoU and 5.13 F1, and target-guided cross-domain synthesis yields average gains of 13.12 mIoU and 14.82 F1 using only limited target mask statistics. Compared with diffusion-based semantic synthesis, CrackSegFlow provides substantially faster deterministic sampling and improves fidelity and mask-image alignment for thin-structure crack geometry. Finally, we release CSF-50K, a public dataset of 50,000 paired crack images and pixel-accurate masks for large-scale benchmarking of generalizable crack segmentation.
- Abstract(参考訳): 自動クラックセグメンテーションは、舗装や土木インフラのスケーラブルな条件評価に不可欠であるが、実際の展開は、少ないピクセルレベルのラベルと、センサー、照明、テクスチャ、アノテーション規則間の厳しいドメインシフトによって制限されている。
本稿では,厳密なマスク・イメージアライメントを保ちながら,バイナリマスクに条件付き光現実的クラック画像を生成する,制御可能なフローマッチング合成フレームワークであるCrackSegFlowを提案する。
このジェネレータは、トポロジー保存マスクインジェクションと境界ゲート変調を組み合わせることで、薄膜の連続性を維持し、テクスチャ駆動の偽陽性を抑制する。
第2のクラス条件フローマッチングモデルは、クラックマスクをクラックカバレッジを明示的に制御して合成し、追加の手動アノテーションなしで、バランスの取れたトポロジ-多元ペアデータを可能にする。
さらに, き裂のない背景にき裂マスクを注入し, 照明や表面のアーチファクトの多様化と, 影, 関節, 舗装のマーキングによる偽陽性の低減を図る。
4つのアスファルトデータセットとコンクリートドメインデータセットのクラッククラスにまたがる5つのベンチマークの実験では、確立されたハイブリッドCNN-Transformerセグメンテーションバックボーンと固定トレーニングプロトコルの下で一貫した改善が示されている。
実際のプラス合成ペアでは、ドメイン内のパフォーマンスは平均5.37 mIoUと5.13 F1で改善され、ターゲット誘導されたクロスドメイン合成は、限られたターゲットマスク統計のみを使用して13.12 mIoUと14.82 F1の平均ゲインを得る。
拡散に基づくセマンティック合成と比較して、CrackSegFlowは決定論的サンプリングを大幅に高速化し、微細構造クラック幾何学の忠実度とマスクイメージアライメントを改善する。
最後に,5万対のクラック画像と画素精度マスクからなる公開データセットであるCSF-50Kを,大規模にベンチマーク可能な一般化可能なクラックセグメンテーションのためにリリースする。
関連論文リスト
- MaskOpt: A Large-Scale Mask Optimization Dataset to Advance AI in Integrated Circuit Manufacturing [9.945697214043385]
提案するMaskOptは,45$Mathrmnm$ nodeの実際のIC設計から構築した大規模ベンチマークデータセットである。
我々は、ICマスク最適化のための最先端ディープラーニングモデルを評価し、ベンチマークを構築する。
論文 参考訳(メタデータ) (2025-12-18T05:53:45Z) - Diffusion-Guided Mask-Consistent Paired Mixing for Endoscopic Image Segmentation [57.37991748282666]
本稿では, 試料混合と拡散合成の強度を融合した拡散誘導型パラダイムを提案する。
各実画像について、合成対を同じマスクの下で生成し、その対をマスク一貫性ペアドミキシング(MCPMix)の制御可能な入力として使用する。
これは、共有幾何学の下で合成および実際の外観を円滑にブリッジする中間サンプルの連続的な族を生成する。
論文 参考訳(メタデータ) (2025-11-05T06:14:19Z) - High-Frequency Prior-Driven Adaptive Masking for Accelerating Image Super-Resolution [87.56382172827526]
高周波領域は再建に最も重要である。
本稿では,アクセラレーションのためのトレーニング不要適応マスキングモジュールを提案する。
本手法は,最先端モデルのFLOPを24~43%削減する。
論文 参考訳(メタデータ) (2025-05-11T13:18:03Z) - CoSimGen: Controllable Diffusion Model for Simultaneous Image and Mask Generation [1.9393128408121891]
既存の生成モデルは、高品質で同時画像マスク生成の必要性に対処できない。
本稿では,同時画像生成とマスク生成を同時に行うための拡散型フレームワークであるCoSimGenを提案する。
CoSimGenはすべてのデータセットで最先端のパフォーマンスを達成し、データセットで0.11、LPIPSで0.53の最低KIDを達成した。
論文 参考訳(メタデータ) (2025-03-25T13:48:22Z) - Bridge the Points: Graph-based Few-shot Segment Anything Semantically [79.1519244940518]
プレトレーニング技術の最近の進歩により、視覚基礎モデルの能力が向上した。
最近の研究はSAMをFew-shot Semantic segmentation (FSS)に拡張している。
本稿では,グラフ解析に基づく簡易かつ効果的な手法を提案する。
論文 参考訳(メタデータ) (2024-10-09T15:02:28Z) - CrackSCF: Lightweight Cascaded Fusion Network for Robust and Efficient Structural Crack Segmentation [36.93774494071781]
CrackSCFは、堅牢なクラックセグメンテーションを実現するために設計された軽量なカスケード核融合クラックネットワークである。
このアプローチは、最小の計算フットプリントで動作しながら、ローカルパターンを効率的にキャプチャする。
実験結果から,CrackSCF法は既存の手法よりも一貫して優れていることがわかった。
論文 参考訳(メタデータ) (2024-08-23T03:21:51Z) - Mask Propagation for Efficient Video Semantic Segmentation [63.09523058489429]
ビデオセマンティックベースライン劣化(VSS)は、ビデオシーケンス内の各ピクセルにセマンティックラベルを割り当てることを含む。
SSSSと呼ばれるVSSのための効率的なマスク伝搬フレームワークを提案する。
当社のフレームワークは,フレーム単位のMask2Formerと比較して最大4倍のFLOPを削減し,Cityscapes検証セット上では最大2% mIoUしか使用できない。
論文 参考訳(メタデータ) (2023-10-29T09:55:28Z) - You Can Mask More For Extremely Low-Bitrate Image Compression [80.7692466922499]
近年,学習画像圧縮(lic)法は大きな進歩を遂げている。
licメソッドは、画像圧縮に不可欠な画像構造とテクスチャコンポーネントを明示的に探索することができない。
原画像の構造とテクスチャに基づいて可視パッチをサンプリングするDA-Maskを提案する。
極めて低ビットレート圧縮のために, lic と lic のエンドツーエンドを統一する最初のフレームワークである, 単純で効果的なマスク付き圧縮モデル (MCM) を提案する。
論文 参考訳(メタデータ) (2023-06-27T15:36:22Z) - Recovering compressed images for automatic crack segmentation using
generative models [13.519853801218005]
本手法を用いて, 圧縮き裂画像の自動割断回収フレームワークを開発した。
我々の回復フレームワークは,既存の3つのCSアルゴリズムと比較した。
論文 参考訳(メタデータ) (2020-03-06T04:48:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。