Fugu-MT 論文翻訳(概要): CrackSegFlow: Controllable Flow Matching Synthesis for Generalizable Crack Segmentation with a 50K Image-Mask Benchmark

論文の概要: CrackSegFlow: Controllable Flow Matching Synthesis for Generalizable Crack Segmentation with a 50K Image-Mask Benchmark

arxiv url: http://arxiv.org/abs/2601.03637v2
Date: Thu, 08 Jan 2026 05:35:39 GMT
ステータス: 翻訳完了
システム内更新日: 2026-01-09 13:05:36.776335
Title: CrackSegFlow: Controllable Flow Matching Synthesis for Generalizable Crack Segmentation with a 50K Image-Mask Benchmark
Title（参考訳）: CrackSegFlow:50K画像マスクベンチマークによる一般化可能なき裂分割のための制御可能なフローマッチング合成
Authors: Babak Asadi, Peiyang Wu, Mani Golparvar-Fard, Ramez Hajj,
Abstract要約: マスク・イメージアライメントを施した2次元マスク上でクラック画像を生成する制御可能なフローマッチングフレームワークであるCrackSegFlowを提案する。クラス条件付きフローマッチングモデルは、クラックカバレッジを制御したマスクを合成し、手動のアノテーションなしでバランスの取れたトポロジ-ディバースデータを可能にする。 CNN-Transformerのバックボーンを持つ5つのデータセットでは、合成されたペアはドメイン内のパフォーマンスを5.37 mIoUと5.13 F1に改善し、ターゲット誘導されたクロスドメイン合成は13.12 mIoUと14.82 F1に向上する。
参考スコア（独自算出の注目度）: 0.27998963147546135
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Automated crack segmentation is essential for condition assessment, yet deployment is limited by scarce pixel-level labels and domain shift. We present CrackSegFlow, a controllable flow-matching synthesis framework that generates crack images conditioned on binary masks with mask-image alignment. The renderer combines topology-preserving mask injection with edge gating to maintain thin-structure continuity and suppress false positives. A class-conditional flow-matching mask model synthesizes masks with control over crack coverage, enabling balanced, topology-diverse data without manual annotation. We inject masks into crack-free backgrounds to diversify illumination and reduce false positives. On five datasets with a CNN-Transformer backbone, incorporating synthesized pairs improves in-domain performance by 5.37 mIoU and 5.13 F1, and target-guided cross-domain synthesis yields gains of 13.12 mIoU and 14.82 F1 using target mask statistics. We also release CSF-50K, 50,000 image-mask pairs for benchmarking.
Abstract（参考訳）: クラックの自動セグメンテーションは条件評価に不可欠であるが、配置はピクセルレベルの少ないラベルとドメインシフトによって制限される。本稿では,2次元マスクに配向したクラック画像を生成する制御可能なフローマッチング合成フレームワークであるCrackSegFlowを提案する。このレンダラーは、トポロジー保存マスクインジェクションとエッジゲーティングを組み合わせることで、薄膜の連続性を維持し、偽陽性を抑制する。クラス条件付きフローマッチングマスクモデルは、クラックカバレッジを制御したマスクを合成し、手動のアノテーションを使わずに、バランスの取れたトポロジ-ディバースデータを可能にする。マスクを無き裂背景に注入し,照明の多様化と偽陽性の低減を図る。 CNN-Transformerのバックボーンを持つ5つのデータセットでは、合成されたペアを組み込むことで、ドメイン内のパフォーマンスが5.37 mIoUと5.13 F1向上し、ターゲットに誘導されたクロスドメイン合成は、ターゲットマスク統計を用いて13.12 mIoUと14.82 F1の利得を得る。また、ベンチマーク用のCSF-50K、50,000のイメージマスクペアもリリースしています。

関連論文リスト

MaskOpt: A Large-Scale Mask Optimization Dataset to Advance AI in Integrated Circuit Manufacturing [9.945697214043385]
提案するMaskOptは,45$Mathrmnm$ nodeの実際のIC設計から構築した大規模ベンチマークデータセットである。我々は、ICマスク最適化のための最先端ディープラーニングモデルを評価し、ベンチマークを構築する。
論文参考訳（メタデータ） (2025-12-18T05:53:45Z)
Diffusion-Guided Mask-Consistent Paired Mixing for Endoscopic Image Segmentation [57.37991748282666]
本稿では, 試料混合と拡散合成の強度を融合した拡散誘導型パラダイムを提案する。各実画像について、合成対を同じマスクの下で生成し、その対をマスク一貫性ペアドミキシング(MCPMix)の制御可能な入力として使用する。これは、共有幾何学の下で合成および実際の外観を円滑にブリッジする中間サンプルの連続的な族を生成する。
論文参考訳（メタデータ） (2025-11-05T06:14:19Z)
FTCFormer: Fuzzy Token Clustering Transformer for Image Classification [22.410199372985584]
トランスフォーマーベースのディープニューラルネットワークは、様々なコンピュータビジョンタスクで顕著な成功を収めている。ほとんどのトランスフォーマーアーキテクチャは、イメージを均一なグリッドベースの視覚トークンに埋め込み、画像領域の基本的な意味を無視する。本研究では,空間的位置ではなく意味に基づく視覚トークンを動的に生成するFuzzy Token Clustering Transformer (FTCFormer)を提案する。
論文参考訳（メタデータ） (2025-07-14T13:49:47Z)
High-Frequency Prior-Driven Adaptive Masking for Accelerating Image Super-Resolution [87.56382172827526]
高周波領域は再建に最も重要である。本稿では,アクセラレーションのためのトレーニング不要適応マスキングモジュールを提案する。本手法は,最先端モデルのFLOPを24～43%削減する。
論文参考訳（メタデータ） (2025-05-11T13:18:03Z)
CoSimGen: Controllable Diffusion Model for Simultaneous Image and Mask Generation [1.9393128408121891]
既存の生成モデルは、高品質で同時画像マスク生成の必要性に対処できない。本稿では,同時画像生成とマスク生成を同時に行うための拡散型フレームワークであるCoSimGenを提案する。 CoSimGenはすべてのデータセットで最先端のパフォーマンスを達成し、データセットで0.11、LPIPSで0.53の最低KIDを達成した。
論文参考訳（メタデータ） (2025-03-25T13:48:22Z)
High-Quality Mask Tuning Matters for Open-Vocabulary Segmentation [109.19165503929992]
ここでは,CLIPのマスク分類能力を高めるために,生成されたマスクの代わりに接地トラスマスクを使用するMaskCLIP++を提案する。低コストの微調整を経て、MaskCLIP++はマルチドメインデータセットのマスク分類性能を大幅に改善した。我々は,A-847,PC-459,A-150,PC-59,PAS-20データセット上で+1.7,+2.3,+2.1,+3.1,+0.3 mIoUの性能改善を実現する。
論文参考訳（メタデータ） (2024-12-16T05:44:45Z)
Bridge the Points: Graph-based Few-shot Segment Anything Semantically [79.1519244940518]
プレトレーニング技術の最近の進歩により、視覚基礎モデルの能力が向上した。最近の研究はSAMをFew-shot Semantic segmentation (FSS)に拡張している。本稿では,グラフ解析に基づく簡易かつ効果的な手法を提案する。
論文参考訳（メタデータ） (2024-10-09T15:02:28Z)
CrackSCF: Lightweight Cascaded Fusion Network for Robust and Efficient Structural Crack Segmentation [36.93774494071781]
CrackSCFは、堅牢なクラックセグメンテーションを実現するために設計された軽量なカスケード核融合クラックネットワークである。このアプローチは、最小の計算フットプリントで動作しながら、ローカルパターンを効率的にキャプチャする。実験結果から,CrackSCF法は既存の手法よりも一貫して優れていることがわかった。
論文参考訳（メタデータ） (2024-08-23T03:21:51Z)
Mask Propagation for Efficient Video Semantic Segmentation [63.09523058489429]
ビデオセマンティックベースライン劣化(VSS)は、ビデオシーケンス内の各ピクセルにセマンティックラベルを割り当てることを含む。 SSSSと呼ばれるVSSのための効率的なマスク伝搬フレームワークを提案する。当社のフレームワークは,フレーム単位のMask2Formerと比較して最大4倍のFLOPを削減し,Cityscapes検証セット上では最大2% mIoUしか使用できない。
論文参考訳（メタデータ） (2023-10-29T09:55:28Z)
FreeMask: Synthetic Images with Dense Annotations Make Stronger Segmentation Models [62.009002395326384]
FreeMaskは、生成モデルからの合成画像を利用して、データ収集とアノテーション手順の負担を軽減する。まず、現実的なデータセットによって提供されるセマンティックマスクに条件付けされた豊富な訓練画像を合成する。本研究では,実画像との協調訓練や,実画像の事前学習による合成画像の役割について検討する。
論文参考訳（メタデータ） (2023-10-23T17:57:27Z)
CVFC: Attention-Based Cross-View Feature Consistency for Weakly Supervised Semantic Segmentation of Pathology Images [3.2128744424771725]
病理組織像分割はがんの診断における金の基準である。多くの研究が画像レベルのラベルを使用してピクセルレベルのセグメンテーションを実現し、微粒なアノテーションの必要性を減らしている。そこで本研究では,CVFC という疑似マスク生成フレームワークを提案する。
論文参考訳（メタデータ） (2023-08-21T03:50:09Z)
You Can Mask More For Extremely Low-Bitrate Image Compression [80.7692466922499]
近年,学習画像圧縮(lic)法は大きな進歩を遂げている。 licメソッドは、画像圧縮に不可欠な画像構造とテクスチャコンポーネントを明示的に探索することができない。原画像の構造とテクスチャに基づいて可視パッチをサンプリングするDA-Maskを提案する。極めて低ビットレート圧縮のために, lic と lic のエンドツーエンドを統一する最初のフレームワークである, 単純で効果的なマスク付き圧縮モデル (MCM) を提案する。
論文参考訳（メタデータ） (2023-06-27T15:36:22Z)
Recovering compressed images for automatic crack segmentation using generative models [13.519853801218005]
本手法を用いて, 圧縮き裂画像の自動割断回収フレームワークを開発した。我々の回復フレームワークは,既存の3つのCSアルゴリズムと比較した。
論文参考訳（メタデータ） (2020-03-06T04:48:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。