論文の概要: CrossDiff: Diffusion Probabilistic Model With Cross-conditional Encoder-Decoder for Crack Segmentation
- arxiv url: http://arxiv.org/abs/2501.12860v1
- Date: Wed, 22 Jan 2025 13:13:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-23 13:29:38.849154
- Title: CrossDiff: Diffusion Probabilistic Model With Cross-conditional Encoder-Decoder for Crack Segmentation
- Title(参考訳): CrossDiff:クラックセグメンテーションのためのクロス条件エンコーダデコーダを用いた拡散確率モデル
- Authors: Xianglong Shi, Yunhan Jiang, Xiaoheng Jiang, Mingling Xu, Yang Liu,
- Abstract要約: クロス条件エンコーダデコーダを用いた新しい拡散モデルCrossDiffを提案する。
提案したCrossDiffモデルは、DiceスコアとIoUの両点において、他の最先端メソッドよりも8.0%優れたパフォーマンスを実現している。
- 参考スコア(独自算出の注目度): 5.69969816883978
- License:
- Abstract: Crack Segmentation in industrial concrete surfaces is a challenging task because cracks usually exhibit intricate morphology with slender appearances. Traditional segmentation methods often struggle to accurately locate such cracks, leading to inefficiencies in maintenance and repair processes. In this paper, we propose a novel diffusion-based model with a cross-conditional encoder-decoder, named CrossDiff, which is the first to introduce the diffusion probabilistic model for the crack segmentation task. Specifically, CrossDiff integrates a cross-encoder and a cross-decoder into the diffusion model to constitute a cross-shaped diffusion model structure. The cross-encoder enhances the ability to retain crack details and the cross-decoder helps extract the semantic features of cracks. As a result, CrossDiff can better handle slender cracks. Extensive experiments were conducted on five challenging crack datasets including CFD, CrackTree200, DeepCrack, GAPs384, and Rissbilder. The results demonstrate that the proposed CrossDiff model achieves impressive performance, outperforming other state-of-the-art methods by 8.0% in terms of both Dice score and IoU. The code will be open-source soon.
- Abstract(参考訳): 工業用コンクリート表面におけるき裂のセグメンテーションは, き裂が細い外観を持つ複雑な形態を示すため, 難しい課題である。
伝統的セグメンテーションの手法は、しばしばそのような亀裂を正確に見つけるのに苦労し、メンテナンスと修復のプロセスに非効率をもたらす。
本稿では,クロスコンディショナルエンコーダを用いた新しい拡散モデルCrossDiffを提案する。
具体的には、クロスデコーダとクロスデコーダを拡散モデルに統合し、クロスフォーム拡散モデル構造を構成する。
クロスエンコーダはクラックの詳細を保持する能力を高め、クロスデコーダはクラックの意味的な特徴を抽出するのに役立つ。
結果として、CrossDiffは細い亀裂を処理できる。
CFD、CrackTree200、DeepCrack、GAPs384、Rissbilderを含む5つの挑戦的クラックデータセットに対して大規模な実験が行われた。
その結果,CrossDiffモデルでは,DiceスコアとIoUの両点において,他の最先端手法よりも8.0%高い性能を実現していることがわかった。
コードはまもなくオープンソースになる予定だ。
関連論文リスト
- CrackSegDiff: Diffusion Probability Model-based Multi-modal Crack Segmentation [5.534972596061796]
本稿では, クラックセグメンテーションのための新しいDPM手法であるCrackSegDiffを提案する。
提案手法では,Vm-unetを用いて,元のデータの長距離情報を効率的に取得する。
CrackSegDiffは、特に浅い亀裂の検出において、最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2024-10-10T16:44:10Z) - Hybrid-Segmentor: A Hybrid Approach to Automated Fine-Grained Crack Segmentation in Civil Infrastructure [52.2025114590481]
エンコーダ・デコーダをベースとした手法であるHybrid-Segmentorを導入する。
これにより、モデルは、様々な種類の形状、表面、き裂の大きさを区別する一般化能力を向上させることができる。
提案モデルは,5つの測定基準(精度0.971,精度0.804,リコール0.744,F1スコア0.770,IoUスコア0.630)で既存ベンチマークモデルより優れ,最先端の状態を達成している。
論文 参考訳(メタデータ) (2024-09-04T16:47:16Z) - DiffCut: Catalyzing Zero-Shot Semantic Segmentation with Diffusion Features and Recursive Normalized Cut [62.63481844384229]
ファンデーションモデルは、言語、ビジョン、マルチモーダルタスクなど、さまざまな領域にまたがる強力なツールとして登場した。
本稿では,拡散UNetエンコーダを基礎ビジョンエンコーダとして使用し,教師なしゼロショットセグメンテーション手法であるDiffCutを紹介する。
我々の研究は、拡散UNetエンコーダに埋め込まれた極めて正確なセマンティック知識を強調し、下流タスクの基盤ビジョンエンコーダとして機能する。
論文 参考訳(メタデータ) (2024-06-05T01:32:31Z) - FreeSeg-Diff: Training-Free Open-Vocabulary Segmentation with Diffusion Models [56.71672127740099]
我々は,閉鎖語彙データセットのトレーニングモデルによって伝統的に解決されるイメージセグメンテーションの課題に焦点をあてる。
我々は、ゼロショットのオープン語彙セグメンテーションのために、異なる、比較的小さなオープンソース基盤モデルを活用している。
当社のアプローチ(別名FreeSeg-Diff)は、トレーニングに依存しないもので、Pascal VOCとCOCOデータセットの両方で多くのトレーニングベースのアプローチより優れています。
論文 参考訳(メタデータ) (2024-03-29T10:38:25Z) - CrackCLF: Automatic Pavement Crack Detection based on Closed-Loop
Feedback [14.986335013488643]
CrackCLFはニューラルネットワークモデルであり、自分でエラーを修正することを学習する。
提案されたCLFは、プラグアンドプレイモジュールとして定義することができ、異なるニューラルネットワークモデルに組み込んでパフォーマンスを改善することができる。
論文 参考訳(メタデータ) (2023-11-20T14:52:48Z) - Real-time High-Resolution Neural Network with Semantic Guidance for
Crack Segmentation [4.651261550392625]
本稿では,ひび割れのセグメンテーションに特化して設計されたセマンティックガイダンスを備えた高分解能ネットワークHrSegNetについて述べる。
HrSegNetは、ひび割れの詳細を保存しながらリアルタイムの推論速度を保証する。
このアプローチは、高分解能モデリングとリアルタイム検出の間にトレードオフがあることを実証する。
論文 参考訳(メタデータ) (2023-07-01T08:38:18Z) - A Convolutional-Transformer Network for Crack Segmentation with Boundary
Awareness [5.98717173705421]
クラックは、製造された建物の安全性と耐久性を評価する上で重要な役割を果たしている。
本稿では,この課題を解決するために,エンコーダデコーダアーキテクチャに基づく新しい畳み込みトランスフォーマネットワークを提案する。
論文 参考訳(メタデータ) (2023-02-23T01:27:57Z) - Revisiting Code Search in a Two-Stage Paradigm [67.02322603435628]
TOSSは2段階のフュージョンコード検索フレームワークである。
まずIRベースのバイエンコーダモデルを使用して、少数のトップkコード候補を効率的にリコールする。
その後、より微細なクロスエンコーダを使用してランク付けを行う。
論文 参考訳(メタデータ) (2022-08-24T02:34:27Z) - Crosslink-Net: Double-branch Encoder Segmentation Network via Fusing
Vertical and Horizontal Convolutions [58.71117402626524]
医用画像分割のための新しいダブルブランチエンコーダアーキテクチャを提案する。
1)正方形畳み込みカーネルによる特徴の識別をさらに改善する必要があるため,非正方形および水平畳み込みカーネルの利用を提案する。
実験では,4つのデータセット上でのモデルの有効性を検証した。
論文 参考訳(メタデータ) (2021-07-24T02:58:32Z) - Searching Central Difference Convolutional Networks for Face
Anti-Spoofing [68.77468465774267]
顔認識システムにおいて、顔の反偽造(FAS)が重要な役割を担っている。
最先端のFASメソッドの多くは、スタック化された畳み込みと専門家が設計したネットワークに依存している。
ここでは、中央差分畳み込み(CDC)に基づくフレームレベルの新しいFAS手法を提案する。
論文 参考訳(メタデータ) (2020-03-09T12:48:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。