論文の概要: Balancing Real and Synthetic Data for CNN-based Masonry Crack Detection
- arxiv url: http://arxiv.org/abs/2606.08033v1
- Date: Sat, 06 Jun 2026 07:51:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:05.679204
- Title: Balancing Real and Synthetic Data for CNN-based Masonry Crack Detection
- Title(参考訳): CNNを用いた石英き裂検出のための実データと合成データのバランシング
- Authors: Mattia Forlesi, Alfonso Esposito, Ivan Zyrianoff, Alessandro Marzani, Marco Di Felice,
- Abstract要約: 亀裂は建築の健康にとって重要な指標であり、早期の同定は有害な損傷を防ぐのに不可欠である。
この制限に対処するため,実データを補完し,学習効率を向上させる合成き裂データの作成を検討した。
本手法は, ひび割れ検出精度を高めつつ, 収集作業を減らすために合成データの可能性を実証する。
- 参考スコア(独自算出の注目度): 37.63495002959663
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cracks are a critical indicator of building health, and early stage identification is fundamental to prevent harmful damages. Advances in deep learning (DL), particularly convolutional neural networks (CNNs), have enabled scalable solutions for automated crack detection. However, CNN performance strongly depends on the availability of large and diverse datasets, which is particularly challenging for complex surfaces such as masonry. Collecting sufficient real data is time-consuming, while publicly available datasets may not be adequate. To address this limitation, we explored generating synthetic crack data, which complements real data and improves training effectiveness. The real dataset consists of masonry crack images collected from buildings in Bologna and surrounding areas. In contrast, the synthetic dataset was generated using a crack overlay tool that adds cracks to background images in a controlled orientation and placement. The real dataset was used to train several DL architectures, to identify the best-performing model (InceptionV4) employed for experiments with generated data. Six training scenarios were tested in InceptionV4 by varying the ratio of real and synthetic data, with evaluation performed on a test set composed of real images using the F1-score and mean Intersection over Union (mIoU) metrics. Results show that training on synthetic data plus a modest addition of 20% real data achieves results comparable to training on real data only. Moreover, the 20/80 scenario (synthetic/real) achieved an 76% F1-score and 80% mean IoU, outperforming the real-only case. As can be seen, the method demonstrates the potential of synthetic data to reduce collection efforts while enhancing crack detection accuracy.
- Abstract(参考訳): 亀裂は建築の健康にとって重要な指標であり、早期の同定は有害な損傷を防ぐのに不可欠である。
ディープラーニング(DL)、特に畳み込みニューラルネットワーク(CNN)の進歩により、自動クラック検出のためのスケーラブルなソリューションが実現された。
しかし、CNNのパフォーマンスは大規模で多様なデータセットの可用性に強く依存しており、特に石工のような複雑な面では困難である。
十分な実データの収集には時間を要するが、公開データセットは不十分である可能性がある。
この制限に対処するため,実データを補完し,学習効率を向上させる合成き裂データの作成を検討した。
実際のデータセットは、ボローニャと周辺地域の建物から収集された石造りの亀裂画像で構成されている。
対照的に、合成データセットはクラックオーバーレイツールを使用して生成され、制御された向きと配置の背景画像にひび割れを追加する。
実際のデータセットは、複数のDLアーキテクチャをトレーニングし、生成されたデータの実験に使用される最高のパフォーマンスモデル(InceptionV4)を特定するために使用された。
InceptionV4では、実データと合成データの比率を変えて6つのトレーニングシナリオをテストし、F1スコアと平均ユニオン(mIoU)メトリクスを用いた実画像からなるテストセットで評価を行った。
その結果, 合成データのトレーニングと20%の実データの追加は, 実データのみのトレーニングに匹敵する結果が得られることがわかった。
さらに、20/80のシナリオ(合成/現実)は76%のF1スコアを獲得し、80%はIoUであり、実際のケースよりも優れていた。
この手法は, ひび割れ検出精度を高めつつ, 収集作業の軽減を図るため, 合成データの可能性を実証するものである。
関連論文リスト
- Sim-to-Real Fruit Detection Using Synthetic Data: Quantitative Evaluation and Embedded Deployment with Isaac Sim [0.0]
本研究では,制約付きデータ条件および組込み配置条件下でのオブジェクト検出におけるSim-to-real転送のための合成データの有効性について検討した。
その結果、実データのみにトレーニングされたモデルが最も精度が高いのに対し、合成専用モデルはドメインギャップによる性能低下を示すことがわかった。
訓練されたモデルはJetson Orin NXRTに配備され、リアルタイムの推論性能を実現した。
論文 参考訳(メタデータ) (2026-03-30T16:52:29Z) - What Is Wrong with Synthetic Data for Scene Text Recognition? A Strong Synthetic Engine with Diverse Simulations and Self-Evolution [21.806975276583174]
私たちは、挑戦的なサンプルの結合をカバーするテキストを合成する強力なデータエンジンであるUnionSTを紹介します。
次に,課題シナリオのシミュレーションを改良した大規模合成データセットUnionST-Sを構築した。
UnionST-Sでトレーニングされたモデルは、既存の合成データセットよりも大幅に改善されている。
論文 参考訳(メタデータ) (2026-02-06T07:23:54Z) - SynFER: Towards Boosting Facial Expression Recognition with Synthetic Data [78.70620682374624]
ハイレベルなテキスト記述に基づく表情画像データの合成のための新しいフレームワークであるSynFERを紹介する。
合成データの質と信頼性を確保するため,セマンティックガイダンス手法と擬似ラベル生成手法を提案する。
その結果, 提案手法の有効性と合成データの有効性が検証された。
論文 参考訳(メタデータ) (2024-10-13T14:58:21Z) - Improving Object Detector Training on Synthetic Data by Starting With a Strong Baseline Methodology [0.14980193397844666]
本稿では,合成データを用いた学習における事前学習対象検出器の性能向上手法を提案する。
提案手法は,実画像の事前学習から得られた有用な特徴を忘れずに,合成データから有能な情報を抽出することに焦点を当てる。
論文 参考訳(メタデータ) (2024-05-30T08:31:01Z) - Exploring the Effectiveness of Dataset Synthesis: An application of
Apple Detection in Orchards [68.95806641664713]
本研究では,リンゴ樹の合成データセットを生成するための安定拡散2.1-baseの有用性について検討する。
我々は、現実世界のリンゴ検出データセットでリンゴを予測するために、YOLOv5mオブジェクト検出モデルを訓練する。
その結果、実世界の画像でトレーニングされたベースラインモデルと比較して、生成データでトレーニングされたモデルはわずかに性能が劣っていることがわかった。
論文 参考訳(メタデータ) (2023-06-20T09:46:01Z) - A New Benchmark: On the Utility of Synthetic Data with Blender for Bare
Supervised Learning and Downstream Domain Adaptation [42.2398858786125]
コンピュータビジョンにおけるディープラーニングは、大規模ラベル付きトレーニングデータの価格で大きな成功を収めた。
制御不能なデータ収集プロセスは、望ましくない重複が存在する可能性のある非IIDトレーニングおよびテストデータを生成する。
これを回避するために、ドメインランダム化による3Dレンダリングによる合成データを生成する方法がある。
論文 参考訳(メタデータ) (2023-03-16T09:03:52Z) - Minimizing the Accumulated Trajectory Error to Improve Dataset
Distillation [151.70234052015948]
本稿では,フラットな軌道を求める最適化アルゴリズムを提案する。
合成データに基づいてトレーニングされた重みは、平坦な軌道への正規化を伴う累積誤差摂動に対して頑健であることを示す。
本手法はFTD (Flat Trajectory Distillation) と呼ばれ, 勾配整合法の性能を最大4.7%向上させる。
論文 参考訳(メタデータ) (2022-11-20T15:49:11Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - Semi-synthesis: A fast way to produce effective datasets for stereo
matching [16.602343511350252]
現実に近いテクスチャレンダリングは、ステレオマッチングのパフォーマンスを高める重要な要素です。
実物に近いテクスチャーで大量のデータを合成する効果的かつ高速な方法である半合成法を提案します。
実際のデータセットのさらなる微調整により、MiddleburyのSOTAパフォーマンスとKITTIおよびETH3Dデータセットの競争結果も達成します。
論文 参考訳(メタデータ) (2021-01-26T14:34:49Z) - Syn2Real Transfer Learning for Image Deraining using Gaussian Processes [92.15895515035795]
CNNに基づく画像デライニング手法は,再現誤差や視覚的品質の点で優れた性能を発揮している。
実世界の完全ラベル付き画像デライニングデータセットを取得する上での課題により、既存の手法は合成されたデータのみに基づいて訓練される。
本稿では,ガウス過程に基づく半教師付き学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-10T00:33:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。