論文の概要: Joint Training of Image Generator and Detector for Road Defect Detection
- arxiv url: http://arxiv.org/abs/2509.03465v1
- Date: Wed, 03 Sep 2025 16:41:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 21:40:46.597615
- Title: Joint Training of Image Generator and Detector for Road Defect Detection
- Title(参考訳): 道路欠陥検出のための画像生成装置と検出器の併用訓練
- Authors: Kuan-Chuan Peng,
- Abstract要約: 道路欠陥検出のための画像生成器と検出器を共同で訓練する(JTGD)。
生成モデルのための二重識別器を設計し、合成された欠陥パッチと全体像の両方を具現化する。
JTGDは、データ拡張において、より良い品質のより厳しい合成画像を使用するため、様々な国におけるRDD2022道路欠陥検出ベンチマークにおいて、最先端の手法よりも優れている。
- 参考スコア(独自算出の注目度): 13.805442511934361
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Road defect detection is important for road authorities to reduce the vehicle damage caused by road defects. Considering the practical scenarios where the defect detectors are typically deployed on edge devices with limited memory and computational resource, we aim at performing road defect detection without using ensemble-based methods or test-time augmentation (TTA). To this end, we propose to Jointly Train the image Generator and Detector for road defect detection (dubbed as JTGD). We design the dual discriminators for the generative model to enforce both the synthesized defect patches and overall images to look plausible. The synthesized image quality is improved by our proposed CLIP-based Fr\'echet Inception Distance loss. The generative model in JTGD is trained jointly with the detector to encourage the generative model to synthesize harder examples for the detector. Since harder synthesized images of better quality caused by the aforesaid design are used in the data augmentation, JTGD outperforms the state-of-the-art method in the RDD2022 road defect detection benchmark across various countries under the condition of no ensemble and TTA. JTGD only uses less than 20% of the number of parameters compared with the competing baseline, which makes it more suitable for deployment on edge devices in practice.
- Abstract(参考訳): 道路の欠陥検出は道路当局にとって道路の欠陥による車両の損傷を低減するために重要である。
メモリと計算資源が限られているエッジデバイスに欠陥検出装置を配置する現実的なシナリオを考えると,アンサンブルベースの手法やテスト時間拡張(TTA)を使わずに道路欠陥検出を行うことが目的である。
そこで本稿では,道路欠陥検出のためのイメージジェネレータと検出器(JTGD)を共同で学習することを提案する。
生成モデルのための二重識別器を設計し、合成された欠陥パッチと全体像の両方を具現化する。
合成画像の品質は,提案したCLIPを用いたFr'echet Inception Distance Losにより向上した。
JTGDの生成モデルは、検出器のより複雑な例を合成するために、検出器と共同で訓練される。
JTGDは,データ増大に先立って,より高画質な合成画像を使用するため,アンサンブルやTTAの条件下で,RDD2022道路欠陥検出ベンチマークにおいて,最先端の手法よりも優れていた。
JTGDは競合するベースラインと比較してパラメータの20%未満しか使用していないため、実際にはエッジデバイスへのデプロイに適している。
関連論文リスト
- NeRF-Based defect detection [6.72800891299482]
本稿では,Neural Radiance Fields(NeRF)に基づく自動欠陥検出フレームワークとディジタルツインの概念を紹介する。
このシステムは、UAVを使って画像を取得し、機械の3Dモデルを再構成し、標準的な基準モデルと現在のモデルの両方を生成して比較する。
論文 参考訳(メタデータ) (2025-03-31T22:27:51Z) - Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。
本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。
本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文 参考訳(メタデータ) (2024-11-28T13:04:45Z) - DT-JRD: Deep Transformer based Just Recognizable Difference Prediction Model for Video Coding for Machines [48.07705666485972]
Just Recognizable difference (JRD) は、機械ビジョンによって検出される最小の視覚差を表す。
本稿では,Deep Transformer-based JRD (DT-JRD) prediction model for Video Coding for Machines (VCM)を提案する。
正確に予測されたJRDは、機械作業の精度を維持しながら、符号化ビットレートを低減できる。
論文 参考訳(メタデータ) (2024-11-14T09:34:36Z) - 2DSig-Detect: a semi-supervised framework for anomaly detection on image data using 2D-signatures [2.6642754249961103]
本稿では,2DSig-Detectと呼ばれる画像における異常検出のための新しい手法を提案する。
画像中の対向摂動の存在を検出するために,優れた性能と時間の短縮が示される。
論文 参考訳(メタデータ) (2024-09-08T05:35:05Z) - Revisiting Consistency Regularization for Semi-supervised Change
Detection in Remote Sensing Images [60.89777029184023]
教師付きクロスエントロピー(CE)損失に加えて、教師なしCD損失を定式化する半教師付きCDモデルを提案する。
2つの公開CDデータセットを用いて実験を行った結果,提案手法は教師付きCDの性能に近づきやすいことがわかった。
論文 参考訳(メタデータ) (2022-04-18T17:59:01Z) - The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。
具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。
KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文 参考訳(メタデータ) (2022-01-29T10:54:57Z) - SADet: Learning An Efficient and Accurate Pedestrian Detector [68.66857832440897]
本稿では,一段検出器の検出パイプラインに対する一連の最適化手法を提案する。
効率的な歩行者検出のための単発アンカーベース検出器(SADet)を形成する。
構造的には単純だが、VGA解像度の画像に対して最先端の結果と20ドルFPSのリアルタイム速度を示す。
論文 参考訳(メタデータ) (2020-07-26T12:32:38Z) - Unsupervised Pixel-level Road Defect Detection via Adversarial
Image-to-Frequency Transform [8.644679871804872]
本稿では,AIFT(Adversarial Image-to-Frequency Transform)を用いた道路欠陥検出のための教師なし手法を提案する。
AIFTは、欠陥検出モデルの導出において、教師なしの方法と敵対的な学習を採用するため、道路舗装欠陥に対するアノテーションは不要である。
論文 参考訳(メタデータ) (2020-01-30T04:50:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。