Fugu-MT 論文翻訳(概要): Joint Training of Image Generator and Detector for Road Defect Detection

論文の概要: Joint Training of Image Generator and Detector for Road Defect Detection

arxiv url: http://arxiv.org/abs/2509.03465v1
Date: Wed, 03 Sep 2025 16:41:50 GMT
ステータス: 翻訳完了
システム内更新日: 2025-09-04 21:40:46.597615
Title: Joint Training of Image Generator and Detector for Road Defect Detection
Title（参考訳）: 道路欠陥検出のための画像生成装置と検出器の併用訓練
Authors: Kuan-Chuan Peng,
Abstract要約: 道路欠陥検出のための画像生成器と検出器を共同で訓練する(JTGD)。生成モデルのための二重識別器を設計し、合成された欠陥パッチと全体像の両方を具現化する。 JTGDは、データ拡張において、より良い品質のより厳しい合成画像を使用するため、様々な国におけるRDD2022道路欠陥検出ベンチマークにおいて、最先端の手法よりも優れている。
参考スコア（独自算出の注目度）: 13.805442511934361
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Road defect detection is important for road authorities to reduce the vehicle damage caused by road defects. Considering the practical scenarios where the defect detectors are typically deployed on edge devices with limited memory and computational resource, we aim at performing road defect detection without using ensemble-based methods or test-time augmentation (TTA). To this end, we propose to Jointly Train the image Generator and Detector for road defect detection (dubbed as JTGD). We design the dual discriminators for the generative model to enforce both the synthesized defect patches and overall images to look plausible. The synthesized image quality is improved by our proposed CLIP-based Fr\'echet Inception Distance loss. The generative model in JTGD is trained jointly with the detector to encourage the generative model to synthesize harder examples for the detector. Since harder synthesized images of better quality caused by the aforesaid design are used in the data augmentation, JTGD outperforms the state-of-the-art method in the RDD2022 road defect detection benchmark across various countries under the condition of no ensemble and TTA. JTGD only uses less than 20% of the number of parameters compared with the competing baseline, which makes it more suitable for deployment on edge devices in practice.
Abstract（参考訳）: 道路の欠陥検出は道路当局にとって道路の欠陥による車両の損傷を低減するために重要である。メモリと計算資源が限られているエッジデバイスに欠陥検出装置を配置する現実的なシナリオを考えると,アンサンブルベースの手法やテスト時間拡張(TTA)を使わずに道路欠陥検出を行うことが目的である。そこで本稿では,道路欠陥検出のためのイメージジェネレータと検出器(JTGD)を共同で学習することを提案する。生成モデルのための二重識別器を設計し、合成された欠陥パッチと全体像の両方を具現化する。合成画像の品質は,提案したCLIPを用いたFr'echet Inception Distance Losにより向上した。 JTGDの生成モデルは、検出器のより複雑な例を合成するために、検出器と共同で訓練される。 JTGDは,データ増大に先立って,より高画質な合成画像を使用するため,アンサンブルやTTAの条件下で,RDD2022道路欠陥検出ベンチマークにおいて,最先端の手法よりも優れていた。 JTGDは競合するベースラインと比較してパラメータの20%未満しか使用していないため、実際にはエッジデバイスへのデプロイに適している。

関連論文リスト

Automated Defect Detection for Mass-Produced Electronic Components Based on YOLO Object Detection Models [0.0]
本稿では,業界で広く利用されているデュアルインラインパッケージ(DIP)の自動欠陥検出システムを提案する。 ConSinGANで提案されたYOLOv7は、95.50%の精度で他のYOLOバージョンよりも優れ、285msの検出時間は閾値に基づくアプローチよりもはるかに優れている。
論文参考訳（メタデータ） (2025-10-02T11:33:16Z)
Dual Data Alignment Makes AI-Generated Image Detector Easier Generalizable [57.48190915067007]
検出器はしばしばバイアス付きデータセットに基づいて訓練され、実際の/合成ラベルと突発的に相関する非因果属性に過度に適合する可能性がある。 1つの一般的な解決策は、生成的再構成を通じてデータセットアライメントを実行し、実画像と合成画像のセマンティック内容とを一致させることである。我々は,画素レベルのアライメントだけでは不十分であることを示す。再構成された画像は依然として周波数レベルの不整合に悩まされており,スプリアス相関が持続する可能性がある。
論文参考訳（メタデータ） (2025-05-20T13:42:38Z)
NeRF-Based defect detection [6.72800891299482]
本稿では,Neural Radiance Fields(NeRF)に基づく自動欠陥検出フレームワークとディジタルツインの概念を紹介する。このシステムは、UAVを使って画像を取得し、機械の3Dモデルを再構成し、標準的な基準モデルと現在のモデルの両方を生成して比較する。
論文参考訳（メタデータ） (2025-03-31T22:27:51Z)
Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文参考訳（メタデータ） (2024-11-28T13:04:45Z)
DT-JRD: Deep Transformer based Just Recognizable Difference Prediction Model for Video Coding for Machines [48.07705666485972]
Just Recognizable difference (JRD) は、機械ビジョンによって検出される最小の視覚差を表す。本稿では,Deep Transformer-based JRD (DT-JRD) prediction model for Video Coding for Machines (VCM)を提案する。正確に予測されたJRDは、機械作業の精度を維持しながら、符号化ビットレートを低減できる。
論文参考訳（メタデータ） (2024-11-14T09:34:36Z)
2DSig-Detect: a semi-supervised framework for anomaly detection on image data using 2D-signatures [2.6642754249961103]
本稿では,2DSig-Detectと呼ばれる画像における異常検出のための新しい手法を提案する。画像中の対向摂動の存在を検出するために,優れた性能と時間の短縮が示される。
論文参考訳（メタデータ） (2024-09-08T05:35:05Z)
Revisiting Consistency Regularization for Semi-supervised Change Detection in Remote Sensing Images [60.89777029184023]
教師付きクロスエントロピー(CE)損失に加えて、教師なしCD損失を定式化する半教師付きCDモデルを提案する。 2つの公開CDデータセットを用いて実験を行った結果,提案手法は教師付きCDの性能に近づきやすいことがわかった。
論文参考訳（メタデータ） (2022-04-18T17:59:01Z)
Benchmarking Deep Models for Salient Object Detection [67.07247772280212]
汎用SALOD(General SALient Object Detection)ベンチマークを構築し,複数のSOD手法の総合的な比較を行った。以上の実験では、既存の損失関数は、通常いくつかの指標に特化しているが、他の指標には劣る結果が報告されている。我々は,深層ネットワークに画素レベルと画像レベルの両方の監視信号を統合することにより,より識別的な特徴を学習するためのエッジ・アウェア・ロス(EA)を提案する。
論文参考訳（メタデータ） (2022-02-07T03:43:16Z)
The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。 KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文参考訳（メタデータ） (2022-01-29T10:54:57Z)
SADet: Learning An Efficient and Accurate Pedestrian Detector [68.66857832440897]
本稿では,一段検出器の検出パイプラインに対する一連の最適化手法を提案する。効率的な歩行者検出のための単発アンカーベース検出器(SADet)を形成する。構造的には単純だが、VGA解像度の画像に対して最先端の結果と20ドルFPSのリアルタイム速度を示す。
論文参考訳（メタデータ） (2020-07-26T12:32:38Z)
Unsupervised Pixel-level Road Defect Detection via Adversarial Image-to-Frequency Transform [8.644679871804872]
本稿では,AIFT(Adversarial Image-to-Frequency Transform)を用いた道路欠陥検出のための教師なし手法を提案する。 AIFTは、欠陥検出モデルの導出において、教師なしの方法と敵対的な学習を採用するため、道路舗装欠陥に対するアノテーションは不要である。
論文参考訳（メタデータ） (2020-01-30T04:50:00Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。