論文の概要: We Learn Better Road Pothole Detection: from Attention Aggregation to
Adversarial Domain Adaptation
- arxiv url: http://arxiv.org/abs/2008.06840v2
- Date: Fri, 11 Dec 2020 10:32:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-28 11:59:26.203018
- Title: We Learn Better Road Pothole Detection: from Attention Aggregation to
Adversarial Domain Adaptation
- Title(参考訳): より優れた道路ポトホール検出を学習する:注意集約から対向領域適応へ
- Authors: Rui Fan, Hengli Wang, Mohammud J. Bocus, Ming Liu
- Abstract要約: 道路の穴検出結果は、個々の経験に完全に依存するため、常に主観的である。
最近導入された不均質(逆深度)変換アルゴリズムは、損傷された道路と損傷を受けていない道路の識別をより良くする。
本稿では,異なる種類のアテンションモジュールの利点を生かした新しいアテンションアグリゲーション(AA)フレームワークを提案する。
- 参考スコア(独自算出の注目度): 22.076261078410752
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Manual visual inspection performed by certified inspectors is still the main
form of road pothole detection. This process is, however, not only tedious,
time-consuming and costly, but also dangerous for the inspectors. Furthermore,
the road pothole detection results are always subjective, because they depend
entirely on the individual experience. Our recently introduced disparity (or
inverse depth) transformation algorithm allows better discrimination between
damaged and undamaged road areas, and it can be easily deployed to any semantic
segmentation network for better road pothole detection results. To boost the
performance, we propose a novel attention aggregation (AA) framework, which
takes the advantages of different types of attention modules. In addition, we
develop an effective training set augmentation technique based on adversarial
domain adaptation, where the synthetic road RGB images and transformed road
disparity (or inverse depth) images are generated to enhance the training of
semantic segmentation networks. The experimental results demonstrate that,
firstly, the transformed disparity (or inverse depth) images become more
informative; secondly, AA-UNet and AA-RTFNet, our best performing
implementations, respectively outperform all other state-of-the-art
single-modal and data-fusion networks for road pothole detection; and finally,
the training set augmentation technique based on adversarial domain adaptation
not only improves the accuracy of the state-of-the-art semantic segmentation
networks, but also accelerates their convergence.
- Abstract(参考訳): 認定検査官による手動の視覚検査は依然として道路の穴検出の主形態である。
しかし、このプロセスは退屈で時間がかかり、コストがかかるだけでなく、検査官にとっても危険である。
さらに,道路孔検出結果は個々の経験に依存しているため,常に主観的である。
最近導入したdisparity(または逆深さ)変換アルゴリズムは、損傷した道路エリアと損傷のない道路エリアの識別性を高め、道路ポットホール検出結果を改善するために、任意のセマンティックセグメンテーションネットワークに容易にデプロイできる。
性能を向上させるために,異なる種類の注意モジュールの利点を生かした新しい注意集約(AA)フレームワークを提案する。
さらに,合成道路rgb画像と変換された道路差(または逆深度)画像を生成し,意味的セグメンテーションネットワークの訓練を強化する,逆領域適応に基づく効果的な訓練セット拡張手法を開発した。
The experimental results demonstrate that, firstly, the transformed disparity (or inverse depth) images become more informative; secondly, AA-UNet and AA-RTFNet, our best performing implementations, respectively outperform all other state-of-the-art single-modal and data-fusion networks for road pothole detection; and finally, the training set augmentation technique based on adversarial domain adaptation not only improves the accuracy of the state-of-the-art semantic segmentation networks, but also accelerates their convergence.
関連論文リスト
- Supervised Image Translation from Visible to Infrared Domain for Object Detection [1.7851018240619703]
本研究の目的は,2つのモダリティ間の領域ギャップを埋めることで,可視から赤外線への変換を学習することである。
我々は,ジェネレーティブ・アドバイサル・ネットワークとオブジェクト検出モデルを用いた2段階のトレーニング戦略を採用する。
このような画像は、Yolov5、Mask、Faster RCNNなどの標準オブジェクト検出フレームワークのトレーニングに使用される。
論文 参考訳(メタデータ) (2024-08-03T18:51:04Z) - Unsupervised Domain Adaptive Lane Detection via Contextual Contrast and Aggregation [3.105187291566825]
既存の車線検出方法は、列車検出モデルに画素単位のクロスエントロピー損失を利用する。
ドメイン間の知識伝達に不可欠なドメイン間コンテキスト依存性は、既存のレーン検出手法では探索されていない。
本稿では,コンテキストコントラスト・アグリゲーション(DACCA)を用いた領域適応車線検出手法を提案する。
論文 参考訳(メタデータ) (2024-07-18T09:29:02Z) - ReContrast: Domain-Specific Anomaly Detection via Contrastive
Reconstruction [29.370142078092375]
殆どの高度な教師なし異常検出(UAD)手法は、大規模データセットで事前訓練された冷凍エンコーダネットワークの特徴表現をモデル化することに依存している。
本稿では,事前学習した画像領域に対するバイアスを低減するために,ネットワーク全体を最適化する新しい疫学的UAD手法であるReContrastを提案する。
2つの一般的な産業欠陥検出ベンチマークと3つの医用画像UADタスクで実験を行い、現在の最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-05T05:21:15Z) - PiPa: Pixel- and Patch-wise Self-supervised Learning for Domain
Adaptative Semantic Segmentation [100.6343963798169]
教師なしドメイン適応(Unsupervised Domain Adaptation, UDA)は、学習モデルの他のドメインへの一般化を強化することを目的としている。
そこで我々は,ドメイン適応型セマンティックセマンティックセグメンテーションのための,PiPaという,画素・パッチ対応の自己教師付き学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-14T18:31:24Z) - Improving Road Segmentation in Challenging Domains Using Similar Place
Priors [25.883291494709688]
夜間、雪、雨などの挑戦的な領域での道路分割は難しい作業である。
現在のアプローチでは、微調整、ドメイン適応、スタイル転送を使用してパフォーマンスが向上している。
視覚的場所認識(VPR)は、類似しているが地理的に異なる場所を見つける。
論文 参考訳(メタデータ) (2022-05-27T17:22:52Z) - Graph Attention Layer Evolves Semantic Segmentation for Road Pothole
Detection: A Benchmark and Algorithms [34.80667966432126]
既存の道路穴検出アプローチは、コンピュータビジョンベースまたは機械学習ベースに分類される。
後者のアプローチは一般的に、畳み込みニューラルネットワーク(CNN)をエンドツーエンドに使用した道路孔検出に対処する。
本稿では,既存の任意のCNNに容易に展開可能で,画像特徴表現をセマンティックセグメンテーションに最適化できる新しいCNN層を提案する。
論文 参考訳(メタデータ) (2021-09-06T19:44:50Z) - Stagewise Unsupervised Domain Adaptation with Adversarial Self-Training
for Road Segmentation of Remote Sensing Images [93.50240389540252]
リモートセンシング画像からの道路セグメンテーションは、幅広い応用可能性を持つ課題である。
本稿では,この領域における領域シフト(DS)問題に対処するため,RoadDAと呼ばれる新たな段階的ドメイン適応モデルを提案する。
2つのベンチマーク実験の結果、RoadDAはドメインギャップを効率的に減らし、最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-08-28T09:29:14Z) - Domain Adaptation for Semantic Segmentation via Patch-Wise Contrastive
Learning [62.7588467386166]
ドメイン間で構造的に類似するラベルパッチの機能を調整することで、ドメインギャップを埋めるためにコントラスト学習を利用する。
私たちのアプローチは、常に2つの困難なドメイン適応セグメンテーションタスクにおいて、最先端の非監視および半監督メソッドを上回ります。
論文 参考訳(メタデータ) (2021-04-22T13:39:12Z) - Cross-Domain Similarity Learning for Face Recognition in Unseen Domains [90.35908506994365]
本研究では,cdt(cross-domain triplet, クロスドメイントリプレット)の損失を推測する新しいクロスドメインメトリック学習損失法を提案する。
CDT損失は、一つのドメインからコンパクトな特徴クラスタを強制することによって意味論的に意味のある特徴の学習を促進する。
本手法では,トレーニング中,注意深いハードペアサンプルマイニングおよびフィルタリング戦略は必要としない。
論文 参考訳(メタデータ) (2021-03-12T19:48:01Z) - BoMuDANet: Unsupervised Adaptation for Visual Scene Understanding in
Unstructured Driving Environments [54.22535063244038]
非構造交通環境における視覚的シーン理解のための教師なし適応手法を提案する。
本手法は,車,トラック,二輪車,三輪車,歩行者からなる密集・異種交通を伴う非構造現実シナリオを対象としたものである。
論文 参考訳(メタデータ) (2020-09-22T08:25:44Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。