論文の概要: An Iteratively Optimized Patch Label Inference Network for Automatic
Pavement Distress Detection
- arxiv url: http://arxiv.org/abs/2005.13298v3
- Date: Thu, 8 Sep 2022 07:09:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-28 09:15:03.506765
- Title: An Iteratively Optimized Patch Label Inference Network for Automatic
Pavement Distress Detection
- Title(参考訳): 自動舗装距離検出のための反復最適化パッチラベル推論ネットワーク
- Authors: Wenhao Tang and Sheng Huang and Qiming Zhao and Ren Li and Luwen
Huangfu
- Abstract要約: 本稿では, 反復最適化型パッチラベル推論ネットワーク (IOPLIN) という新しいディープラーニングフレームワークを提案する。
IOPLINは、期待最大化インスパイアされたパッチラベル蒸留戦略を通じて、イメージラベルのみで反復的にトレーニングすることができる。
解像度の異なる画像を扱うことができ、特に高解像度の画像に対して十分な画像情報を利用することができる。
- 参考スコア(独自算出の注目度): 12.89160593375335
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We present a novel deep learning framework named the Iteratively Optimized
Patch Label Inference Network (IOPLIN) for automatically detecting various
pavement distresses that are not solely limited to specific ones, such as
cracks and potholes. IOPLIN can be iteratively trained with only the image
label via the Expectation-Maximization Inspired Patch Label Distillation
(EMIPLD) strategy, and accomplish this task well by inferring the labels of
patches from the pavement images. IOPLIN enjoys many desirable properties over
the state-of-the-art single branch CNN models such as GoogLeNet and
EfficientNet. It is able to handle images in different resolutions, and
sufficiently utilize image information particularly for the high-resolution
ones, since IOPLIN extracts the visual features from unrevised image patches
instead of the resized entire image. Moreover, it can roughly localize the
pavement distress without using any prior localization information in the
training phase. In order to better evaluate the effectiveness of our method in
practice, we construct a large-scale Bituminous Pavement Disease Detection
dataset named CQU-BPDD consisting of 60,059 high-resolution pavement images,
which are acquired from different areas at different times. Extensive results
on this dataset demonstrate the superiority of IOPLIN over the state-of-the-art
image classification approaches in automatic pavement distress detection. The
source codes of IOPLIN are released on
\url{https://github.com/DearCaat/ioplin}, and the CQU-BPDD dataset is able to
be accessed on \url{https://dearcaat.github.io/CQU-BPDD/}.
- Abstract(参考訳): 本稿では, クラックやポットホールなど, 特定のものに限らず, 様々な舗装障害を自動的に検出する, IOPLIN (Iteratively Optimized Patch Label Inference Network) という新しいディープラーニングフレームワークを提案する。
IOPLINは、期待最大化インスパイアされたパッチラベル蒸留(EMIPLD)戦略を介してイメージラベルのみを用いて反復的にトレーニングすることができ、舗装画像からパッチのラベルを推測することで、このタスクをうまく達成することができる。
IOPLINは、GoogLeNetやEfficientNetのような最先端の単一ブランチCNNモデルよりも多くの望ましい特性を享受している。
IOPLINは画像全体ではなく、修正されていない画像パッチから視覚的特徴を抽出するため、解像度の異なる画像を扱うことができ、特に高解像度画像に対して十分な画像情報を利用することができる。
また、トレーニング段階で事前の局在情報を用いることなく、舗装難易度を概ね局所化することができる。
本手法の有効性をよりよく評価するために,異なる領域から異なる時間に取得した60,059枚の高分解能舗装画像からなる,cqu-bpddと呼ばれる大容量の帯状舗装疾患検出データセットを構築した。
このデータセットの広範囲な結果は、自動舗装災害検出における最先端画像分類手法よりもIOPLINの方が優れていることを示している。
IOPLINのソースコードは \url{https://github.com/DearCaat/ioplin} でリリースされ、CQU-BPDDデータセットは \url{https://dearcaat.github.io/CQU-BPDD/} でアクセスできる。
関連論文リスト
- Semi-supervised 3D Object Detection with PatchTeacher and PillarMix [71.4908268136439]
現在の半教師付き3Dオブジェクト検出法では、教師が学生に擬似ラベルを生成するのが一般的である。
学生に高品質な擬似ラベルを提供するために,部分的なシーン3Dオブジェクト検出に焦点を当てたPatchTeacherを提案する。
本稿では,PatchTeacherの性能向上のために,Patch Normalizer,Quadrant Align,Fovea Selectionの3つの重要なテクニックを紹介する。
論文 参考訳(メタデータ) (2024-07-13T06:58:49Z) - CLIP-Guided Source-Free Object Detection in Aerial Images [17.26407623526735]
高解像度の空中画像は、しばしばかなりのストレージスペースを必要とし、一般にはアクセスできない。
そこで本研究では,これらの課題に対処する新しいSFOD法を提案する。
自己学習における雑音ラベルを緩和するために,コントラスト言語画像事前学習(CLIP)を用いて擬似ラベルの生成を誘導する。
CLIPのゼロショット分類機能を利用することで、そのスコアを予測された元のバウンディングボックスに集約し、擬似ラベルの洗練されたスコアを得ることができる。
論文 参考訳(メタデータ) (2024-01-10T14:03:05Z) - Probabilistic Deep Metric Learning for Hyperspectral Image
Classification [91.5747859691553]
本稿では,ハイパースペクトル画像分類のための確率論的深度学習フレームワークを提案する。
ハイパースペクトルセンサーが捉えた画像に対して、各ピクセルのカテゴリを予測することを目的としている。
我々のフレームワークは、既存のハイパースペクトル画像分類法に容易に適用できる。
論文 参考訳(メタデータ) (2022-11-15T17:57:12Z) - Towards Effective Image Manipulation Detection with Proposal Contrastive
Learning [61.5469708038966]
本稿では,効果的な画像操作検出のためのコントラスト学習(PCL)を提案する。
我々のPCLは、RGBとノイズビューから2種類のグローバル特徴を抽出し、2ストリームアーキテクチャで構成されている。
我々のPCLは、実際にラベル付けされていないデータに容易に適用でき、手作業によるラベル付けコストを削減し、より一般化可能な機能を促進することができる。
論文 参考訳(メタデータ) (2022-10-16T13:30:13Z) - PicT: A Slim Weakly Supervised Vision Transformer for Pavement Distress
Classification [10.826472503315912]
舗装障害分類のためのtextbfPavement textbf Image textbfClassification textbfPicT という視覚変換器を提案する。
textbfPicTは2番目にパフォーマンスの高いモデルよりも大きなマージンで優れています。
論文 参考訳(メタデータ) (2022-09-21T02:33:49Z) - Weakly Supervised Patch Label Inference Networks for Efficient Pavement
Distress Detection and Recognition in the Wild [14.16549562799135]
Weakly Supervised Patch Label Inference Networks (WSPLIN) を提案する。
WSPLINは、完全に教師付き舗装画像分類問題を弱教師付き舗装画像分類問題に変換する。
本手法は, 大規模舗装救難データセットを用いて評価する。
論文 参考訳(メタデータ) (2022-03-31T04:01:02Z) - Patch-Based Stochastic Attention for Image Editing [4.8201607588546]
PatchMatchアルゴリズムをベースとした,近接する近傍近傍の同定に有効なアテンション層を提案する。
画像インペイント, ガイド画像のカラー化, シングルイメージ超解像など, 画像編集作業におけるPSALの有用性を示す。
論文 参考訳(メタデータ) (2022-02-07T13:42:00Z) - Maximize the Exploration of Congeneric Semantics for Weakly Supervised
Semantic Segmentation [27.155133686127474]
グラフニューラルネットワーク(P-GNN)を,同一のクラスラベルを含む異なる画像からの自己検出パッチに基づいて構築する。
PASCAL VOC 2012ベンチマークで実験を行い、そのモデルにより最先端の性能が得られた。
論文 参考訳(メタデータ) (2021-10-08T08:59:16Z) - DSNet: A Dual-Stream Framework for Weakly-Supervised Gigapixel Pathology
Image Analysis [78.78181964748144]
スライド画像全体(WSI)を分類するための弱教師付きフレームワークを提案する。
WSIは通常、パッチレベルのラベルを持つパッチワイド分類によって処理される。
イメージレベルのラベルのみの場合、パッチの外観とイメージレベルのラベルの矛盾のため、パッチの分類はサブ最適となる。
論文 参考訳(メタデータ) (2021-09-13T09:10:43Z) - Semi-Supervised Domain Adaptation with Prototypical Alignment and
Consistency Learning [86.6929930921905]
本稿では,いくつかの対象サンプルがラベル付けされていれば,ドメインシフトに対処するのにどの程度役立つか検討する。
ランドマークの可能性を最大限に追求するために、ランドマークから各クラスのターゲットプロトタイプを計算するプロトタイプアライメント(PA)モジュールを組み込んでいます。
具体的には,ラベル付き画像に深刻な摂動を生じさせ,PAを非自明にし,モデル一般化性を促進する。
論文 参考訳(メタデータ) (2021-04-19T08:46:08Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。