論文の概要: Optimized Deep Encoder-Decoder Methods for Crack Segmentation
- arxiv url: http://arxiv.org/abs/2008.06266v2
- Date: Thu, 26 Aug 2021 09:57:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-30 17:29:40.791172
- Title: Optimized Deep Encoder-Decoder Methods for Crack Segmentation
- Title(参考訳): き裂分離のための最適化ディープエンコーダデコーダ法
- Authors: Jacob K\"onig, Mark Jenkins, Mike Mannion, Peter Barrie, Gordon
Morison
- Abstract要約: 表面き裂のセグメンテーションは、背景、形状、色、き裂の大きさが異なるため、コンピュータビジョンの課題となる。
本研究では,クラックセグメンテーション性能を向上する手法を組み合わせて,最適化されたディープエンコーダデコーダ法を提案する。
- 参考スコア(独自算出の注目度): 0.9449650062296824
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Surface crack segmentation poses a challenging computer vision task as
background, shape, colour and size of cracks vary. In this work we propose
optimized deep encoder-decoder methods consisting of a combination of
techniques which yield an increase in crack segmentation performance.
Specifically we propose a decoder-part for an encoder-decoder based deep
learning architecture for semantic segmentation and study its components to
achieve increased performance. We also examine the use of different encoder
strategies and introduce a data augmentation policy to increase the amount of
available training data. The performance evaluation of our method is carried
out on four publicly available crack segmentation datasets. Additionally, we
introduce two techniques into the field of surface crack segmentation,
previously not used there: Generating results using test-time-augmentation and
performing a statistical result analysis over multiple training runs. The
former approach generally yields increased performance results, whereas the
latter allows for more reproducible and better representability of a methods
results. Using those aforementioned strategies with our proposed
encoder-decoder architecture we are able to achieve new state of the art
results in all datasets.
- Abstract(参考訳): 表面き裂のセグメンテーションは、背景、形状、色、サイズが異なるため、コンピュータビジョンの課題となる。
本研究では,クラックセグメンテーション性能を向上する手法を組み合わせて,最適化されたディープエンコーダデコーダ法を提案する。
具体的には,セマンティックセグメンテーションのためのエンコーダ-デコーダベースのディープラーニングアーキテクチャのためのデコーダ-パートを提案する。
また,異なるエンコーダ戦略の利用について検討し,利用可能なトレーニングデータ量を増やすためのデータ拡張ポリシーを導入する。
本手法の性能評価は,4つの公開クラックセグメンテーションデータセットを用いて行った。
さらに,従来は使用していなかった表面き裂分割の分野に2つの手法を導入する: テスト時間推定を用いた結果の生成と,複数のトレーニング実行における統計的結果解析を行う。
前者のアプローチではパフォーマンスが向上するのに対して,後者では再現性が高く,メソッドの結果の表現性が向上する。
上記の戦略を,提案したエンコーダデコーダアーキテクチャを用いて,すべてのデータセットで新たな成果を達成できる。
関連論文リスト
- Extreme Encoder Output Frame Rate Reduction: Improving Computational
Latencies of Large End-to-End Models [59.57732929473519]
エンコーダに複数のフレーム削減層を適用し,少数の出力フレームにエンコーダ出力を圧縮する。
入力音声の2.56秒毎に1つのエンコーダ出力フレームを生成できることを示す。
論文 参考訳(メタデータ) (2024-02-27T03:40:44Z) - Using DUCK-Net for Polyp Image Segmentation [0.0]
DUCK-Netは、少量の医療画像から効果的に学習し、一般化し、正確なセグメンテーションタスクを実行することができる。
大腸内視鏡画像におけるポリープセグメンテーションに特有な機能を示す。
論文 参考訳(メタデータ) (2023-11-03T20:58:44Z) - TEACHTEXT: CrossModal Generalized Distillation for Text-Video Retrieval [103.85002875155551]
本研究では,大規模言語前訓練を利用した一般化蒸留法TeachTextを提案する。
提案手法をビデオ側モダリティに拡張し,テスト時に使用するモダリティの数を効果的に削減できることを示す。
提案手法は,いくつかのビデオ検索ベンチマークの精度を著しく向上させ,テスト時の計算オーバーヘッドを増加させない。
論文 参考訳(メタデータ) (2021-04-16T17:55:28Z) - A Holistically-Guided Decoder for Deep Representation Learning with
Applications to Semantic Segmentation and Object Detection [74.88284082187462]
一般的な戦略の1つは、バックボーンネットワークに拡張畳み込みを採用し、高解像度のフィーチャーマップを抽出することです。
本稿では,高分解能なセマンティクスリッチな特徴マップを得るために紹介される,新たなホリスティック誘導デコーダを提案する。
論文 参考訳(メタデータ) (2020-12-18T10:51:49Z) - EfficientFCN: Holistically-guided Decoding for Semantic Segmentation [49.27021844132522]
最先端セマンティックセマンティックセグメンテーションアルゴリズムは主に拡張されたFully Convolutional Networks (DilatedFCN)に基づいている
本稿では,拡張畳み込みのないイメージネット事前学習ネットワークをバックボーンとする,効率的なFCNを提案する。
このようなフレームワークは、計算コストの1/3しか持たない最先端の手法に比べて、同等またはそれ以上の性能を達成する。
論文 参考訳(メタデータ) (2020-08-24T14:48:23Z) - Beyond Single Stage Encoder-Decoder Networks: Deep Decoders for Semantic
Image Segmentation [56.44853893149365]
セマンティックセグメンテーションのための単一エンコーダ-デコーダ手法は、セマンティックセグメンテーションの品質とレイヤー数あたりの効率の観点からピークに達している。
そこで本研究では,より多くの情報コンテンツを取得するために,浅層ネットワークの集合を用いたデコーダに基づく新しいアーキテクチャを提案する。
アーキテクチャをさらに改善するために,ネットワークの注目度を高めるために,クラスの再バランスを目的とした重み関数を導入する。
論文 参考訳(メタデータ) (2020-07-19T18:44:34Z) - Automatic Crack Detection on Road Pavements Using Encoder Decoder
Architecture [9.34360241512198]
提案アルゴリズムは,階層型特徴学習と拡張畳み込みを用いたエンコーダデコーダアーキテクチャ,U-階層型拡張ネットワーク (U-HDN) を提案する。
複数のコンテキスト情報を持つき裂特性は、自動的に学習し、エンドツーエンドのき裂検出を行うことができる。
論文 参考訳(メタデータ) (2020-07-01T13:32:23Z) - Rethinking and Improving Natural Language Generation with Layer-Wise
Multi-View Decoding [59.48857453699463]
シーケンシャル・ツー・シーケンス学習では、デコーダは注意機構に依存してエンコーダから情報を効率的に抽出する。
近年の研究では、異なるエンコーダ層からの表現を多様なレベルの情報に利用することが提案されている。
本稿では, 各デコーダ層に対して, グローバルビューとして機能する最後のエンコーダ層からの表現とともに, ソースシーケンスの立体視のために他のエンコーダ層からのデコーダ層からのデコーダ層を補足するレイヤワイド・マルチビューデコーダを提案する。
論文 参考訳(メタデータ) (2020-05-16T20:00:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。