Fugu-MT 論文翻訳(概要): Sewer-ML: A Multi-Label Sewer Defect Classification Dataset and Benchmark

論文の概要: Sewer-ML: A Multi-Label Sewer Defect Classification Dataset and Benchmark

arxiv url: http://arxiv.org/abs/2103.10895v1
Date: Fri, 19 Mar 2021 16:32:37 GMT
ステータス: 翻訳完了
システム内更新日: 2021-03-22 14:30:38.755105
Title: Sewer-ML: A Multi-Label Sewer Defect Classification Dataset and Benchmark
Title（参考訳）: sewer-ml:マルチラベル下水道欠陥分類データセットとベンチマーク
Authors: Joakim Bruslund Haurum and Thomas B. Moeslund
Abstract要約: 画像に基づく下水道欠陥分類のための新しい多ラベル分類データセットであるSwer-MLを提案する。このデータセットは、9年間に3つの異なるユーティリティ企業からプロの下水道検査官がアノテートした1300万枚の画像で構成されています。また,性能評価のためのベンチマークアルゴリズムと新しい指標を提案する。
参考スコア（独自算出の注目度）: 29.728476976320913
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Perhaps surprisingly sewerage infrastructure is one of the most costly infrastructures in modern society. Sewer pipes are manually inspected to determine whether the pipes are defective. However, this process is limited by the number of qualified inspectors and the time it takes to inspect a pipe. Automatization of this process is therefore of high interest. So far, the success of computer vision approaches for sewer defect classification has been limited when compared to the success in other fields mainly due to the lack of public datasets. To this end, in this work we present a large novel and publicly available multi-label classification dataset for image-based sewer defect classification called Sewer-ML. The Sewer-ML dataset consists of 1.3 million images annotated by professional sewer inspectors from three different utility companies across nine years. Together with the dataset, we also present a benchmark algorithm and a novel metric for assessing performance. The benchmark algorithm is a result of evaluating 12 state-of-the-art algorithms, six from the sewer defect classification domain and six from the multi-label classification domain, and combining the best performing algorithms. The novel metric is a class-importance weighted F2 score, $\text{F}2_{\text{CIW}}$, reflecting the economic impact of each class, used together with the normal pipe F1 score, $\text{F}1_{\text{Normal}}$. The benchmark algorithm achieves an $\text{F}2_{\text{CIW}}$ score of 55.11% and $\text{F}1_{\text{Normal}}$ score of 90.94%, leaving ample room for improvement on the Sewer-ML dataset. The code, models, and dataset are available at the project page https://vap.aau.dk/sewer-ml/
Abstract（参考訳）: おそらく、下水道インフラは現代の社会で最もコストのかかるインフラの1つである。下水道管は手動で検査され、パイプが故障しているかどうかを判定する。しかし、このプロセスは、資格のある検査官の数と、パイプの検査に要する時間によって制限される。したがって、このプロセスの自動化は高い関心を集めている。これまでのところ、下水道の欠陥分類におけるコンピュータビジョンのアプローチの成功は、公開データセットの欠如による他分野の成功と比べて限定されている。そこで本研究では,画像に基づく下水道欠陥分類のための多ラベル分類データセットであるSwer-MLを提案する。下水道MLデータセットは、9年間に3つの異なるユーティリティ企業の下水道検査官によって注釈付けされた13万枚の画像で構成されている。また,このデータセットとともに,ベンチマークアルゴリズムと性能評価のための新しい指標を提案する。ベンチマークアルゴリズムは、12の最先端アルゴリズム、下水道欠陥分類領域から6つ、マルチラベル分類領域から6つの評価を行い、最高の性能アルゴリズムを組み合わせる。新しいメトリクスは、クラスが重み付けしたF2スコア、$\text{F}2_{\text{CIW}}$であり、通常のパイプF1スコア、$\text{F}1_{\text{Normal}}$と共に使用される各クラスの経済的影響を反映している。ベンチマークアルゴリズムは、$\text{F}2_{\text{CIW}}$スコア55.11%、$\text{F}1_{\text{Normal}}$スコア90.94%を達成し、Swer-MLデータセットに十分な改善の余地を残している。コード、モデル、データセットはプロジェクトページhttps://vap.aau.dk/sewer-ml/で確認できる。

関連論文リスト

A Pipeline of Augmentation and Sequence Embedding for Classification of Imbalanced Network Traffic [0.0]
本稿では,頑健で正確な埋め込み手法を用いて,データセットのバランスと分類を行うパイプラインを提案する。提案した拡張パイプラインとFS-Embeddingを組み合わせることで収束速度が向上し,モデルパラメータの数が大幅に減少することを示す。
論文参考訳（メタデータ） (2025-02-26T07:55:24Z)
RecFlow: An Industrial Full Flow Recommendation Dataset [66.06445386541122]
産業レコメンデーションシステムは、商品をユーザに届ける際の効率性と効率のバランスをとるために、多段階パイプラインに依存している。オフラインRSベンチマークと実際のオンライン環境とのギャップを埋めるために設計された産業用フルフローレコメンデーションデータセットであるRecFlowを紹介します。我々のデータセットは、約9万項目にわたる42Kユーザからの38万のインタラクションで構成され、37日間にわたる9.3Mオンラインリクエストから収集された1.9Bステージサンプルと6ステージにまたがる。
論文参考訳（メタデータ） (2024-10-28T09:36:03Z)
Multi-label Sewer Pipe Defect Recognition with Mask Attention Feature Enhancement and Label Correlation Learning [5.9184143707401775]
マスク注意誘導特徴強調とラベル相関学習に基づくマルチラベルパイプ欠陥認識を提案する。提案手法は,Swer-MLトレーニングデータセットの1/16のみを用いて,現在の最先端の分類性能を実現する。
論文参考訳（メタデータ） (2024-08-01T11:51:50Z)
Scaling Laws for Data Filtering -- Data Curation cannot be Compute Agnostic [99.3682210827572]
ビジョン言語モデル(VLM)は、慎重にキュレートされたWebデータセット上で数千のGPU時間でトレーニングされる。データキュレーション戦略は通常、トレーニングに利用可能な計算を知らないように開発されている。ウェブデータの非均一性を考慮したニューラルスケーリング法則を導入する。
論文参考訳（メタデータ） (2024-04-10T17:27:54Z)
Automatic Defect Detection in Sewer Network Using Deep Learning Based Object Detector [0.0]
様々な下水道管14.7kmのデータセットに注釈が付された。オブジェクト検出器(EfficientDet-D0)が自動欠陥検出のために訓練された。テストセットの83%の欠陥を検出することができ、欠落した17%のうち、非常に深刻な欠陥はわずか0.77%であった。
論文参考訳（メタデータ） (2024-04-09T11:13:36Z)
Extending One-Stage Detection with Open-World Proposals [8.492340530784697]
完全畳み込み型一段検出ネットワークFCOSは,新しい授業で最大6%のOWP性能を向上できることを示す。新たな授業では2段階の手法が6%悪くなったが,共同でOWPと分類を最適化した場合,FCOSは2%しか低下しないことがわかった。
論文参考訳（メタデータ） (2022-01-07T02:29:09Z)
Multi-Task Classification of Sewer Pipe Defects and Properties using a Cross-Task Graph Neural Network Decoder [56.673599764041384]
我々は、新しいデコーダ指向マルチタスク分類アーキテクチャ、クロスタスクグラフニューラルネットワーク(CT-GNN)を提案する。 CT-GNNは、クロスタスク情報を用いてタスクごとの解離予測を洗練する。我々は,Swer-MLデータセットの4つの分類タスクすべてに対して,最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (2021-11-15T15:36:50Z)
Noise-Resistant Deep Metric Learning with Probabilistic Instance Filtering [59.286567680389766]
ノイズラベルは現実世界のデータによく見られ、ディープニューラルネットワークの性能劣化を引き起こす。 DMLのための確率的ランク付けに基づくメモリを用いたインスタンス選択(PRISM)手法を提案する。 PRISMはラベルがクリーンである確率を計算し、潜在的にノイズの多いサンプルをフィルタリングする。
論文参考訳（メタデータ） (2021-08-03T12:15:25Z)
Fewer is More: A Deep Graph Metric Learning Perspective Using Fewer Proxies [65.92826041406802]
本稿では,グラフ分類の観点から,プロキシベースのディープグラフメトリックラーニング手法を提案する。複数のグローバルプロキシを利用して、各クラスの元のデータポイントを総括的に近似する。本研究では, 近接関係を接地トラス・ラベルに従って調整する, 新たな逆ラベル伝搬アルゴリズムを設計する。
論文参考訳（メタデータ） (2020-10-26T14:52:42Z)
Online Metric Learning for Multi-Label Classification [22.484707213499714]
マルチラベル分類のための新しいオンラインメトリック学習パラダイムを提案する。我々はまず,$k$-Nearest Neighbour(k$NN)に基づくマルチラベル分類のための新しい指標を提案する。
論文参考訳（メタデータ） (2020-06-12T11:33:04Z)
Generalized Focal Loss: Learning Qualified and Distributed Bounding Boxes for Dense Object Detection [85.53263670166304]
一段検出器は基本的に、物体検出を密度の高い分類と位置化として定式化する。 1段検出器の最近の傾向は、局所化の質を推定するために個別の予測分岐を導入することである。本稿では, 上記の3つの基本要素, 品質推定, 分類, ローカライゼーションについて述べる。
論文参考訳（メタデータ） (2020-06-08T07:24:33Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。