論文の概要: Sewer-ML: A Multi-Label Sewer Defect Classification Dataset and
Benchmark
- arxiv url: http://arxiv.org/abs/2103.10895v1
- Date: Fri, 19 Mar 2021 16:32:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-22 14:30:38.755105
- Title: Sewer-ML: A Multi-Label Sewer Defect Classification Dataset and
Benchmark
- Title(参考訳): sewer-ml:マルチラベル下水道欠陥分類データセットとベンチマーク
- Authors: Joakim Bruslund Haurum and Thomas B. Moeslund
- Abstract要約: 画像に基づく下水道欠陥分類のための新しい多ラベル分類データセットであるSwer-MLを提案する。
このデータセットは、9年間に3つの異なるユーティリティ企業からプロの下水道検査官がアノテートした1300万枚の画像で構成されています。
また,性能評価のためのベンチマークアルゴリズムと新しい指標を提案する。
- 参考スコア(独自算出の注目度): 29.728476976320913
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Perhaps surprisingly sewerage infrastructure is one of the most costly
infrastructures in modern society. Sewer pipes are manually inspected to
determine whether the pipes are defective. However, this process is limited by
the number of qualified inspectors and the time it takes to inspect a pipe.
Automatization of this process is therefore of high interest. So far, the
success of computer vision approaches for sewer defect classification has been
limited when compared to the success in other fields mainly due to the lack of
public datasets. To this end, in this work we present a large novel and
publicly available multi-label classification dataset for image-based sewer
defect classification called Sewer-ML.
The Sewer-ML dataset consists of 1.3 million images annotated by professional
sewer inspectors from three different utility companies across nine years.
Together with the dataset, we also present a benchmark algorithm and a novel
metric for assessing performance. The benchmark algorithm is a result of
evaluating 12 state-of-the-art algorithms, six from the sewer defect
classification domain and six from the multi-label classification domain, and
combining the best performing algorithms. The novel metric is a
class-importance weighted F2 score, $\text{F}2_{\text{CIW}}$, reflecting the
economic impact of each class, used together with the normal pipe F1 score,
$\text{F}1_{\text{Normal}}$. The benchmark algorithm achieves an
$\text{F}2_{\text{CIW}}$ score of 55.11% and $\text{F}1_{\text{Normal}}$ score
of 90.94%, leaving ample room for improvement on the Sewer-ML dataset. The
code, models, and dataset are available at the project page
https://vap.aau.dk/sewer-ml/
- Abstract(参考訳): おそらく、下水道インフラは現代の社会で最もコストのかかるインフラの1つである。
下水道管は手動で検査され、パイプが故障しているかどうかを判定する。
しかし、このプロセスは、資格のある検査官の数と、パイプの検査に要する時間によって制限される。
したがって、このプロセスの自動化は高い関心を集めている。
これまでのところ、下水道の欠陥分類におけるコンピュータビジョンのアプローチの成功は、公開データセットの欠如による他分野の成功と比べて限定されている。
そこで本研究では,画像に基づく下水道欠陥分類のための多ラベル分類データセットであるSwer-MLを提案する。
下水道MLデータセットは、9年間に3つの異なるユーティリティ企業の下水道検査官によって注釈付けされた13万枚の画像で構成されている。
また,このデータセットとともに,ベンチマークアルゴリズムと性能評価のための新しい指標を提案する。
ベンチマークアルゴリズムは、12の最先端アルゴリズム、下水道欠陥分類領域から6つ、マルチラベル分類領域から6つの評価を行い、最高の性能アルゴリズムを組み合わせる。
新しいメトリクスは、クラスが重み付けしたF2スコア、$\text{F}2_{\text{CIW}}$であり、通常のパイプF1スコア、$\text{F}1_{\text{Normal}}$と共に使用される各クラスの経済的影響を反映している。
ベンチマークアルゴリズムは、$\text{F}2_{\text{CIW}}$スコア55.11%、$\text{F}1_{\text{Normal}}$スコア90.94%を達成し、Swer-MLデータセットに十分な改善の余地を残している。
コード、モデル、データセットはプロジェクトページhttps://vap.aau.dk/sewer-ml/で確認できる。
関連論文リスト
- Making Binary Classification from Multiple Unlabeled Datasets Almost
Free of Supervision [128.6645627461981]
本稿では,複数ラベル付きデータセットからの2値分類という新たな問題設定を提案する。
MU-OPPOでは、ラベル付けされていないすべてのデータセットのクラスプリエントは不要です。
このフレームワークは,クラス前の推定誤差が小さくなり,バイナリ分類の性能が向上することを示す。
論文 参考訳(メタデータ) (2023-06-12T11:33:46Z) - Certifiable Robustness for Naive Bayes Classifiers [9.607140241097254]
予測がトレーニングされたデータセットに関係なく同じままであれば、テストポイントはML分類器にとって確実に堅牢である。
テストポイントがNBCにとって確実に堅牢であるかどうかを判断するデータセットのエントリ数に線形時間アルゴリズムを提案する。
決定とデータ中毒の問題に対する我々のアルゴリズムは、ベースラインアルゴリズムよりも19.5タイム、および3.06タイムのスピードアップを達成できることを示す。
論文 参考訳(メタデータ) (2023-03-08T02:01:14Z) - Extending One-Stage Detection with Open-World Proposals [8.492340530784697]
完全畳み込み型一段検出ネットワークFCOSは,新しい授業で最大6%のOWP性能を向上できることを示す。
新たな授業では2段階の手法が6%悪くなったが,共同でOWPと分類を最適化した場合,FCOSは2%しか低下しないことがわかった。
論文 参考訳(メタデータ) (2022-01-07T02:29:09Z) - Multi-Task Classification of Sewer Pipe Defects and Properties using a
Cross-Task Graph Neural Network Decoder [56.673599764041384]
我々は、新しいデコーダ指向マルチタスク分類アーキテクチャ、クロスタスクグラフニューラルネットワーク(CT-GNN)を提案する。
CT-GNNは、クロスタスク情報を用いてタスクごとの解離予測を洗練する。
我々は,Swer-MLデータセットの4つの分類タスクすべてに対して,最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-11-15T15:36:50Z) - Noise-Resistant Deep Metric Learning with Probabilistic Instance
Filtering [59.286567680389766]
ノイズラベルは現実世界のデータによく見られ、ディープニューラルネットワークの性能劣化を引き起こす。
DMLのための確率的ランク付けに基づくメモリを用いたインスタンス選択(PRISM)手法を提案する。
PRISMはラベルがクリーンである確率を計算し、潜在的にノイズの多いサンプルをフィルタリングする。
論文 参考訳(メタデータ) (2021-08-03T12:15:25Z) - Bridging the Gap Between Clean Data Training and Real-World Inference
for Spoken Language Understanding [76.89426311082927]
既存のモデルはクリーンデータに基づいてトレーニングされ、クリーンデータトレーニングと現実世界の推論の間にtextitgapが発生する。
本稿では,良質なサンプルと低品質のサンプルの両方が類似ベクトル空間に埋め込まれた領域適応法を提案する。
広く使用されているデータセット、スニップス、および大規模な社内データセット(1000万のトレーニング例)に関する実験では、この方法は実世界の(騒々しい)コーパスのベースラインモデルを上回るだけでなく、堅牢性、すなわち、騒々しい環境下で高品質の結果を生み出すことを実証しています。
論文 参考訳(メタデータ) (2021-04-13T17:54:33Z) - Fewer is More: A Deep Graph Metric Learning Perspective Using Fewer
Proxies [65.92826041406802]
本稿では,グラフ分類の観点から,プロキシベースのディープグラフメトリックラーニング手法を提案する。
複数のグローバルプロキシを利用して、各クラスの元のデータポイントを総括的に近似する。
本研究では, 近接関係を接地トラス・ラベルに従って調整する, 新たな逆ラベル伝搬アルゴリズムを設計する。
論文 参考訳(メタデータ) (2020-10-26T14:52:42Z) - DeepTopPush: Simple and Scalable Method for Accuracy at the Top [0.0]
上位の精度は、少数の関連する(トップ)サンプルでのみ性能が評価される、バイナリ分類問題の特別なクラスである。
任意の(ディープ)ネットワークの形で分類器を検討し、トップの損失関数を最小化するための新しい手法DeepTopPushを提案する。
視覚認識データセットと実世界の2つのアプリケーションにおけるDeepTopPushの優れた性能を示す。
論文 参考訳(メタデータ) (2020-06-22T14:26:55Z) - Online Metric Learning for Multi-Label Classification [22.484707213499714]
マルチラベル分類のための新しいオンラインメトリック学習パラダイムを提案する。
我々はまず,$k$-Nearest Neighbour(k$NN)に基づくマルチラベル分類のための新しい指標を提案する。
論文 参考訳(メタデータ) (2020-06-12T11:33:04Z) - Generalized Focal Loss: Learning Qualified and Distributed Bounding
Boxes for Dense Object Detection [85.53263670166304]
一段検出器は基本的に、物体検出を密度の高い分類と位置化として定式化する。
1段検出器の最近の傾向は、局所化の質を推定するために個別の予測分岐を導入することである。
本稿では, 上記の3つの基本要素, 品質推定, 分類, ローカライゼーションについて述べる。
論文 参考訳(メタデータ) (2020-06-08T07:24:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。