論文の概要: Rail-5k: a Real-World Dataset for Rail Surface Defects Detection
- arxiv url: http://arxiv.org/abs/2106.14366v1
- Date: Mon, 28 Jun 2021 01:53:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-29 18:05:17.246169
- Title: Rail-5k: a Real-World Dataset for Rail Surface Defects Detection
- Title(参考訳): Rail-5k:レール表面欠陥検出のための実世界のデータセット
- Authors: Zihao Zhang, Shaozuo Yu, Siwei Yang, Yu Zhou, Bingchen Zhao
- Abstract要約: 本稿では,実世界のアプリケーションシナリオにおける視覚アルゴリズムの性能をベンチマークするためのRail-5kデータセットを提案する。
われわれは、中国各地の鉄道から5万枚以上の高品質の画像を集め、1100枚の画像に注釈を付け、鉄道の専門家の助けを借りて、最も一般的な13種類の鉄道欠陥を特定した。
- 参考スコア(独自算出の注目度): 10.387206647221626
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents the Rail-5k dataset for benchmarking the performance of
visual algorithms in a real-world application scenario, namely the rail surface
defects detection task. We collected over 5k high-quality images from railways
across China, and annotated 1100 images with the help from railway experts to
identify the most common 13 types of rail defects. The dataset can be used for
two settings both with unique challenges, the first is the fully-supervised
setting using the 1k+ labeled images for training, fine-grained nature and
long-tailed distribution of defect classes makes it hard for visual algorithms
to tackle. The second is the semi-supervised learning setting facilitated by
the 4k unlabeled images, these 4k images are uncurated containing possible
image corruptions and domain shift with the labeled images, which can not be
easily tackle by previous semi-supervised learning methods. We believe our
dataset could be a valuable benchmark for evaluating robustness and reliability
of visual algorithms.
- Abstract(参考訳): 本稿では,実世界のアプリケーションシナリオ,すなわちレール表面欠陥検出タスクにおいて,視覚アルゴリズムの性能をベンチマークするための rail-5k データセットを提案する。
中国各地の鉄道から5k以上の高品質の画像を集め、鉄道の専門家の助けを借りて1100枚の画像に注釈を付け、最も一般的な13種類の鉄道欠陥を特定した。
1つは、トレーニングのために1k+ラベル付きイメージを使用して完全に教師された設定、きめ細かい性質、そして欠陥クラスの長い尾の分布を使用すると、ビジュアルアルゴリズムが取り組むのが難しくなることだ。
2つ目は、4k未ラベル画像による半教師付き学習設定であり、これらの4k画像はラベル付き画像との領域シフトを含む未修正であり、従来の半教師付き学習方法では容易に対処できない。
当社のデータセットは,視覚的アルゴリズムの堅牢性と信頼性を評価する上で,貴重なベンチマークになると思います。
関連論文リスト
- ForgeryTTT: Zero-Shot Image Manipulation Localization with Test-Time Training [42.58645429356456]
ソーシャルメディアは、現実的なフェイク画像に悩まされているため、コンテンツを信頼するのは難しい。
これらの偽物を検出するアルゴリズムは、特定のデータセットでトレーニングされているため、新しい現実世界のシナリオでは失敗することが多い。
ForgeryTTTは、画像中の操作された領域を識別するためにテスト時間トレーニングを利用する最初の方法である。
論文 参考訳(メタデータ) (2024-10-05T04:41:55Z) - Enhancing Low-Light Images in Real World via Cross-Image Disentanglement [58.754943762945864]
そこで本研究では,現実の汚職とミスアライメントされたトレーニング画像からなる,新しい低照度画像強調データセットを提案する。
本モデルでは,新たに提案したデータセットと,他の一般的な低照度データセットの両方に対して,最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-01-10T03:12:52Z) - Data Efficient Language-supervised Zero-shot Recognition with Optimal
Transport Distillation [43.03533959429743]
本稿では,オンライン最適トランスポートを用いて,コントラスト学習のためのラベルとしてソフトな画像テキストマッチングを求めるOTTERを提案する。
事前訓練された画像とテキストエンコーダに基づいて、OTTERで訓練されたモデルは、3M画像テキストペアだけで強力なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2021-12-17T11:27:26Z) - A Novel Disaster Image Dataset and Characteristics Analysis using
Attention Model [2.1473182295633224]
このデータセットには、火災、水、陸の3つの異なる災害のために様々なソースから収集された画像が含まれている。
このデータセットには13,720の注釈付き画像があり、各画像は3人の個人によって注釈付けされている。
3層アテンションモデル(TLAM)をトレーニングし、平均5倍の検証精度95.88%を達成する。
論文 参考訳(メタデータ) (2021-07-02T21:18:20Z) - Few-Shot Learning with Part Discovery and Augmentation from Unlabeled
Images [79.34600869202373]
帰納的バイアスは、ラベルなし画像の平坦な集合から学習でき、目に見えるクラスと目に見えないクラスの間で伝達可能な表現としてインスタンス化されることを示す。
具体的には、トランスファー可能な表現を学習するための、新しいパートベース自己教師型表現学習手法を提案する。
我々の手法は印象的な結果をもたらし、それまでの最高の教師なし手法を7.74%、9.24%上回った。
論文 参考訳(メタデータ) (2021-05-25T12:22:11Z) - DetCo: Unsupervised Contrastive Learning for Object Detection [64.22416613061888]
教師なしのコントラスト学習は,CNNを用いた画像表現学習において大きな成功を収めている。
我々は,グローバルイメージとローカルイメージパッチのコントラストをフルに検討する,DetCoという新しいコントラスト学習手法を提案する。
DetCoは1倍のスケジュールでMask RCNN-C4/FPN/RetinaNet上で1.6/1.2/1.0 APで教師付き手法を一貫して上回っている。
論文 参考訳(メタデータ) (2021-02-09T12:47:20Z) - Grafit: Learning fine-grained image representations with coarse labels [114.17782143848315]
本稿では,学習ラベルの提供するものよりも細かな表現を学習する問題に対処する。
粗いラベルと下層の細粒度潜在空間を併用することにより、カテゴリレベルの検索手法の精度を大幅に向上させる。
論文 参考訳(メタデータ) (2020-11-25T19:06:26Z) - Semi-Supervised Image Deraining using Gaussian Processes [18.434430658837258]
合成データセットを用いて学習のネットワークをデライン化できる半教師付き学習フレームワークを提案する。
提案手法は,ラベル付き学習に比べ,ラベル付き学習に比べて性能が著しく向上することを示す。
論文 参考訳(メタデータ) (2020-09-25T17:16:16Z) - Deep Traffic Sign Detection and Recognition Without Target Domain Real
Images [52.079665469286496]
本稿では,ターゲットドメインからの実際の画像を必要としない新しいデータベース生成手法と,(ii)交通標識のテンプレートを提案する。
この方法は、実際のデータでトレーニングを克服することではなく、実際のデータが利用できない場合に互換性のある代替手段になることを目的としている。
大規模なデータセットでは、完全に合成されたデータセットによるトレーニングは、実際のデータセットとトレーニングのパフォーマンスにほぼ一致する。
論文 参考訳(メタデータ) (2020-07-30T21:06:47Z) - Syn2Real Transfer Learning for Image Deraining using Gaussian Processes [92.15895515035795]
CNNに基づく画像デライニング手法は,再現誤差や視覚的品質の点で優れた性能を発揮している。
実世界の完全ラベル付き画像デライニングデータセットを取得する上での課題により、既存の手法は合成されたデータのみに基づいて訓練される。
本稿では,ガウス過程に基づく半教師付き学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-10T00:33:18Z) - Near real-time map building with multi-class image set labelling and
classification of road conditions using convolutional neural networks [3.441021278275805]
天候は交通と道路の安全に影響を与える重要な要因である。
北米のストリートカメラやハイウェイカメラが撮影した画像のラベル付けには、最先端の畳み込みニューラルネットワークを活用しています。
論文 参考訳(メタデータ) (2020-01-27T18:07:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。