論文の概要: Estimating label quality and errors in semantic segmentation data via
any model
- arxiv url: http://arxiv.org/abs/2307.05080v1
- Date: Tue, 11 Jul 2023 07:29:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-12 15:51:43.780057
- Title: Estimating label quality and errors in semantic segmentation data via
any model
- Title(参考訳): 任意のモデルによる意味的セグメンテーションデータのラベル品質と誤りの推定
- Authors: Vedang Lad, Jonas Mueller
- Abstract要約: ラベル品質を評価する手法について検討し、最も低いスコアのイメージを正しくラベル付けする可能性が低いことを示す。
これにより、高品質なトレーニング/評価データセットを保証するために、レビューするデータを優先順位付けすることが可能になる。
- 参考スコア(独自算出の注目度): 19.84626033109009
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The labor-intensive annotation process of semantic segmentation datasets is
often prone to errors, since humans struggle to label every pixel correctly. We
study algorithms to automatically detect such annotation errors, in particular
methods to score label quality, such that the images with the lowest scores are
least likely to be correctly labeled. This helps prioritize what data to review
in order to ensure a high-quality training/evaluation dataset, which is
critical in sensitive applications such as medical imaging and autonomous
vehicles. Widely applicable, our label quality scores rely on probabilistic
predictions from a trained segmentation model -- any model architecture and
training procedure can be utilized. Here we study 7 different label quality
scoring methods used in conjunction with a DeepLabV3+ or a FPN segmentation
model to detect annotation errors in a version of the SYNTHIA dataset.
Precision-recall evaluations reveal a score -- the soft-minimum of the
model-estimated likelihoods of each pixel's annotated class -- that is
particularly effective to identify images that are mislabeled, across multiple
types of annotation error.
- Abstract(参考訳): セマンティックセグメンテーションデータセットの労働集約的なアノテーションプロセスは、人間がすべてのピクセルを正しくラベル付けするのに苦労するため、エラーを起こしやすい。
このようなアノテーションエラーを自動的に検出するアルゴリズム、特にラベル品質をスコアする手法について検討し、スコアの低い画像が正しくラベル付けされる可能性が低かった。
これは、医療画像や自動運転車のようなセンシティブなアプリケーションで不可欠な高品質なトレーニング/評価データセットを確保するために、どのデータをレビューすべきかを優先するのに役立つ。
広く適用可能なラベルの品質スコアは、トレーニングされたセグメンテーションモデルからの確率的予測に依存している。
本稿では,DeepLabV3+やFPNセグメンテーションモデルと併用して,SynTHIAデータセットのバージョンにおけるアノテーションエラーを検出する7種類のラベル品質評価手法について検討する。
精度・リコール評価では、各ピクセルの注釈付きクラスにおけるモデル推定可能性のソフト最小値であるスコアが示され、複数のタイプのアノテーションエラーでラベルを間違えた画像を特定するのに特に効果的である。
関連論文リスト
- Improving Label Error Detection and Elimination with Uncertainty Quantification [5.184615738004059]
我々は不確実な量子化に基づくラベル誤り検出(UQ-LED)のための新しいモデル認識アルゴリズムを開発した。
我々のUQ-LEDアルゴリズムは、ラベルエラーの同定において最先端の信頼性学習より優れている。
本稿では,現実的なクラス依存ラベルエラーを合成的に生成する手法を提案する。
論文 参考訳(メタデータ) (2024-05-15T15:17:52Z) - Virtual Category Learning: A Semi-Supervised Learning Method for Dense
Prediction with Extremely Limited Labels [63.16824565919966]
本稿では,ラベルの修正を伴わずに,混乱したサンプルを積極的に使用することを提案する。
仮想カテゴリー(VC)は、モデルの最適化に安全に貢献できるように、各混乱したサンプルに割り当てられる。
私たちの興味深い発見は、密集した視覚タスクにおけるVC学習の利用に注目しています。
論文 参考訳(メタデータ) (2023-12-02T16:23:52Z) - AQuA: A Benchmarking Tool for Label Quality Assessment [16.83510474053401]
近年の研究では、機械学習モデルのトレーニングと評価に広く使用されているデータセットに、広範なラベル付けエラーがあることがわかった。
本稿では,ラベルノイズの存在下で機械学習を可能にする手法を厳格に評価するためのベンチマーク環境AQuAを提案する。
論文 参考訳(メタデータ) (2023-06-15T19:42:11Z) - Learning Confident Classifiers in the Presence of Label Noise [5.829762367794509]
本稿では,ノイズ観測のための確率論的モデルを提案し,信頼性の高い分類とセグメンテーションモデルの構築を可能にする。
実験により,本アルゴリズムは,検討された分類問題と分割問題に対して,最先端の解よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-01-02T04:27:25Z) - Automated Detection of Label Errors in Semantic Segmentation Datasets via Deep Learning and Uncertainty Quantification [5.279257531335345]
ピクセルワイドラベルを用いたセマンティックセグメンテーションデータセットにおけるラベル誤り検出手法を初めて提案する。
提案手法では,誤検出回数を制御しながら,ラベルエラーの大部分を検出することができる。
論文 参考訳(メタデータ) (2022-07-13T10:25:23Z) - Self-Supervised Learning as a Means To Reduce the Need for Labeled Data
in Medical Image Analysis [64.4093648042484]
胸部X線画像のデータセットとバウンディングボックスラベルを用いて,13種類の異常の分類を行った。
ラベル付きデータの平均精度と精度を60%に抑えることで,完全教師付きモデルと同等の性能が得られることを示す。
論文 参考訳(メタデータ) (2022-06-01T09:20:30Z) - Learning from Partially Overlapping Labels: Image Segmentation under
Annotation Shift [68.6874404805223]
腹部臓器分節の文脈におけるラベルの重複から学ぶためのいくつかの方法を提案する。
半教師付きアプローチと適応的クロスエントロピー損失を組み合わせることで、不均一な注釈付きデータをうまく活用できることが判明した。
論文 参考訳(メタデータ) (2021-07-13T09:22:24Z) - Towards Good Practices for Efficiently Annotating Large-Scale Image
Classification Datasets [90.61266099147053]
多数の画像の分類ラベルを収集するための効率的なアノテーション戦略を検討する。
人間のラベリング作業を最小化するための修正とベストプラクティスを提案します。
ImageNet100の125kイメージサブセットのシミュレーション実験では、平均で0.35のアノテーションで80%のトップ-1の精度でアノテートできることが示されている。
論文 参考訳(メタデータ) (2021-04-26T16:29:32Z) - Minimax Active Learning [61.729667575374606]
アクティブラーニングは、人間のアノテーションによってラベル付けされる最も代表的なサンプルをクエリすることによって、ラベル効率の高いアルゴリズムを開発することを目指している。
現在のアクティブラーニング技術は、最も不確実なサンプルを選択するためにモデルの不確実性に頼るか、クラスタリングを使うか、最も多様なラベルのないサンプルを選択するために再構築する。
我々は,不確実性と多様性を両立させる半教師付きミニマックスエントロピーに基づく能動学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-12-18T19:03:40Z) - Deep Learning for Earth Image Segmentation based on Imperfect Polyline
Labels with Annotation Errors [12.547819302858045]
本稿では,深層学習モデルパラメータを更新し,隠れた真のラベル位置を同時に推測するEMアルゴリズムに基づく汎用学習フレームワークを提案する。
ストリームライン改良アプリケーションにおける実世界の水文科学データセットの評価は,提案フレームワークが分類精度においてベースライン法より優れていることを示している。
論文 参考訳(メタデータ) (2020-10-02T02:54:06Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。