論文の概要: Improving Training on Noisy Stuctured Labels
- arxiv url: http://arxiv.org/abs/2003.03862v1
- Date: Sun, 8 Mar 2020 22:55:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-25 13:58:43.193068
- Title: Improving Training on Noisy Stuctured Labels
- Title(参考訳): 騒音ラベルの学習改善
- Authors: Abubakar Abid, James Zou
- Abstract要約: 本稿では,細粒度アノテーションにおける構造化誤りの有無を学習する上での課題を解決するために,誤り訂正ネットワーク(ECN)の新たなフレームワークを提案する。
ECNは、ノイズの多いデータに対するトレーニングのための標準的なアプローチと比較して、きめ細かいアノテーションの予測を大幅に改善する。
- 参考スコア(独自算出の注目度): 17.835042432662846
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fine-grained annotations---e.g. dense image labels, image segmentation and
text tagging---are useful in many ML applications but they are labor-intensive
to generate. Moreover there are often systematic, structured errors in these
fine-grained annotations. For example, a car might be entirely unannotated in
the image, or the boundary between a car and street might only be coarsely
annotated. Standard ML training on data with such structured errors produces
models with biases and poor performance. In this work, we propose a novel
framework of Error-Correcting Networks (ECN) to address the challenge of
learning in the presence structured error in fine-grained annotations. Given a
large noisy dataset with commonly occurring structured errors, and a much
smaller dataset with more accurate annotations, ECN is able to substantially
improve the prediction of fine-grained annotations compared to standard
approaches for training on noisy data. It does so by learning to leverage the
structures in the annotations and in the noisy labels. Systematic experiments
on image segmentation and text tagging demonstrate the strong performance of
ECN in improving training on noisy structured labels.
- Abstract(参考訳): きめ細かいアノテーション、例えば高密度画像ラベル、画像分割、テキストタグ付けは、多くのMLアプリケーションで有用であるが、生成には労力がかかる。
さらに、細かなアノテーションには、しばしば体系的で構造化されたエラーがあります。
例えば、車は画像に完全に注釈を付けていないかもしれないし、車と道路の境界は粗い注釈だけになるかもしれない。
このような構造化エラーを伴うデータに対する標準的なMLトレーニングは、バイアスとパフォーマンスの悪いモデルを生成する。
本稿では,細粒度アノテーションにおける構造化誤りの存在下での学習の課題に対処するために,誤り訂正ネットワーク(ecn)の新たな枠組みを提案する。
一般的な構造的エラーを伴う大きなノイズの多いデータセットと、より正確なアノテーションを備えたデータセットを考えると、ecnはノイズの多いデータのトレーニングのための標準的なアプローチと比較して、きめ細かいアノテーションの予測を大幅に改善することができる。
アノテーションや騒がしいラベルの構造を活用できるように学習することで実現されている。
画像セグメンテーションとテキストタグ付けに関するシステム実験は、ノイズのある構造化ラベルのトレーニングを改善するためのECNの強い性能を示す。
関連論文リスト
- ERASE: Error-Resilient Representation Learning on Graphs for Label Noise
Tolerance [53.73316938815873]
本稿では, ERASE (Error-Resilient representation learning on graphs for lAbel noiSe tolerancE) という手法を提案する。
ERASEは、プロトタイプの擬似ラベルとプロパゲーションされた識別ラベルを組み合わせて、表現をエラーレジリエンスで更新する。
提案手法は, 広い雑音レベルにおいて, 複数のベースラインをクリアマージンで上回り, 高いスケーラビリティを享受できる。
論文 参考訳(メタデータ) (2023-12-13T17:59:07Z) - Distinguishability Calibration to In-Context Learning [31.375797763897104]
そこで本研究では, PLM符号化埋め込みを新しい距離空間にマッピングすることで, 埋め込みの識別性を保証する手法を提案する。
また、双曲的埋め込みの利点を生かして、粒度の細かいクラス関連トークン埋め込み間の階層的関係を捉える。
論文 参考訳(メタデータ) (2023-02-13T09:15:00Z) - Annotation Error Detection: Analyzing the Past and Present for a More
Coherent Future [63.99570204416711]
我々は、潜在的なアノテーションの誤りを検知するための18の手法を再実装し、9つの英語データセット上で評価する。
アノテーションエラー検出タスクの新しい形式化を含む一様評価設定を定義する。
私たちはデータセットと実装を,使いやすく,オープンソースのソフトウェアパッケージとしてリリースしています。
論文 参考訳(メタデータ) (2022-06-05T22:31:45Z) - Learning with Noisy Labels by Targeted Relabeling [52.0329205268734]
クラウドソーシングプラットフォームは、ディープニューラルネットワークをトレーニングするためのデータセット収集によく使用される。
本稿では,少数のアノテーションを予約して,高い確率でラベル付け可能なエラーを明示的に緩和する手法を提案する。
論文 参考訳(メタデータ) (2021-10-15T20:37:29Z) - Pseudo-Label Ensemble-based Semi-supervised Learning for Handling Noisy
Soiling Segmentation Annotations [2.5638982073427568]
我々は,ノイズラベルと改良ラベルの両方に対して,土砂セグメンテーションモデルを訓練する。
また、低コストの粗末なアノテーションを効果的に洗練することができることも示している。
論文 参考訳(メタデータ) (2021-05-17T15:10:00Z) - Temporal Calibrated Regularization for Robust Noisy Label Learning [60.90967240168525]
ディープニューラルネットワーク(DNN)は、大規模な注釈付きデータセットの助けを借りて、多くのタスクで大きな成功を収めている。
しかし、大規模なデータのラベル付けは非常にコストがかかりエラーが発生しやすいため、アノテーションの品質を保証することは困難である。
本稿では,従来のラベルと予測を併用したTCR(Temporal Calibrated Regularization)を提案する。
論文 参考訳(メタデータ) (2020-07-01T04:48:49Z) - Learning to segment from misaligned and partial labels [0.0]
アーバン以外の多くの設定は、正確なセグメンテーションに必要な基盤構造を欠いている。
OpenStreetMaps (OSM)のようなオープンソースのインフラストラクチャアノテーションがこの問題を代表している。
本稿では,不整合アノテーションと欠落アノテーションを付与した画素画像分割を改良した,新規で一般化可能な2段階のフレームワークを提案する。
論文 参考訳(メタデータ) (2020-05-27T06:02:58Z) - Weakly-Supervised Salient Object Detection via Scribble Annotations [54.40518383782725]
本稿では,スクリブルラベルからサリエンシを学習するための弱教師付きサリエント物体検出モデルを提案する。
そこで本研究では,予測されたサリエンシマップの構造アライメントを測定するために,新しい尺度であるサリエンシ構造尺度を提案する。
我々の手法は、既存の弱教師付き/非教師付き手法よりも優れているだけでなく、いくつかの完全教師付き最先端モデルと同等である。
論文 参考訳(メタデータ) (2020-03-17T12:59:50Z) - Structured Prediction with Partial Labelling through the Infimum Loss [85.4940853372503]
弱い監督の目標は、収集コストの安いラベル付け形式のみを使用してモデルを学習できるようにすることである。
これは、各データポイントに対して、実際のものを含むラベルのセットとして、監督がキャストされる不完全なアノテーションの一種です。
本稿では、構造化された予測と、部分的なラベリングを扱うための無限損失の概念に基づく統一的なフレームワークを提供する。
論文 参考訳(メタデータ) (2020-03-02T13:59:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。