論文の概要: Combating noisy labels in object detection datasets
- arxiv url: http://arxiv.org/abs/2211.13993v2
- Date: Thu, 11 May 2023 15:46:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-12 18:19:01.426972
- Title: Combating noisy labels in object detection datasets
- Title(参考訳): 物体検出データセットにおける雑音ラベル対策
- Authors: Krystian Chachu{\l}a, Jakub {\L}yskawa, Bart{\l}omiej Olber, Piotr
Fr\k{a}tczak, Adam Popowicz, Krystian Radlak
- Abstract要約: 本稿では,オブジェクト検出データセットにおける各ラベルの品質を評価するためのCLODアルゴリズムを提案する。
トレーニングデータセットの誤った例を見つけることに集中することで、ルートでそれらを排除できます。
提案手法では, 擬陽性率0.3未満の人工乱れ箱の99%を指摘できる。
- 参考スコア(独自算出の注目度): 0.24466725954625884
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The quality of training datasets for deep neural networks is a key factor
contributing to the accuracy of resulting models. This effect is amplified in
difficult tasks such as object detection. Dealing with errors in datasets is
often limited to accepting that some fraction of examples is incorrect,
estimating their confidence and assigning appropriate weights or ignoring
uncertain ones during training. In this work, we propose a different approach.
We introduce the Confident Learning for Object Detection (CLOD) algorithm for
assessing the quality of each label in object detection datasets, identifying
missing, spurious, mislabeled and mislocated bounding boxes and suggesting
corrections. By focusing on finding incorrect examples in the training
datasets, we can eliminate them at the root. Suspicious bounding boxes can be
reviewed in order to improve the quality of the dataset, leading to better
models without further complicating their already complex architectures. The
proposed method is able to point out 99% of artificially disturbed bounding
boxes with a false positive rate below 0.3. We see this method as a promising
path to correcting popular object detection datasets.
- Abstract(参考訳): ディープニューラルネットワークのためのトレーニングデータセットの品質は、結果のモデルの正確性に寄与する重要な要因である。
この効果はオブジェクト検出のような難しいタスクで増幅される。
データセットのエラーに対する対処は、一部の例が間違っていて、信頼性を見積もり、適切な重み付けを割り当てたり、トレーニング中に不確実なものを無視したりする場合に限られる。
本研究では,異なるアプローチを提案する。
本稿では,オブジェクト検出データセットにおける各ラベルの品質評価,欠落・散逸・誤記・誤表示の同定,修正を提案する,clodアルゴリズムを提案する。
トレーニングデータセットの誤った例を見つけることに集中することで、ルートでそれらを排除できます。
疑わしいバウンディングボックスは、データセットの品質を改善するためにレビューされ、既に複雑なアーキテクチャを複雑にすることなく、より良いモデルに繋がる。
提案手法は,人工的に乱れた境界ボックスの99%を0.3未満の誤検出率で示すことができる。
我々は,この手法を一般的なオブジェクト検出データセットの修正に有効であると考えている。
関連論文リスト
- Revising the Problem of Partial Labels from the Perspective of CNNs' Robustness [6.46250754192468]
擬似ラベル手法と設計された損失関数を用いた軽量な部分ラベル解を提案する。
提案手法と既存手法の両方をD-Scoreを用いて解析し,精度を向上しながら頑健性を向上できるかどうかを判定する。
論文 参考訳(メタデータ) (2024-07-24T20:39:17Z) - SINDER: Repairing the Singular Defects of DINOv2 [61.98878352956125]
大規模なデータセットでトレーニングされたビジョントランスフォーマーモデルは、抽出したパッチトークンにアーティファクトを表示することが多い。
本稿では,小さなデータセットのみを用いて構造欠陥を補正するスムーズなスムーズな正規化を提案する。
論文 参考訳(メタデータ) (2024-07-23T20:34:23Z) - Building Manufacturing Deep Learning Models with Minimal and Imbalanced
Training Data Using Domain Adaptation and Data Augmentation [15.333573151694576]
本稿では,目標学習課題に対するラベル付き学習データ不足の問題に対処する新しいドメイン適応(DA)手法を提案する。
我々のアプローチは、ソースデータセットとターゲット学習タスクで利用可能なデータセットが同一または異なる機能空間を持つシナリオで機能する。
我々は、ウェハ欠陥予測のための画像データを用いて、組み合わせたアプローチを評価する。
論文 参考訳(メタデータ) (2023-05-31T21:45:34Z) - Knowledge Combination to Learn Rotated Detection Without Rotated
Annotation [53.439096583978504]
回転バウンディングボックスは、伸長したオブジェクトの出力あいまいさを劇的に減少させる。
この効果にもかかわらず、回転検出器は広く使われていない。
本稿では,モデルが正確な回転ボックスを予測できるフレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-05T03:07:36Z) - TransferD2: Automated Defect Detection Approach in Smart Manufacturing
using Transfer Learning Techniques [1.8899300124593645]
本稿では,ソースオブジェクトのデータセット上の欠陥を正確に識別するトランスファー学習手法であるTransferD2を提案する。
提案手法は,モデルのトレーニングに不十分なデータが得られない欠陥検出アプリケーションに適用可能であり,新たな未知データ中の不完全性を特定するために拡張可能である。
論文 参考訳(メタデータ) (2023-02-26T13:24:46Z) - Attentive Prototypes for Source-free Unsupervised Domain Adaptive 3D
Object Detection [85.11649974840758]
3Dオブジェクト検出ネットワークは、トレーニングされたデータに対してバイアスを受ける傾向がある。
そこで本研究では,ライダーを用いた3次元物体検出器のソースレス・教師なし領域適応のための単一フレーム手法を提案する。
論文 参考訳(メタデータ) (2021-11-30T18:42:42Z) - Assessing the Quality of the Datasets by Identifying Mislabeled Samples [14.881597737762316]
本稿では,各データ点の品質を測る指標として,新しい統計値(ノイズスコア)を提案する。
本研究では,データ品質管理型変分オートエンコーダ(AQUAVS)の推論ネットワークから導出される表現を用いる。
我々は、MNIST、FashionMNIST、CIFAR10/100データセットを破損させることにより、提案した統計データを検証した。
論文 参考訳(メタデータ) (2021-09-10T17:14:09Z) - Towards Reducing Labeling Cost in Deep Object Detection [61.010693873330446]
本稿では,検知器の不確実性と頑健性の両方を考慮した,アクティブラーニングのための統一的なフレームワークを提案する。
提案手法は, 確率分布のドリフトを抑えながら, 極めて確実な予測を擬似ラベル化することができる。
論文 参考訳(メタデータ) (2021-06-22T16:53:09Z) - Semi-supervised Long-tailed Recognition using Alternate Sampling [95.93760490301395]
ロングテール認識の主な課題は、データ分布の不均衡とテールクラスにおけるサンプル不足である。
半教師付き長尾認識という新しい認識設定を提案する。
2つのデータセットで、他の競合方法よりも大幅な精度向上を実証します。
論文 参考訳(メタデータ) (2021-05-01T00:43:38Z) - Uncertainty Estimation Using a Single Deep Deterministic Neural Network [66.26231423824089]
本稿では,1回のフォワードパスで,テスト時に分布データポイントの発見と拒否が可能な決定論的ディープモデルを訓練する手法を提案する。
我々は,新しい損失関数とセントロイド更新方式を用いて,これらをスケールトレーニングし,ソフトマックスモデルの精度に適合させる。
論文 参考訳(メタデータ) (2020-03-04T12:27:36Z) - On the Role of Dataset Quality and Heterogeneity in Model Confidence [27.657631193015252]
安全クリティカルなアプリケーションは、正確で校正された確率を出力する機械学習モデルを必要とする。
未分類のディープネットワークは、過度に信頼された予測をすることが知られている。
本研究では,データセットサイズとラベルノイズがモデルの信頼性に与える影響について検討した。
論文 参考訳(メタデータ) (2020-02-23T05:13:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。