論文の概要: Bugs in the Data: How ImageNet Misrepresents Biodiversity
- arxiv url: http://arxiv.org/abs/2208.11695v1
- Date: Wed, 24 Aug 2022 17:55:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-25 12:29:14.696319
- Title: Bugs in the Data: How ImageNet Misrepresents Biodiversity
- Title(参考訳): データのバグ: imagenetは生物多様性を誤解している
- Authors: Alexandra Sasha Luccioni and David Rolnick
- Abstract要約: ImageNet-1k検証セットで野生動物を表す269のクラスから13450の画像を解析した。
多くのクラスが未定義あるいは重複しており、画像の12%が誤ってラベル付けされていることがわかった。
また,ImageNet-1kに含まれる野生生物関連ラベルと画像の両方が,地理的,文化的に有意な偏見を呈していることがわかった。
- 参考スコア(独自算出の注目度): 98.98950914663813
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: ImageNet-1k is a dataset often used for benchmarking machine learning (ML)
models and evaluating tasks such as image recognition and object detection.
Wild animals make up 27% of ImageNet-1k but, unlike classes representing people
and objects, these data have not been closely scrutinized. In the current
paper, we analyze the 13,450 images from 269 classes that represent wild
animals in the ImageNet-1k validation set, with the participation of expert
ecologists. We find that many of the classes are ill-defined or overlapping,
and that 12% of the images are incorrectly labeled, with some classes having
>90% of images incorrect. We also find that both the wildlife-related labels
and images included in ImageNet-1k present significant geographical and
cultural biases, as well as ambiguities such as artificial animals, multiple
species in the same image, or the presence of humans. Our findings highlight
serious issues with the extensive use of this dataset for evaluating ML
systems, the use of such algorithms in wildlife-related tasks, and more broadly
the ways in which ML datasets are commonly created and curated.
- Abstract(参考訳): ImageNet-1kは機械学習(ML)モデルのベンチマークや画像認識やオブジェクト検出などのタスク評価によく使用されるデータセットである。
ImageNet-1kの野生動物は27%を占めるが、人やオブジェクトを表すクラスとは異なり、これらのデータは精査されていない。
本稿では,ImageNet-1k検証セットで野生動物を表わす269のクラスの13450の画像を,専門家生態学者の参加で分析する。
クラスの多くは不定義または重複しており、画像の12%が誤ってラベル付けされており、一部のクラスでは90%以上の画像が正しく表示されていないことが判明した。
また,ImageNet-1kに含まれる野生生物のラベルや画像には,地理的・文化的なバイアスや,人工動物,同一画像内の複数種,人間の存在などの曖昧さが有ることがわかった。
本研究は,MLシステム評価におけるこのデータセットの広範な使用,野生生物関連タスクにおけるそのようなアルゴリズムの使用,さらにMLデータセットの一般的な作成とキュレーションの方法に関して,重大な課題を浮き彫りにしている。
関連論文リスト
- SPOTS-10: Animal Pattern Benchmark Dataset for Machine Learning Algorithms [0.08158530638728499]
SPOTS-10(SPOTS-10)は、動物10種における多様なパターンを示す大規模な画像集である。
このデータセットは、その場で機械学習アルゴリズムを評価するためのリソースである。
トレーニングセットは4万の画像で構成され、テストセットは1万の画像を含んでいる。
論文 参考訳(メタデータ) (2024-10-28T14:00:02Z) - Diverse, Difficult, and Odd Instances (D2O): A New Test Set for Object
Classification [47.64219291655723]
既存のテストセットと十分に異なるD2Oと呼ばれる新しいテストセットを導入します。
私たちのデータセットには、36のカテゴリにまたがる8,060のイメージが含まれており、そのうち29がImageNetに表示されています。
私たちのデータセットで最高のTop-1精度は約60%で、ImageNetで91%のTop-1精度よりもはるかに低いです。
論文 参考訳(メタデータ) (2023-01-29T19:58:32Z) - DEArt: Dataset of European Art [0.17188280334580194]
我々は,第2世紀から第8世紀にかけての絵画の参照を目的としたオブジェクト検出とポーズ分類データセットであるDEArtを提案する。
15,000以上の画像が含まれており、約80%の非イコニックで、69クラスのすべてのインスタンスを識別するバウンディングボックスのマニュアルアノテーションと、人間に似たオブジェクトを識別するボックスのポーズが12種類含まれている。
以上の結果から, 文化遺産領域のオブジェクト検出器は, 伝達学習による汎用画像の最先端モデルに匹敵する精度を達成できることが示唆された。
論文 参考訳(メタデータ) (2022-11-02T16:05:35Z) - VizWiz-FewShot: Locating Objects in Images Taken by People With Visual
Impairments [74.72656607288185]
我々は、撮影した画像の視覚的内容について真に学ぼうとしていた写真家を起源とする、数発のローカライゼーションデータセットを紹介した。
視覚障害者が撮影した4500枚以上の画像に、100のカテゴリの約10,000のセグメンテーションが含まれている。
既存の数発のオブジェクト検出やインスタンスセグメンテーションデータセットと比較して、私たちのデータセットは、オブジェクトの穴を見つける最初のものです。
論文 参考訳(メタデータ) (2022-07-24T20:44:51Z) - Oracle-MNIST: a Realistic Image Dataset for Benchmarking Machine
Learning Algorithms [57.29464116557734]
我々は,古文字30,222文字の28ドルのグレースケール画像からなるOracle-MNISTデータセットを紹介した。
トレーニングセットは完全に27,222枚の画像で構成され、テストセットにはクラス毎に300枚の画像が含まれている。
論文 参考訳(メタデータ) (2022-05-19T09:57:45Z) - Correlated Input-Dependent Label Noise in Large-Scale Image
Classification [4.979361059762468]
我々は、データセット内のラベルノイズとしてヘテロセダスティック(herescedastic, label noise)として知られる入力依存のモデリングに対して、原則的な確率論的アプローチをとる。
学習された共分散構造は、意味的に類似したクラスと共起するクラスの間のラベルノイズの既知の情報源をキャプチャする。
We set a new-of-the-art results on WebVision 1.0 with 76.6% top-1 accuracy。
論文 参考訳(メタデータ) (2021-05-19T17:30:59Z) - Towards Good Practices for Efficiently Annotating Large-Scale Image
Classification Datasets [90.61266099147053]
多数の画像の分類ラベルを収集するための効率的なアノテーション戦略を検討する。
人間のラベリング作業を最小化するための修正とベストプラクティスを提案します。
ImageNet100の125kイメージサブセットのシミュレーション実験では、平均で0.35のアノテーションで80%のトップ-1の精度でアノテートできることが示されている。
論文 参考訳(メタデータ) (2021-04-26T16:29:32Z) - How many images do I need? Understanding how sample size per class
affects deep learning model performance metrics for balanced designs in
autonomous wildlife monitoring [0.0]
本研究では,各クラス(種目)のサンプルサイズを段階的に増加させるために,ディープラーニングモデルの性能に関する課題を深く検討する。
我々は,動物種毎の画像の精度を推定するための近似式を生態学者に提供する。
論文 参考訳(メタデータ) (2020-10-16T06:28:35Z) - MLRSNet: A Multi-label High Spatial Resolution Remote Sensing Dataset
for Semantic Scene Understanding [6.880271407391406]
深層学習を用いたセマンティックシーン理解のためのマルチラベル高空間分解能リモートセンシングデータセットMLRSNetを構築した。
MLRSNetには46のシーンカテゴリに109,161のサンプルが含まれており、各イメージには60の事前定義されたラベルの少なくとも1つが含まれている。
実験の結果、MLRSNetは将来の研究において重要なベンチマークであることが示された。
論文 参考訳(メタデータ) (2020-10-01T08:03:47Z) - Background Splitting: Finding Rare Classes in a Sea of Background [55.03789745276442]
我々は,少数の稀なカテゴリの画像分類のための,高精度な深層モデルの訓練という現実的な問題に焦点をあてる。
これらのシナリオでは、ほとんどの画像はデータセットの背景カテゴリに属します(データセットの95%は背景です)。
非バランスなデータセットをトレーニングするための標準的な微調整アプローチと最先端アプローチの両方が、この極端な不均衡の存在下で正確な深層モデルを生成していないことを実証する。
論文 参考訳(メタデータ) (2020-08-28T23:05:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。