論文の概要: Large image datasets: A pyrrhic win for computer vision?
- arxiv url: http://arxiv.org/abs/2006.16923v2
- Date: Fri, 24 Jul 2020 02:55:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-17 13:26:10.194862
- Title: Large image datasets: A pyrrhic win for computer vision?
- Title(参考訳): 大規模画像データセット:コンピュータビジョンのピュロス的勝利?
- Authors: Vinay Uday Prabhu, Abeba Birhane
- Abstract要約: 大規模ビジョンデータセットの問題点と結果について検討する。
我々は,同意や正義の問題などの幅広い問題や,データセットに検証可能なポルノ画像を含めるといった特定の懸念について検討する。
- 参考スコア(独自算出の注目度): 2.627046865670577
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper we investigate problematic practices and consequences of large
scale vision datasets. We examine broad issues such as the question of consent
and justice as well as specific concerns such as the inclusion of verifiably
pornographic images in datasets. Taking the ImageNet-ILSVRC-2012 dataset as an
example, we perform a cross-sectional model-based quantitative census covering
factors such as age, gender, NSFW content scoring, class-wise accuracy,
human-cardinality-analysis, and the semanticity of the image class information
in order to statistically investigate the extent and subtleties of ethical
transgressions. We then use the census to help hand-curate a look-up-table of
images in the ImageNet-ILSVRC-2012 dataset that fall into the categories of
verifiably pornographic: shot in a non-consensual setting (up-skirt), beach
voyeuristic, and exposed private parts. We survey the landscape of harm and
threats both society broadly and individuals face due to uncritical and
ill-considered dataset curation practices. We then propose possible courses of
correction and critique the pros and cons of these. We have duly open-sourced
all of the code and the census meta-datasets generated in this endeavor for the
computer vision community to build on. By unveiling the severity of the
threats, our hope is to motivate the constitution of mandatory Institutional
Review Boards (IRB) for large scale dataset curation processes.
- Abstract(参考訳): 本稿では,大規模ビジョンデータセットの問題点と結果について考察する。
我々は、同意や正義の問題や、データセットにポルノ画像を含めるといった具体的な懸念など、幅広い問題について検討する。
ImageNet-ILSVRC-2012データセットを例として、年齢、性別、NSFWコンテンツスコアリング、クラスワイド精度、ヒューマンカルディナリティ分析、画像クラス情報のセマンティリティといった要素を網羅した横断モデルに基づく定量的調査を行い、倫理的転帰の程度と微妙さを統計的に調査する。
imagenet-ilsvrc-2012データセット内の画像のルックアップテーブルを手作業で測定し、ポルノグラフィのカテゴリに分類します。
我々は、社会と個人が直面する危険と脅威の状況について、批判的でない、考えにくいデータセットキュレーションの実践によって調査する。
次に,これらの誤りの修正と批判の可能なコースを提案する。
私たちは、コンピュータビジョンコミュニティが構築するこの取り組みで生成されたすべてのコードと国勢調査メタデータセットを、完全にオープンソース化しました。
脅威の深刻さを明らかにすることで、大規模データセットのキュレーションプロセスに必須の機関審査委員会(IRB)の構成を動機付けることが望まれます。
関連論文リスト
- Vision-Language Models under Cultural and Inclusive Considerations [53.614528867159706]
視覚言語モデル(VLM)は、日常生活の画像を記述することで視覚障害者を支援する。
現在の評価データセットは、多様な文化的ユーザ背景や、このユースケースの状況を反映していない可能性がある。
我々は、字幕の好みを決定するための調査を作成し、視覚障害者によって撮影された画像を含む既存のデータセットであるVizWizをフィルタリングすることで、文化中心の評価ベンチマークを提案する。
次に,複数のVLMを評価し,その信頼性を文化的に多様な環境で視覚アシスタントとして検証した。
論文 参考訳(メタデータ) (2024-07-08T17:50:00Z) - Visual Context-Aware Person Fall Detection [52.49277799455569]
画像中の個人とオブジェクトを半自動分離するセグメンテーションパイプラインを提案する。
ベッド、椅子、車椅子などの背景オブジェクトは、転倒検知システムに挑戦し、誤ったポジティブアラームを引き起こす。
トレーニング中のオブジェクト固有のコンテキスト変換が、この課題を効果的に軽減することを示す。
論文 参考訳(メタデータ) (2024-04-11T19:06:36Z) - Into the LAIONs Den: Investigating Hate in Multimodal Datasets [67.21783778038645]
本稿では、LAION-400MとLAION-2Bの2つのデータセットの比較監査を通して、ヘイトフルコンテンツに対するデータセットのスケーリングの効果について検討する。
その結果、データセットのスケールによってヘイトコンテンツは12%近く増加し、質的にも定量的にも測定された。
また、画像のみに基づいて算出されたNot Safe For Work(NSFW)値に基づくデータセットの内容のフィルタリングは、アルトテキストにおける有害なコンテンツをすべて排除するものではないことがわかった。
論文 参考訳(メタデータ) (2023-11-06T19:00:05Z) - Uncurated Image-Text Datasets: Shedding Light on Demographic Bias [21.421722941901123]
MSCOCOのような小さいが手動で注釈付けされたデータセットでさえ、社会的バイアスの影響を受けている。
最初のコントリビューションは、ビジョンと言語モデルのトレーニングに広く使用されている、Google Conceptual Captionsデータセットの一部に注釈を付けることです。
第2の貢献は、アノテーションの包括的な分析を行うことであり、どのように異なる人口集団が表現されるかに焦点を当てている。
第3の貢献は3つの一般的な視覚・言語タスクを評価することであり、社会的バイアスはそれらすべてにおいて永続的な問題であることを示している。
論文 参考訳(メタデータ) (2023-04-06T02:33:51Z) - ConfounderGAN: Protecting Image Data Privacy with Causal Confounder [85.6757153033139]
本稿では,GAN(Generative Adversarial Network)のConfounderGANを提案する。
実験は、3つの自然なオブジェクトデータセットと3つの医療データセットからなる6つの画像分類データセットで実施される。
論文 参考訳(メタデータ) (2022-12-04T08:49:14Z) - Inferring Offensiveness In Images From Natural Language Supervision [20.294073012815854]
ウェブから自動的に取り除かれた大規模な画像データセットには、カテゴリや攻撃的なイメージといった軽蔑的な用語が含まれる可能性がある。
我々は、事前学習されたトランスフォーマー自体が、大規模ビジョンデータセットの自動キュレーションのための方法論を提供することを示した。
論文 参考訳(メタデータ) (2021-10-08T16:19:21Z) - Improving Fractal Pre-training [0.76146285961466]
動的に生成されたフラクタル画像に基づく事前学習データセットを提案する。
実験により, フラクタルを用いたネットワークの微調整は, ImageNet事前訓練ネットワークの精度の92.7-98.1%に達することが示された。
論文 参考訳(メタデータ) (2021-10-06T22:39:51Z) - Multimodal datasets: misogyny, pornography, and malignant stereotypes [2.8682942808330703]
最近リリースされたLAION-400Mデータセットは、Common-Crawlデータセットから解析された画像-Alt-textペアのCLIPフィルタリングデータセットである。
このデータセットには、レイプ、ポルノグラフィー、悪性のステレオタイプ、人種差別的および民族的スラー、その他の非常に問題のあるコンテンツが含まれています。
論文 参考訳(メタデータ) (2021-10-05T11:47:27Z) - Contemplating real-world object classification [53.10151901863263]
Barbuらが最近提案したObjectNetデータセットを再分析した。
日常の状況に物を含むこと。
分離されたオブジェクトにディープモデルを適用すると、元の論文のようにシーン全体ではなく、約20~30%の性能改善が得られます。
論文 参考訳(メタデータ) (2021-03-08T23:29:59Z) - From ImageNet to Image Classification: Contextualizing Progress on
Benchmarks [99.19183528305598]
ImageNet作成プロセスにおける特定の設計選択が、結果のデータセットの忠実性に与える影響について検討する。
私たちの分析では、ノイズの多いデータ収集パイプラインが、結果のベンチマークと、それがプロキシとして機能する実世界のタスクとの間に、体系的なミスアライメントをもたらす可能性があることを指摘しています。
論文 参考訳(メタデータ) (2020-05-22T17:39:16Z) - Privacy-Preserving Image Classification in the Local Setting [17.375582978294105]
ローカル微分プライバシ(LDP)は、データ所有者がランダムにインプットを摂動させ、リリース前にデータの妥当な削除を可能にする、有望なソリューションを提供する。
本稿では、データ所有者が画像を保持し、不信なデータ利用者が機械学習モデルにこれらの画像を入力として適合させたいという、双方向のイメージ分類問題について考察する。
本稿では,拡張性のある領域サイズで画像表現を生成する,教師付き画像特徴抽出器 DCAConv を提案する。
論文 参考訳(メタデータ) (2020-02-09T01:25:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。