論文の概要: Understanding Gender and Racial Disparities in Image Recognition Models
- arxiv url: http://arxiv.org/abs/2107.09211v1
- Date: Tue, 20 Jul 2021 01:05:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-21 22:38:09.870174
- Title: Understanding Gender and Racial Disparities in Image Recognition Models
- Title(参考訳): 画像認識モデルにおける性差と人種差の理解
- Authors: Rohan Mahadev, Anindya Chakravarti
- Abstract要約: クロスエントロピーを用いたマルチラベルソフトマックスの損失を,多ラベル分類問題における二進的クロスエントロピーの代わりに損失関数として検討する。
MR2データセットを用いて、モデル結果の公平性を評価し、モデルのアクティベーションを見て誤りを解釈し、可能な修正を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Large scale image classification models trained on top of popular datasets
such as Imagenet have shown to have a distributional skew which leads to
disparities in prediction accuracies across different subsections of population
demographics. A lot of approaches have been made to solve for this
distributional skew using methods that alter the model pre, post and during
training. We investigate one such approach - which uses a multi-label softmax
loss with cross-entropy as the loss function instead of a binary cross-entropy
on a multi-label classification problem on the Inclusive Images dataset which
is a subset of the OpenImages V6 dataset. We use the MR2 dataset, which
contains images of people with self-identified gender and race attributes to
evaluate the fairness in the model outcomes and try to interpret the mistakes
by looking at model activations and suggest possible fixes.
- Abstract(参考訳): Imagenetのような一般的なデータセット上でトレーニングされた大規模な画像分類モデルでは、分布スキューが示されており、人口人口の異なる部分の予測精度に差が生じている。
モデル前、後、およびトレーニング中に変更する手法を用いて、この分散スキューを解決するための多くのアプローチが作成されている。
本研究では,openimages v6データセットのサブセットであるインクルーシブイメージデータセット上のマルチラベル分類問題に対するバイナリクロスエントロピーではなく,クロスエントロピーを伴うマルチラベルソフトマックスロスを損失関数として使用する手法について検討する。
MR2データセットは、自己識別された性別と人種特性を持つ人々の画像を含み、モデル結果の公平さを評価し、モデルのアクティベーションを見て誤りを解釈し、修正を提案する。
関連論文リスト
- Exploiting Diffusion Prior for Generalizable Pixel-Level Semantic
Prediction [93.35493328885372]
我々は、画素レベルのセマンティック予測タスクの先行として、事前訓練されたT2Iモデルを導入する。
我々は一連の実験を通して拡散過程を再構成し、入力されたRGB画像と出力予測分布との決定論的マッピングを確立する。
限られたドメインのトレーニングデータにもかかわらず、この手法は任意の画像に対して忠実に推定し、既存の最先端のアルゴリズムを超越する。
論文 参考訳(メタデータ) (2023-11-30T18:59:44Z) - Balancing the Picture: Debiasing Vision-Language Datasets with Synthetic
Contrast Sets [52.77024349608834]
視覚言語モデルは、インターネットから未計算の画像テキストペアの事前トレーニング中に学んだ社会的バイアスを永続し、増幅することができる。
COCO Captionsは、背景コンテキストとその場にいる人々の性別間のバイアスを評価するために最も一般的に使用されるデータセットである。
本研究では,COCOデータセットを男女バランスの取れたコントラストセットで拡張する新しいデータセットデバイアスパイプラインを提案する。
論文 参考訳(メタデータ) (2023-05-24T17:59:18Z) - Incorporating Crowdsourced Annotator Distributions into Ensemble
Modeling to Improve Classification Trustworthiness for Ancient Greek Papyri [3.870354915766567]
このようなデータセットの問題を複雑にする2つの問題は、クラス不均衡とラベリングにおける地道不確実性である。
このようなデータセットに対するアンサンブルモデリングの応用は、地上の真実が疑問視されている画像を特定し、それらのサンプルの信頼性を定量化するのに役立ちます。
論文 参考訳(メタデータ) (2022-10-28T19:39:14Z) - Estimating Appearance Models for Image Segmentation via Tensor
Factorization [0.0]
本稿では,画像からの外観モデルを直接推定する手法を提案する。
本手法は,潜時変モデルに対するテンソル分解に基づく推定器への入力として,画像からの局所的な高次色統計値を用いる。
このアプローチは、マルチリージョン画像のモデルを推定し、事前のユーザインタラクションなしで自動的にリージョン比を出力することができる。
論文 参考訳(メタデータ) (2022-08-16T17:21:00Z) - Visual Recognition with Deep Learning from Biased Image Datasets [6.10183951877597]
視覚認知の文脈において、バイアスモデルがどのように治療問題に適用できるかを示す。
作業中のバイアス機構に関する(近似的な)知識に基づいて、我々のアプローチは観察を再重み付けする。
本稿では,画像データベース間で共有される低次元画像表現を提案する。
論文 参考訳(メタデータ) (2021-09-06T10:56:58Z) - Unravelling the Effect of Image Distortions for Biased Prediction of
Pre-trained Face Recognition Models [86.79402670904338]
画像歪みの存在下での4つの最先端深層顔認識モデルの性能評価を行った。
我々は、画像歪みが、異なるサブグループ間でのモデルの性能ギャップと関係していることを観察した。
論文 参考訳(メタデータ) (2021-08-14T16:49:05Z) - A Hierarchical Transformation-Discriminating Generative Model for Few
Shot Anomaly Detection [93.38607559281601]
各トレーニングイメージのマルチスケールパッチ分布をキャプチャする階層的生成モデルを開発した。
この異常スコアは、スケール及び画像領域にわたる正しい変換のパッチベースの投票を集約して得られる。
論文 参考訳(メタデータ) (2021-04-29T17:49:48Z) - An Empirical Study of the Collapsing Problem in Semi-Supervised 2D Human
Pose Estimation [80.02124918255059]
半教師付き学習は、ラベルなし画像の探索によってモデルの精度を高めることを目的としている。
私たちは相互に教え合うために2つのネットワークを学びます。
各ネットワーク内の容易なイメージに関するより信頼性の高い予測は、他のネットワークに対応するハードイメージについて学ぶように教えるために使用される。
論文 参考訳(メタデータ) (2020-11-25T03:29:52Z) - Background Splitting: Finding Rare Classes in a Sea of Background [55.03789745276442]
我々は,少数の稀なカテゴリの画像分類のための,高精度な深層モデルの訓練という現実的な問題に焦点をあてる。
これらのシナリオでは、ほとんどの画像はデータセットの背景カテゴリに属します(データセットの95%は背景です)。
非バランスなデータセットをトレーニングするための標準的な微調整アプローチと最先端アプローチの両方が、この極端な不均衡の存在下で正確な深層モデルを生成していないことを実証する。
論文 参考訳(メタデータ) (2020-08-28T23:05:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。