論文の概要: A Survey on Bias in Visual Datasets
- arxiv url: http://arxiv.org/abs/2107.07919v1
- Date: Fri, 16 Jul 2021 14:16:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-19 14:38:55.418937
- Title: A Survey on Bias in Visual Datasets
- Title(参考訳): 視覚データセットのバイアスに関する調査
- Authors: Simone Fabbrizzi, Symeon Papadopoulos, Eirini Ntoutsi, Ioannis
Kompatsiaris
- Abstract要約: コンピュータビジョン(CV)は、いくつかのタスクにおいて人間よりも優れた成果を上げている。
CVシステムは、供給されるデータに大きく依存し、そのようなデータ内のバイアスを学習し、増幅することができる。
しかし、現時点では、ビジュアルデータセットのバイアスに関する包括的な調査は行われていない。
- 参考スコア(独自算出の注目度): 17.79365832663837
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Computer Vision (CV) has achieved remarkable results, outperforming humans in
several tasks. Nonetheless, it may result in major discrimination if not dealt
with proper care. CV systems highly depend on the data they are fed with and
can learn and amplify biases within such data. Thus, both the problems of
understanding and discovering biases are of utmost importance. Yet, to date
there is no comprehensive survey on bias in visual datasets. To this end, this
work aims to: i) describe the biases that can affect visual datasets; ii)
review the literature on methods for bias discovery and quantification in
visual datasets; iii) discuss existing attempts to collect bias-aware visual
datasets. A key conclusion of our study is that the problem of bias discovery
and quantification in visual datasets is still open and there is room for
improvement in terms of both methods and the range of biases that can be
addressed; moreover, there is no such thing as a bias-free dataset, so
scientists and practitioners must become aware of the biases in their datasets
and make them explicit. To this end, we propose a checklist that can be used to
spot different types of bias during visual dataset collection.
- Abstract(参考訳): コンピュータビジョン(cv)は、いくつかのタスクで人間を上回って素晴らしい成果を上げている。
それにもかかわらず、適切なケアに対処しなければ大きな差別をもたらす可能性がある。
CVシステムは、供給されるデータに大きく依存し、そのようなデータ内のバイアスを学習し、増幅することができる。
したがって、バイアスの理解と発見の問題はどちらも最も重要である。
しかし、これまでビジュアルデータセットのバイアスに関する包括的な調査は行われていない。
本研究の目的は, 視覚的データセットに影響を与えるバイアスを記述すること, 視覚的データセットにおけるバイアス発見と定量化の手法に関する文献をレビューすること, そして, バイアスを意識した視覚的データセットを収集するための既存の試みについて議論することである。
この研究の重要な結論は、ビジュアルデータセットにおけるバイアス発見と定量化の問題は依然としてオープンであり、手法と対処可能なバイアスの範囲の両方について改善の余地があるということです。
そこで本研究では,視覚データセットの収集中に異なる種類のバイアスを検出できるチェックリストを提案する。
関連論文リスト
- Is There a One-Model-Fits-All Approach to Information Extraction? Revisiting Task Definition Biases [62.806300074459116]
定義バイアスは、モデルを誤解させる可能性のある負の現象である。
IEでは、情報抽出データセット間のバイアスと、情報抽出データセットとインストラクションチューニングデータセット間のバイアスの2つの定義バイアスを識別する。
本稿では, 定義バイアス測定, バイアス対応微調整, タスク固有バイアス緩和からなる多段階フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-25T03:19:20Z) - Dataset Bias Mitigation in Multiple-Choice Visual Question Answering and
Beyond [93.96982273042296]
視覚言語(VL)理解タスクは、複数の質問を通じて複雑な視覚シーンのモデルによる理解を評価する。
我々は、モデルが様々なVLタスクを適切に理解することなく正しく解決するために、ショートカットとして活用できる2つのデータセットバイアスを特定した。
本稿では,ADS(Adversarial Data Synthesis)を用いて,合成学習データと偏り評価データを生成する。
次に、サンプル内微分に着目して、合成したトレーニングデータ、特に対物データを利用するモデルを支援するために、サンプル内対物訓練(ICT)を導入する。
論文 参考訳(メタデータ) (2023-10-23T08:09:42Z) - Targeted Data Augmentation for bias mitigation [0.0]
我々は、TDA(Targeted Data Augmentation)と呼ばれるバイアスに対処するための、新しく効率的なアプローチを導入する。
バイアスを除去する面倒な作業とは異なり、本手法は代わりにバイアスを挿入することを提案し、結果として性能が向上する。
偏見を特定するために,臨床皮膚病変のデータセットと男女の顔のデータセットの2つの多様なデータセットを注釈した。
論文 参考訳(メタデータ) (2023-08-22T12:25:49Z) - Approximating Counterfactual Bounds while Fusing Observational, Biased
and Randomised Data Sources [64.96984404868411]
我々は、複数の、偏見のある、観察的、介入的な研究からのデータを統合するという問題に対処する。
利用可能なデータの可能性は局所的な最大値を持たないことを示す。
次に、同じアプローチが複数のデータセットの一般的なケースにどのように対処できるかを示す。
論文 参考訳(メタデータ) (2023-07-31T11:28:24Z) - Data Bias Management [17.067962372238135]
私たちは、データのバイアスがエンドユーザに与える影響、バイアスの発生源、そして、その上で何をすべきかという視点を示します。
データバイアスは、すべてのケースにおいて必ずしも取り除くべきものではなく、代わりに研究の注意がバイアス除去からバイアス管理に移行するべきだ、と私たちは主張する。
論文 参考訳(メタデータ) (2023-05-15T10:07:27Z) - Mitigating Representation Bias in Action Recognition: Algorithms and
Benchmarks [76.35271072704384]
ディープラーニングモデルは、稀なシーンやオブジェクトを持つビデオに適用すると、パフォーマンスが悪くなります。
この問題にはアルゴリズムとデータセットの2つの異なる角度から対処する。
偏りのある表現は、他のデータセットやタスクに転送するとより一般化できることを示す。
論文 参考訳(メタデータ) (2022-09-20T00:30:35Z) - Intrinsic Bias Identification on Medical Image Datasets [9.054785751150547]
まず、データ固有のバイアス属性を定義し、次いで、医用画像データセットのための新しいバイアス識別フレームワークを提案する。
このフレームワークには、KlotskiNetとBias Discriminant Direction Analysis(bdda)という2つの主要なコンポーネントが含まれている。
3つのデータセットの実験結果から,フレームワークが検出したバイアス特性の有効性が示された。
論文 参考訳(メタデータ) (2022-03-24T06:28:07Z) - Representation Bias in Data: A Survey on Identification and Resolution
Techniques [26.142021257838564]
データ駆動型アルゴリズムは、それらが扱うデータと同程度にしか機能しないが、データセット、特にソーシャルデータはしばしば、マイノリティを適切に表現できない。
データにおける表現バイアスは、歴史的差別から、データ取得と作成方法におけるバイアスのサンプリングまで、さまざまな理由により起こりうる。
本稿では,後日どのように消費されるかに関わらず,表現バイアスをデータセットの特徴として同定し,解決する方法についての文献をレビューする。
論文 参考訳(メタデータ) (2022-03-22T16:30:22Z) - Learning to Model and Ignore Dataset Bias with Mixed Capacity Ensembles [66.15398165275926]
本稿では,データセット固有のパターンを自動的に検出・無視する手法を提案する。
我々の方法は、より高い容量モデルでアンサンブルで低容量モデルを訓練する。
視覚的質問応答データセットの10ポイントゲインを含む,すべての設定の改善を示す。
論文 参考訳(メタデータ) (2020-11-07T22:20:03Z) - REVISE: A Tool for Measuring and Mitigating Bias in Visual Datasets [64.76453161039973]
REVISE(Revealing VIsual biaSEs)は、視覚的データセットの調査を支援するツールである。
1)オブジェクトベース,(2)個人ベース,(3)地理ベースという3つの次元に沿った潜在的なバイアスを呈示する。
論文 参考訳(メタデータ) (2020-04-16T23:54:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。