論文の概要: The (de)biasing effect of GAN-based augmentation methods on skin lesion
images
- arxiv url: http://arxiv.org/abs/2206.15182v1
- Date: Thu, 30 Jun 2022 10:32:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-02 00:13:07.642577
- Title: The (de)biasing effect of GAN-based augmentation methods on skin lesion
images
- Title(参考訳): gan系増強法の皮膚病変画像に対する(de)バイアス効果
- Authors: Agnieszka Miko{\l}ajczyk, Sylwia Majchrowska, Sandra Carrasco Limeros
- Abstract要約: 新しい医学データセットは、学習プロセスに影響を与える刺激的な相関の源であるかもしれない。
データ不均衡を軽減する1つのアプローチは、GAN(Generative Adversarial Networks)によるデータ拡張である。
この研究は、それらのバイアス継承と合成データがモデルにどのように影響するかを比較するために、無条件および条件付きGANを探索した。
- 参考スコア(独自算出の注目度): 3.441021278275805
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: New medical datasets are now more open to the public, allowing for better and
more extensive research. Although prepared with the utmost care, new datasets
might still be a source of spurious correlations that affect the learning
process. Moreover, data collections are usually not large enough and are often
unbalanced. One approach to alleviate the data imbalance is using data
augmentation with Generative Adversarial Networks (GANs) to extend the dataset
with high-quality images. GANs are usually trained on the same biased datasets
as the target data, resulting in more biased instances. This work explored
unconditional and conditional GANs to compare their bias inheritance and how
the synthetic data influenced the models. We provided extensive manual data
annotation of possibly biasing artifacts on the well-known ISIC dataset with
skin lesions. In addition, we examined classification models trained on both
real and synthetic data with counterfactual bias explanations. Our experiments
showed that GANs inherited biases and sometimes even amplified them, leading to
even stronger spurious correlations. Manual data annotation and synthetic
images are publicly available for reproducible scientific research.
- Abstract(参考訳): 新しい医療データセットが一般公開され、より優れた、より広範な研究が可能になる。
最善の注意を払って準備されているが、新しいデータセットは、学習プロセスに影響を与える散発的な相関の源である可能性がある。
さらに、データ収集は通常十分に大きくなく、しばしばバランスが取れない。
データ不均衡を軽減する1つのアプローチは、高品質の画像でデータセットを拡張するためにgan(generative adversarial networks)によるデータ拡張を使用することである。
ganは通常、ターゲットデータと同じバイアス付きデータセットでトレーニングされ、その結果、よりバイアス付きインスタンスが生成される。
この研究は、それらのバイアス継承と合成データがモデルに与える影響を比較するために、無条件および条件付きGANを探索した。
皮膚病変のあるisicデータセットに偏りのあるアーチファクトの広範な手作業によるデータアノテーションを提供した。
さらに,実データと合成データの両方で訓練された分類モデルについて,反事実バイアスの説明を用いて検討した。
我々の実験は、GANがバイアスを継承し、時にはそれらを増幅することを示し、さらに強い刺激的な相関を生み出した。
手動データアノテーションと合成画像は再現可能な科学的研究のために公開されている。
関連論文リスト
- Will the Inclusion of Generated Data Amplify Bias Across Generations in Future Image Classification Models? [29.71939692883025]
画像分類タスクにおける生成データの影響について,特にバイアスに着目して検討する。
数百の実験がColorized MNIST、CIFAR-20/100、Hard ImageNetデータセットで実施されている。
本研究は, 実世界の応用において, 合成データの公平性に関する議論が進行中であることを示すものである。
論文 参考訳(メタデータ) (2024-10-14T05:07:06Z) - Model Debiasing by Learnable Data Augmentation [19.625915578646758]
本稿では,トレーニングを正規化可能なデータ拡張戦略を備えた,新しい2段階学習パイプラインを提案する。
合成および現実的なバイアス付きデータセットの実験は、最先端の分類精度を示し、競合する手法より優れている。
論文 参考訳(メタデータ) (2024-08-09T09:19:59Z) - DiffInject: Revisiting Debias via Synthetic Data Generation using Diffusion-based Style Injection [9.801159950963306]
DiffInject(ディフインジェクション)は,事前学習した拡散モデルを用いて,合成バイアス競合サンプルを増強する強力な手法である。
私たちのフレームワークでは、バイアスタイプやラベル付けに関する明確な知識は必要ありません。
論文 参考訳(メタデータ) (2024-06-10T09:45:38Z) - Stubborn Lexical Bias in Data and Models [50.79738900885665]
我々は、データに基づいてトレーニングされたモデルに、データのスプリアスパターンが現れるかどうかを調べるために、新しい統計手法を用いる。
トレーニングデータに*reweight*に最適化アプローチを適用し、数千のスプリアス相関を低減します。
驚くべきことに、この方法ではトレーニングデータの語彙バイアスを低減できますが、トレーニングされたモデルで対応するバイアスの強い証拠がまだ見つかっていません。
論文 参考訳(メタデータ) (2023-06-03T20:12:27Z) - Analyzing Bias in Diffusion-based Face Generation Models [75.80072686374564]
拡散モデルは、合成データ生成と画像編集アプリケーションでますます人気がある。
本研究では, 性別, 人種, 年齢などの属性に関して, 拡散型顔生成モデルにおけるバイアスの存在について検討する。
本研究は,GAN(Generative Adversarial Network)とGAN(Generative Adversarial Network)をベースとした顔生成モデルにおいて,データセットサイズが属性組成および知覚品質に与える影響について検討する。
論文 参考訳(メタデータ) (2023-05-10T18:22:31Z) - Pseudo Bias-Balanced Learning for Debiased Chest X-ray Classification [57.53567756716656]
本研究では, バイアスラベルを正確に把握せず, 脱バイアス胸部X線診断モデルの開発について検討した。
本稿では,まずサンプルごとのバイアスラベルをキャプチャし,予測する新しいアルゴリズム,擬似バイアスバランス学習を提案する。
提案手法は他の最先端手法よりも一貫した改善を実現した。
論文 参考訳(メタデータ) (2022-03-18T11:02:18Z) - General Greedy De-bias Learning [163.65789778416172]
本稿では,関数空間における勾配降下のような偏りのあるモデルとベースモデルを優雅に訓練する一般グリーディ・デバイアス学習フレームワーク(GGD)を提案する。
GGDは、事前知識を持つタスク固有バイアスモデルと、事前知識を持たない自己アンサンブルバイアスモデルの両方の設定の下で、より堅牢なベースモデルを学ぶことができる。
論文 参考訳(メタデータ) (2021-12-20T14:47:32Z) - On the Efficacy of Adversarial Data Collection for Question Answering:
Results from a Large-Scale Randomized Study [65.17429512679695]
逆データ収集(ADC)では、人間の労働力がモデルとリアルタイムで対話し、誤った予測を誘発する例を作成しようとする。
ADCの直感的な魅力にも拘わらず、敵対的データセットのトレーニングがより堅牢なモデルを生成するかどうかは不明だ。
論文 参考訳(メタデータ) (2021-06-02T00:48:33Z) - Transitioning from Real to Synthetic data: Quantifying the bias in model [1.6134566438137665]
本研究では,合成データを用いたモデルにおけるバイアスと公平性のトレードオフを確立することを目的とする。
合成データを用いて訓練したモデルには、様々なレベルのバイアスの影響があることを実証する。
論文 参考訳(メタデータ) (2021-05-10T06:57:14Z) - Negative Data Augmentation [127.28042046152954]
負のデータ拡張サンプルは、データ分散のサポートに関する情報を提供することを示す。
我々は、NDAを識別器の合成データの追加源として利用する新しいGAN訓練目標を提案する。
実験により,本手法で訓練したモデルでは,異常検出能力の向上とともに条件付き・条件付き画像生成の改善を実現している。
論文 参考訳(メタデータ) (2021-02-09T20:28:35Z) - Detect and Correct Bias in Multi-Site Neuroimaging Datasets [2.750124853532831]
神経画像のバイアスを調べるため、17の研究で脳の35,320個の磁気共鳴画像を合成した。
我々は、しばしば観察研究における主要な欠点と見なされる共起バイアスについて、より詳しく検討する。
我々は最近導入されたComBatアルゴリズムを拡張し、画像特徴間のグローバルな変動を制御する。
論文 参考訳(メタデータ) (2020-02-12T15:32:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。