論文の概要: Effect of Demographic Bias on Skin Lesion Classification
- arxiv url: http://arxiv.org/abs/2606.03214v1
- Date: Tue, 02 Jun 2026 06:16:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-03 22:00:04.801393
- Title: Effect of Demographic Bias on Skin Lesion Classification
- Title(参考訳): 皮膚病変分類におけるデモグラフィックバイアスの影響
- Authors: Ralf Raumanns, Gerard Schouten, Veronika Cheplygina, Josien P. W. Pluim,
- Abstract要約: ResNetを用いた畳み込みモデルを用いて皮膚病変分類の性能を評価する。
性に基づく分析は、性固有のトレーニングデータセットがモデルのパフォーマンスを最適化することを示している。
性別バイアスは主にデータ不均衡から生じるが、年齢バイアスは分布に関係なく若年層を常に好んでいる。
- 参考スコア(独自算出の注目度): 1.7494286961318986
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this study, we evaluate the performance of skin lesion classification using ResNet-based convolutional models, focusing on the impact of demographic bias in training data, particularly variations in patient sex and age. We use linear programming to generate datasets with controlled demographic characteristics, allowing systematic investigation of bias effects. Three learning strategies are evaluated: a single-task model, a reinforcing multi-task model, and an adversarial learning scheme. Our sex-based analysis indicates that sex-specific training datasets optimise model performance. Notably, including male patients in the training data improved performance for the male subgroup, even in female-majority cases. Reinforcing and adversarial learning schemes narrowed or eliminated bias gaps in balanced and female-majority datasets. However, these strategies proved less effective in male-majority settings, where models continued to perform better for males than females. The two learning schemes showed marginal bias reduction compared to the baseline model in predominantly male patient populations. Age-based analysis demonstrates comparable baseline performance across the three model approaches, with performance declining across age categories. Younger groups consistently achieve the highest performance, regardless of training data distribution. Although balanced training yields optimal results for the youngest age category, performance decreases in older categories. We find that sex biases arise mainly from data imbalances, while age biases consistently favour younger groups regardless of distribution. These distinct mechanisms require targeted mitigation strategies. Additionally, cross-dataset validation on two external datasets revealed that domain shifts notably affect performance and patterns of demographic bias.
- Abstract(参考訳): 本研究では、ResNetベースの畳み込みモデルを用いて皮膚病変分類の性能を評価し、トレーニングデータにおける人口統計バイアスの影響、特に患者の性別や年齢の変化に着目した。
我々は線形プログラミングを用いて、人口統計特性を制御したデータセットを生成し、バイアス効果の体系的な調査を可能にする。
3つの学習戦略が評価される: シングルタスクモデル、強化マルチタスクモデル、および逆学習スキーム。
性別に基づく分析は、性特化訓練データセットがモデルのパフォーマンスを最適化することを示している。
トレーニングデータ中の男性患者を含めた場合,男性サブグループの成績は,女性マジョリティ例においても改善した。
強化学習スキームと対人学習スキームは、バランスの取れたデータセットと女性マジョリティデータセットのバイアスギャップを狭めたり、排除した。
しかし、これらの戦略は、モデルが女性よりも男性にとって良いパフォーマンスを保ち続けた男性と男性の間では効果が低いことが判明した。
この2つの学習手法は, 主に男性患者群において, 基準モデルと比較し, 限界バイアスの低減を示した。
年齢に基づく分析は、3つのモデルアプローチで比較可能なベースライン性能を示し、年齢カテゴリでパフォーマンスが低下する。
より若いグループは、トレーニングデータ分布に関係なく、常に最高のパフォーマンスを達成する。
バランスの取れたトレーニングは、最年少のカテゴリに最適な結果をもたらすが、古いカテゴリではパフォーマンスが低下する。
性別バイアスは主にデータ不均衡から生じるが、年齢バイアスは分布に関係なく若年層を常に好んでいる。
これらの異なるメカニズムは標的緩和戦略を必要とする。
さらに、2つの外部データセットのクロスデータセット検証により、ドメインシフトが特にパフォーマンスや人口統計バイアスのパターンに影響を与えることが明らかになった。
関連論文リスト
- Dataset Distribution Impacts Model Fairness: Single vs. Multi-Task Learning [2.9530211066840417]
ResNetベースのCNNを用いて皮膚病変分類の性能を評価する。
患者性やクラスラベルの異なるデータセットを生成するための線形プログラミング手法を提案する。
論文 参考訳(メタデータ) (2024-07-24T15:23:26Z) - Evaluating Bias and Fairness in Gender-Neutral Pretrained
Vision-and-Language Models [23.65626682262062]
我々は,3種類の視覚・言語モデルを用いた事前学習および微調整後のバイアス増幅の定量化を行う。
全体として、事前学習および微調整後のバイアス増幅は独立である。
論文 参考訳(メタデータ) (2023-10-26T16:19:19Z) - Studying the Effects of Sex-related Differences on Brain Age Prediction
using brain MR Imaging [0.3958317527488534]
脳磁気共鳴画像(MRI)に基づく機械学習モデルを開発する際の性に関するバイアスについて検討する。
異なる実験設計を考慮に入れた脳年齢予測を行い,性別の影響について検討した。
異なる性別サブグループとデータセットで訓練した脳年齢予測モデルの性能に相違が認められた。
論文 参考訳(メタデータ) (2023-10-17T20:55:53Z) - Identifying and examining machine learning biases on Adult dataset [0.7856362837294112]
この研究は、エンサンブルラーニングによる機械学習モデルバイアスの低減を念頭に置いている。
我々の厳密な方法論は、様々なカテゴリー変数にまたがる偏見を包括的に評価し、最終的に顕著な男女属性偏見を明らかにします。
本研究は,データ駆動型社会における倫理的考察とハイブリッドモデルの実現を提唱する。
論文 参考訳(メタデータ) (2023-10-13T19:41:47Z) - The Impact of Debiasing on the Performance of Language Models in
Downstream Tasks is Underestimated [70.23064111640132]
我々は、幅広いベンチマークデータセットを用いて、複数の下流タスクのパフォーマンスに対するデバイアスの影響を比較した。
実験により、デバイアスの効果は全てのタスクにおいて一貫して見積もられていることが示されている。
論文 参考訳(メタデータ) (2023-09-16T20:25:34Z) - Gender Biases in Automatic Evaluation Metrics for Image Captioning [87.15170977240643]
画像キャプションタスクのためのモデルに基づく評価指標において、性別バイアスの体系的研究を行う。
偏りのある世代と偏りのない世代を区別できないことを含む、これらの偏りのあるメトリクスを使用することによる負の結果を実証する。
人間の判断と相関を損なうことなく、測定バイアスを緩和する簡便で効果的な方法を提案する。
論文 参考訳(メタデータ) (2023-05-24T04:27:40Z) - Improving Gender Fairness of Pre-Trained Language Models without
Catastrophic Forgetting [88.83117372793737]
元のトレーニングデータに情報を埋め込むことは、モデルの下流のパフォーマンスを大きなマージンで損なう可能性がある。
本稿では,GEnder Equality Prompt(GEEP)を提案する。
論文 参考訳(メタデータ) (2021-10-11T15:52:16Z) - Balancing Biases and Preserving Privacy on Balanced Faces in the Wild [50.915684171879036]
現在の顔認識(FR)モデルには、人口統計バイアスが存在する。
さまざまな民族と性別のサブグループにまたがる偏見を測定するために、我々のバランス・フェイススをWildデータセットに導入します。
真偽と偽のサンプルペアを区別するために1点のスコアしきい値に依存すると、最適以下の結果が得られます。
本稿では,最先端ニューラルネットワークから抽出した顔特徴を用いたドメイン適応学習手法を提案する。
論文 参考訳(メタデータ) (2021-03-16T15:05:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。