論文の概要: Are Sex-based Physiological Differences the Cause of Gender Bias for
Chest X-ray Diagnosis?
- arxiv url: http://arxiv.org/abs/2308.05129v1
- Date: Wed, 9 Aug 2023 10:19:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-11 14:49:23.241425
- Title: Are Sex-based Physiological Differences the Cause of Gender Bias for
Chest X-ray Diagnosis?
- Title(参考訳): 胸部x線診断における性差は性差の原因か?
- Authors: Nina Weng, Siavash Bigdeli, Eike Petersen, Aasa Feragen
- Abstract要約: 機械学習を用いた胸部X線診断における性別バイアスの原因について検討した。
特に,乳房組織が肺の露出不足につながるという仮説を考察する。
広範に利用されている2つの公開データセットにおける患者1人あたりの録音の高度に歪んだ分布に対処する新しいサンプリング手法を提案する。
- 参考スコア(独自算出の注目度): 2.1601966913620325
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While many studies have assessed the fairness of AI algorithms in the medical
field, the causes of differences in prediction performance are often unknown.
This lack of knowledge about the causes of bias hampers the efficacy of bias
mitigation, as evidenced by the fact that simple dataset balancing still often
performs best in reducing performance gaps but is unable to resolve all
performance differences. In this work, we investigate the causes of gender bias
in machine learning-based chest X-ray diagnosis. In particular, we explore the
hypothesis that breast tissue leads to underexposure of the lungs and causes
lower model performance. Methodologically, we propose a new sampling method
which addresses the highly skewed distribution of recordings per patient in two
widely used public datasets, while at the same time reducing the impact of
label errors. Our comprehensive analysis of gender differences across diseases,
datasets, and gender representations in the training set shows that dataset
imbalance is not the sole cause of performance differences. Moreover, relative
group performance differs strongly between datasets, indicating important
dataset-specific factors influencing male/female group performance. Finally, we
investigate the effect of breast tissue more specifically, by cropping out the
breasts from recordings, finding that this does not resolve the observed
performance gaps. In conclusion, our results indicate that dataset-specific
factors, not fundamental physiological differences, are the main drivers of
male--female performance gaps in chest X-ray analyses on widely used NIH and
CheXpert Dataset.
- Abstract(参考訳): 多くの研究が医療分野におけるAIアルゴリズムの公平性を評価しているが、予測性能の違いの原因はしばしば不明である。
このバイアスの原因に関する知識の欠如はバイアス緩和の効果を損なうものであり、単純なデータセットの分散がパフォーマンスのギャップを減らし、全てのパフォーマンスの違いを解決することができないという事実によって証明されている。
本研究では,機械学習を用いた胸部X線診断における性別バイアスの原因について検討する。
特に,乳房組織が肺の露出不足を招き,モデル性能を低下させるという仮説を考察する。
提案手法は,広く利用されている2つの公開データセットにおける患者1人あたりの録音の高度に歪んだ分布に対処すると同時に,ラベルエラーの影響を低減できる新しいサンプリング手法を提案する。
学習セットにおける疾患,データセット,性別表現間の性差の包括的分析は,データセットの不均衡がパフォーマンス差の唯一の原因ではないことを示している。
さらに、相対的なグループのパフォーマンスはデータセットによって大きく異なり、男性/女性グループのパフォーマンスに影響を与える重要なデータセット固有の要因を示している。
最後に,より具体的には乳房組織の影響について検討し,乳房を記録から抽出し,観察されたパフォーマンスギャップを解消しないことを示した。
以上の結果から,nihおよびchexpertデータセットの胸部x線分析における男女差の主な要因は,基本的な生理的差異ではなく,データセット固有の因子であることが示唆された。
関連論文リスト
- Slicing Through Bias: Explaining Performance Gaps in Medical Image Analysis using Slice Discovery Methods [5.274804664403783]
我々はSlice Discovery Methodsを用いて、観測された性能格差の原因に関する仮説とデータの解釈可能な未実行部分集合を同定する。
本研究は, 仮説定式化におけるSDMの有効性を実証し, 既往の男女間パフォーマンスの相違について解説する。
論文 参考訳(メタデータ) (2024-06-17T23:08:46Z) - (Predictable) Performance Bias in Unsupervised Anomaly Detection [3.826262429926079]
教師なし異常検出(UAD)モデルは、疾患検出の重要な第1ステップを支援することを約束する。
本研究は, ある集団群に対して, UADモデルの異なる性能を定量的に評価した。
論文 参考訳(メタデータ) (2023-09-25T14:57:43Z) - The Impact of Debiasing on the Performance of Language Models in
Downstream Tasks is Underestimated [70.23064111640132]
我々は、幅広いベンチマークデータセットを用いて、複数の下流タスクのパフォーマンスに対するデバイアスの影響を比較した。
実験により、デバイアスの効果は全てのタスクにおいて一貫して見積もられていることが示されている。
論文 参考訳(メタデータ) (2023-09-16T20:25:34Z) - How Does Pruning Impact Long-Tailed Multi-Label Medical Image
Classifiers? [49.35105290167996]
プルーニングは、ディープニューラルネットワークを圧縮し、全体的なパフォーマンスに大きな影響を及ぼすことなく、メモリ使用量と推論時間を短縮する強力なテクニックとして登場した。
この研究は、プルーニングがモデル行動に与える影響を理解するための第一歩である。
論文 参考訳(メタデータ) (2023-08-17T20:40:30Z) - Risk of Bias in Chest Radiography Deep Learning Foundation Models [14.962566915809264]
2002年10月から2017年7月までに収集されたCheXpertデータセットから,42,884人の胸部X線写真127,118点(平均年齢63[SD]17歳,男性23,623点,女性19,261点)を使用した。
生物学的セックスと人種における12対比較のうち10は、研究基盤モデルに統計的に有意な差が認められた。
男性と女性 (P .001) とアジアと黒人 (P .001) の間に有意な差がみられた。
論文 参考訳(メタデータ) (2022-09-07T07:16:30Z) - To Impute or not to Impute? -- Missing Data in Treatment Effect
Estimation [84.76186111434818]
我々は,MCM(Mixed Con founded missingness)と呼ばれる新しい欠損機構を同定し,ある欠損度が治療選択を判断し,他の欠損度が治療選択によって決定されることを示した。
本研究は,全てのデータを因果的に入力すると,不偏推定を行うために必要な情報を効果的に除去するので,処理効果のモデルが貧弱になることを示す。
私たちのソリューションは選択的計算であり、CMMからの洞察を使って、どの変数をインプットすべきで、どの変数をインプットすべきでないかを正確に知らせる。
論文 参考訳(メタデータ) (2022-02-04T12:08:31Z) - Potential sources of dataset bias complicate investigation of
underdiagnosis by machine learning algorithms [20.50071537200745]
Seyed-Kalantariらは、3つの胸部X線データセットで訓練されたモデルが偽陽性率の差をもたらすことを発見した。
この研究は、これらのモデルが体系的な下垂体手術を展示し、潜在的に増幅していると結論付けている。
論文 参考訳(メタデータ) (2022-01-19T20:51:38Z) - Explaining medical AI performance disparities across sites with
confounder Shapley value analysis [8.785345834486057]
マルチサイト評価は、このような格差を診断する鍵となる。
本フレームワークは,各種類のバイアスが全体の性能差に与える影響を定量化する手法を提供する。
本研究は, 深部学習モデルを用いて気胸の有無を検知し, その有用性を実証するものである。
論文 参考訳(メタデータ) (2021-11-12T18:54:10Z) - Efficient Causal Inference from Combined Observational and
Interventional Data through Causal Reductions [68.6505592770171]
因果効果を推定する際の主な課題の1つである。
そこで本研究では,任意の数の高次元潜入共創者を置き換える新たな因果還元法を提案する。
パラメータ化縮小モデルを観測データと介入データから共同で推定する学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-08T14:29:07Z) - The Gap on GAP: Tackling the Problem of Differing Data Distributions in
Bias-Measuring Datasets [58.53269361115974]
バイアスモデルを検出する診断データセットは、自然言語処理におけるバイアス低減の重要な前提条件である。
収集されたデータの望ましくないパターンは、そのようなテストを誤ったものにします。
実験データにおけるそのようなパターンに対処するために, 実験サンプルを重み付けする理論的基礎的手法を提案する。
論文 参考訳(メタデータ) (2020-11-03T16:50:13Z) - Deep Mining External Imperfect Data for Chest X-ray Disease Screening [57.40329813850719]
我々は、外部のCXRデータセットを組み込むことで、不完全なトレーニングデータにつながると論じ、課題を提起する。
本研究は,多ラベル病分類問題を重み付き独立二分課題として分類する。
我々のフレームワークは、ドメインとラベルの相違を同時にモデル化し、対処し、優れた知識マイニング能力を実現する。
論文 参考訳(メタデータ) (2020-06-06T06:48:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。