論文の概要: An Investigation Into Race Bias in Random Forest Models Based on Breast
DCE-MRI Derived Radiomics Features
- arxiv url: http://arxiv.org/abs/2309.17197v1
- Date: Fri, 29 Sep 2023 12:45:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-02 13:54:20.274293
- Title: An Investigation Into Race Bias in Random Forest Models Based on Breast
DCE-MRI Derived Radiomics Features
- Title(参考訳): DCE-MRI誘導放射能特性に基づくランダム森林モデルにおけるレースバイアスの調査
- Authors: Mohamed Huti, Tiarna Lee, Elinor Sawyer, Andrew P. King
- Abstract要約: 放射能特性を用いて訓練したランダム森林(RF)モデルにおけるレースバイアスの可能性について検討した。
人種不均衡データを用いて腫瘍分子サブタイプを予測するために訓練されたRFモデルは、偏りのある振る舞いをもたらすように見える。
- 参考スコア(独自算出の注目度): 1.9077771032617559
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent research has shown that artificial intelligence (AI) models can
exhibit bias in performance when trained using data that are imbalanced by
protected attribute(s). Most work to date has focused on deep learning models,
but classical AI techniques that make use of hand-crafted features may also be
susceptible to such bias. In this paper we investigate the potential for race
bias in random forest (RF) models trained using radiomics features. Our
application is prediction of tumour molecular subtype from dynamic contrast
enhanced magnetic resonance imaging (DCE-MRI) of breast cancer patients. Our
results show that radiomics features derived from DCE-MRI data do contain
race-identifiable information, and that RF models can be trained to predict
White and Black race from these data with 60-70% accuracy, depending on the
subset of features used. Furthermore, RF models trained to predict tumour
molecular subtype using race-imbalanced data seem to produce biased behaviour,
exhibiting better performance on test data from the race on which they were
trained.
- Abstract(参考訳): 近年の研究では、人工知能(AI)モデルが、保護属性によって不均衡なデータを用いてトレーニングされた場合、性能のバイアスを示すことが示されている。
これまでの研究のほとんどはディープラーニングモデルに重点を置いてきたが、手作りの機能を利用する古典的なAI技術も、そのようなバイアスの影響を受けやすい。
本稿では,放射能特性を用いたランダム森林(RF)モデルにおけるレースバイアスの可能性について検討する。
乳癌患者における dynamic contrast enhanced magnetic resonance imaging (dce-mri) による腫瘍分子サブタイプの予測について検討した。
以上の結果から,DCE-MRIデータから得られた放射能特徴には人種識別情報が含まれており,RFモデルを用いて60~70%の精度でホワイトレースとブラックレースを予測することができることがわかった。
さらに、人種不均衡データを用いて腫瘍分子サブタイプを予測するために訓練されたRFモデルは、バイアスのある振る舞いを生じさせ、訓練されたレースのデータに対してより良い性能を示す。
関連論文リスト
- Development and Comparative Analysis of Machine Learning Models for Hypoxemia Severity Triage in CBRNE Emergency Scenarios Using Physiological and Demographic Data from Medical-Grade Devices [0.0]
グラディエントブースティングモデル(GBM)は、トレーニング速度、解釈可能性、信頼性の点で、シーケンシャルモデルを上回った。
タイムリーな介入のために5分間の予測ウィンドウが選択された。
本研究は、トリアージを改善し、アラーム疲労を軽減するMLの可能性を強調した。
論文 参考訳(メタデータ) (2024-10-30T23:24:28Z) - A Demographic-Conditioned Variational Autoencoder for fMRI Distribution Sampling and Removal of Confounds [49.34500499203579]
変動型オートエンコーダ(VAE)ベースのモデルであるDemoVAEを作成し、人口統計学から fMRI の特徴を推定する。
ユーザが供給する人口動態に基づいて,高品質な合成fMRIデータを生成する。
論文 参考訳(メタデータ) (2024-05-13T17:49:20Z) - MCRAGE: Synthetic Healthcare Data for Fairness [3.0089659534785853]
そこで本稿では,MCRAGE (Generative Modeling) の強化による不均衡データセットの増大によるマイノリティクラス再バランスを提案する。
MCRAGEは、デノイング拡散確率モデル (Denoising Diffusion Probabilistic Model, CDDPM) を訓練し、未表現のクラスから高品質な合成EHRサンプルを生成する。
この合成データを使用して、既存の不均衡なデータセットを増大させ、その結果、すべてのクラスにまたがるよりバランスの取れた分散を実現します。
論文 参考訳(メタデータ) (2023-10-27T19:02:22Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - An investigation into the impact of deep learning model choice on sex
and race bias in cardiac MR segmentation [8.449342469976758]
被検者の性別と人種の不均衡が、AIによる心臓磁気共鳴画像のセグメンテーションにどのように影響するかを検討する。
4つのモデルのうち3つのモデルに有意な性的偏見があり、すべてのモデルに人種的偏見がある。
論文 参考訳(メタデータ) (2023-08-25T14:55:38Z) - Deep Learning for Predicting Progression of Patellofemoral
Osteoarthritis Based on Lateral Knee Radiographs, Demographic Data and
Symptomatic Assessments [1.1549572298362785]
本研究はMOST研究のベースラインから被験者(被験者1832名,膝3276名)を抽出した。
PF関節領域は, 側膝X線上の自動ランドマーク検出ツール(BoneFinder)を用いて同定した。
年齢、性別、BMIおよびWOMACスコア、および大腿骨関節X線学的関節炎ステージ(KLスコア)の危険因子について
論文 参考訳(メタデータ) (2023-05-10T06:43:33Z) - Clinical Deterioration Prediction in Brazilian Hospitals Based on
Artificial Neural Networks and Tree Decision Models [56.93322937189087]
超強化ニューラルネットワーク(XBNet)は臨床劣化(CD)を予測するために用いられる
XGBoostモデルはブラジルの病院のデータからCDを予測する最良の結果を得た。
論文 参考訳(メタデータ) (2022-12-17T23:29:14Z) - Efficient Out-of-Distribution Detection of Melanoma with Wavelet-based
Normalizing Flows [22.335623464185105]
メラノーマは皮膚がんの重篤な形態であり、後期の死亡率が高い。
データセットは非常に不均衡であり、最先端の教師付きAIモデルのトレーニングを複雑にします。
本稿では, 生成モデルを用いて良性データ分布を学習し, 密度推定による悪性画像の検出を提案する。
論文 参考訳(メタデータ) (2022-08-09T09:57:56Z) - Mixed Effects Neural ODE: A Variational Approximation for Analyzing the
Dynamics of Panel Data [50.23363975709122]
パネルデータ解析に(固定・ランダムな)混合効果を取り入れたME-NODEという確率モデルを提案する。
我々は、Wong-Zakai定理によって提供されるSDEの滑らかな近似を用いて、我々のモデルを導出できることを示す。
次に、ME-NODEのためのエビデンスに基づく下界を導出し、(効率的な)トレーニングアルゴリズムを開発する。
論文 参考訳(メタデータ) (2022-02-18T22:41:51Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。