論文の概要: Coarse race data conceals disparities in clinical risk score performance
- arxiv url: http://arxiv.org/abs/2304.09270v1
- Date: Tue, 18 Apr 2023 20:17:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-20 16:14:58.189236
- Title: Coarse race data conceals disparities in clinical risk score performance
- Title(参考訳): 臨床リスクスコアのパフォーマンスの格差を隠蔽する粗いレースデータ
- Authors: Rajiv Movva, Divya Shanmugam, Kaihua Hou, Priya Pathak, John Guttag,
Nikhil Garg, Emma Pierson
- Abstract要約: 粗いレースカテゴリーでは、パフォーマンスに顕著な相違があることが示される。
粗いグループ内のパフォーマンス指標の変化は、粗いグループ間の変動を上回ることが多い。
以上の結果から,医療提供者,病院システム,機械学習研究者は,粗い人種データの代わりに,詳細な人種データを収集し,リリースし,利用するべきであることが示唆された。
- 参考スコア(独自算出の注目度): 3.2278821777253905
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Healthcare data in the United States often records only a patient's coarse
race group: for example, both Indian and Chinese patients are typically coded
as ``Asian.'' It is unknown, however, whether this coarse coding conceals
meaningful disparities in the performance of clinical risk scores across
granular race groups. Here we show that it does. Using data from 418K emergency
department visits, we assess clinical risk score performance disparities across
granular race groups for three outcomes, five risk scores, and four performance
metrics. Across outcomes and metrics, we show that there are significant
granular disparities in performance within coarse race categories. In fact,
variation in performance metrics within coarse groups often exceeds the
variation between coarse groups. We explore why these disparities arise,
finding that outcome rates, feature distributions, and the relationships
between features and outcomes all vary significantly across granular race
categories. Our results suggest that healthcare providers, hospital systems,
and machine learning researchers should strive to collect, release, and use
granular race data in place of coarse race data, and that existing analyses may
significantly underestimate racial disparities in performance.
- Abstract(参考訳): 米国での医療データは、患者の粗い人種のみを記録していることが多く、例えば、インドと中国の両方の患者は、通常「アジア人」と表記される。
しかし、この粗いコーディングが、種族間の臨床リスクスコアのパフォーマンスに有意な差を秘めているかどうかは不明である。
ここではそれを示します。
418Kの救急部門訪問データを用いて,3つの結果,5つのリスクスコア,4つのパフォーマンス指標について,臨床リスクスコアのパフォーマンス格差を評価する。
結果と測定値全体で、粗いレースカテゴリにおけるパフォーマンスには大きな相違があることが示される。
実際、粗いグループ内のパフォーマンスメトリクスのばらつきは、粗いグループ間のばらつきを超えることが多い。
これらの相違がなぜ生じるのかを考察し、結果率、特徴分布、特徴と結果の関係が、粒度のレースカテゴリーによって大きく異なることを明らかにする。
以上の結果から, 医療提供者, 病院システム, 機械学習研究者は, 粗い人種データの代わりに粒度の人種データを収集し, リリースし, 使用することに努めるべきである。
関連論文リスト
- Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - A Transfer Learning Causal Approach to Evaluate Racial/Ethnic and Geographic Variation in Outcomes Following Congenital Heart Surgery [4.870691561986669]
先天性心不全(英: Congenital heart defects、CHD)は、アメリカ合衆国で最も多い出生障害である。
CHD治療の成績は特定の患者群で異なり、非ヒスパニック系黒人とヒスパニック系人口は死亡率と死亡率が高い。
本稿では,結果評価のための因果推論フレームワークを提案し,伝達学習の進歩を活用して,ターゲットとソースの双方からのデータを組み込む。
論文 参考訳(メタデータ) (2024-03-21T17:20:23Z) - Multi-task Explainable Skin Lesion Classification [54.76511683427566]
少ないラベル付きデータでよく一般化する皮膚病変に対する数発のショットベースアプローチを提案する。
提案手法は,アテンションモジュールや分類ネットワークとして機能するセグメンテーションネットワークの融合を含む。
論文 参考訳(メタデータ) (2023-10-11T05:49:47Z) - When More is Less: Incorporating Additional Datasets Can Hurt
Performance By Introducing Spurious Correlations [16.782625445546273]
その結果、2つの病院のデータに基づいてトレーニングされたモデルでは、1つの病院のデータでトレーニングされたモデルよりも、両方の病院でグループ精度が劣っていることがわかった。
この現象は, 病院固有のイメージアーティファクトが原因で, 疾患と病院との間に生じる急激な相関関係から生じると説明される。
論文 参考訳(メタデータ) (2023-08-08T17:58:45Z) - Towards Fair Face Verification: An In-depth Analysis of Demographic
Biases [11.191375513738361]
近年,深層学習に基づく人物識別・検証システムは,精度の面で著しく向上している。
しかし、このようなシステムは人種、年齢、性別に関する重大な偏見を呈している。
本稿では,これらの要因の交叉性に着目した詳細な分析を行う。
論文 参考訳(メタデータ) (2023-07-19T14:49:14Z) - Towards Group Robustness in the presence of Partial Group Labels [61.33713547766866]
入力サンプルとターゲットラベルの間に 急激な相関関係がある ニューラルネットワークの予測を誤った方向に導く
本稿では,制約セットから最悪のグループ割り当てを最適化するアルゴリズムを提案する。
グループ間で総合的な集計精度を維持しつつ,少数集団のパフォーマンス向上を示す。
論文 参考訳(メタデータ) (2022-01-10T22:04:48Z) - Fairness in Cardiac MR Image Analysis: An Investigation of Bias Due to
Data Imbalance in Deep Learning Based Segmentation [1.6386696247541932]
AIにおける「フェアネス」とは、人種や性別などの人口統計特性に基づいて、潜在的なバイアスのアルゴリズムを評価することを指す。
近年, 心MR領域の深層学習(DL)が注目されているが, それらの妥当性についてはまだ研究されていない。
異なる人種集団間でDiceのパフォーマンスに統計的に有意な差が認められた。
論文 参考訳(メタデータ) (2021-06-23T13:27:35Z) - Mixture Model Framework for Traumatic Brain Injury Prognosis Using
Heterogeneous Clinical and Outcome Data [3.7363119896212478]
TBIに関連する大きな異種データ型をモデル化する手法を開発する。
このモデルは、人口統計、血液ベースのバイオマーカー、画像検出など、さまざまなデータタイプを含むデータセットでトレーニングされます。
教師なしの学習環境で患者を別々のグループに成層するために使用されます。
論文 参考訳(メタデータ) (2020-12-22T19:31:03Z) - Temporal Phenotyping using Deep Predictive Clustering of Disease
Progression [97.88605060346455]
我々は、時系列データをクラスタリングするためのディープラーニングアプローチを開発し、各クラスタは、同様の将来的な結果を共有する患者から構成される。
2つの実世界のデータセットに対する実験により、我々のモデルは最先端のベンチマークよりも優れたクラスタリング性能が得られることが示された。
論文 参考訳(メタデータ) (2020-06-15T20:48:43Z) - Deep Mining External Imperfect Data for Chest X-ray Disease Screening [57.40329813850719]
我々は、外部のCXRデータセットを組み込むことで、不完全なトレーニングデータにつながると論じ、課題を提起する。
本研究は,多ラベル病分類問題を重み付き独立二分課題として分類する。
我々のフレームワークは、ドメインとラベルの相違を同時にモデル化し、対処し、優れた知識マイニング能力を実現する。
論文 参考訳(メタデータ) (2020-06-06T06:48:40Z) - Predictive Modeling of ICU Healthcare-Associated Infections from
Imbalanced Data. Using Ensembles and a Clustering-Based Undersampling
Approach [55.41644538483948]
本研究は,集中治療室における危険因子の同定と医療関連感染症の予測に焦点をあてる。
感染発生率の低減に向けた意思決定を支援することを目的とする。
論文 参考訳(メタデータ) (2020-05-07T16:13:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。