論文の概要: Subgroup Validity in Machine Learning for Echocardiogram Data
- arxiv url: http://arxiv.org/abs/2512.00976v1
- Date: Sun, 30 Nov 2025 16:47:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.525244
- Title: Subgroup Validity in Machine Learning for Echocardiogram Data
- Title(参考訳): エコー心電図データの機械学習におけるサブグループ妥当性
- Authors: Cynthia Feeney, Shane Williams, Benjamin S. Wessler, Michael C. Hughes,
- Abstract要約: 本研究は,現在行われている心エコー図では,サブグループの妥当性を保証できないことを示す。
TMED-2とMIMIC-IV-ECHOの2つのデータセットのソシオデマトグラフィーレポートを改善した。
性別、人種、民族のサブグループの妥当性を示す証拠は不十分である。
- 参考スコア(独自算出の注目度): 4.028934134585442
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Echocardiogram datasets enable training deep learning models to automate interpretation of cardiac ultrasound, thereby expanding access to accurate readings of diagnostically-useful images. However, the gender, sex, race, and ethnicity of the patients in these datasets are underreported and subgroup-specific predictive performance is unevaluated. These reporting deficiencies raise concerns about subgroup validity that must be studied and addressed before model deployment. In this paper, we show that current open echocardiogram datasets are unable to assuage subgroup validity concerns. We improve sociodemographic reporting for two datasets: TMED-2 and MIMIC-IV-ECHO. Analysis of six open datasets reveals no consideration of gender-diverse patients and insufficient patient counts for many racial and ethnic groups. We further perform an exploratory subgroup analysis of two published aortic stenosis detection models on TMED-2. We find insufficient evidence for subgroup validity for sex, racial, and ethnic subgroups. Our findings highlight that more data for underrepresented subgroups, improved demographic reporting, and subgroup-focused analyses are needed to prove subgroup validity in future work.
- Abstract(参考訳): エコー心電図データセットは、ディープラーニングモデルをトレーニングすることで、心臓超音波の解釈を自動化し、診断に有用な画像の正確な読影へのアクセスを拡大する。
しかし、これらのデータセットにおける患者の性別、性別、人種、民族性は報告されていないため、サブグループ固有の予測性能は評価されていない。
これらの報告の欠陥は、モデルの展開前に研究され対処されなければならないサブグループの妥当性に関する懸念を提起する。
本稿では,現在行われている心エコー図では,サブグループの妥当性を保証できないことを示す。
TMED-2とMIMIC-IV-ECHOの2つのデータセットのソシオデマトグラフィーレポートを改善した。
6つのオープンデータセットの分析では、性別の多様性のある患者は考慮されず、多くの人種や民族の集団では不十分な患者数を示す。
さらに,TMED-2を用いた2つの大動脈狭窄検出モデルの探索的サブグループ解析を行った。
性別、人種、民族のサブグループの妥当性を示す証拠は不十分である。
この結果から, 未表現サブグループ, 人口報告の改善, サブグループに着目した分析が, 今後の作業におけるサブグループの有効性の証明に必要であることが示唆された。
関連論文リスト
- From Majority to Minority: A Diffusion-based Augmentation for Underrepresented Groups in Skin Lesion Analysis [43.1078084014722]
AIに基づく診断は皮膚がんの分類における皮膚科レベルのパフォーマンスを示す。
このようなシステムは、トレーニングセットに十分な表現が欠けている少数派のグループからのデータでテストすると、性能が低下する傾向にある。
マイノリティグループに利益をもたらすために,多数派からの豊富な情報の利用を最大化する,効果的な拡散に基づく拡張フレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-26T14:19:31Z) - Demographic Bias of Expert-Level Vision-Language Foundation Models in
Medical Imaging [13.141767097232796]
自己監督型視覚言語基盤モデルは、明示的なトレーニングアノテーションに頼ることなく、幅広い病態を検出することができる。
これらのAIモデルが人間の偏見を反映または増幅しないことを保証することが不可欠である。
本研究では,5つのグローバルソースデータセットを対象とした胸部X線診断における最先端の視覚言語基盤モデルのアルゴリズム的公正性について検討した。
論文 参考訳(メタデータ) (2024-02-22T18:59:53Z) - Evaluating the Fairness of the MIMIC-IV Dataset and a Baseline
Algorithm: Application to the ICU Length of Stay Prediction [65.268245109828]
本稿では、MIMIC-IVデータセットを用いて、滞在時間を予測するXGBoostバイナリ分類モデルにおける公平性とバイアスについて検討する。
この研究は、人口統計属性にわたるデータセットのクラス不均衡を明らかにし、データ前処理と特徴抽出を採用する。
この論文は、偏見を緩和するための公正な機械学習技術と、医療専門家とデータサイエンティストの協力的な努力の必要性について結論付けている。
論文 参考訳(メタデータ) (2023-12-31T16:01:48Z) - (Predictable) Performance Bias in Unsupervised Anomaly Detection [3.826262429926079]
教師なし異常検出(UAD)モデルは、疾患検出の重要な第1ステップを支援することを約束する。
本研究は, ある集団群に対して, UADモデルの異なる性能を定量的に評価した。
論文 参考訳(メタデータ) (2023-09-25T14:57:43Z) - Multi-class versus One-class classifier in spontaneous speech analysis
oriented to Alzheimer Disease diagnosis [58.720142291102135]
本研究の目的は,音声信号から抽出した新しいバイオマーカーを用いて自動解析を行うことにより,ADの早期診断と重症度評価の改善に寄与することである。
外付け器とフラクタル次元の機能に関する情報を使用することで、システムの性能が向上する。
論文 参考訳(メタデータ) (2022-03-21T09:57:20Z) - Potential sources of dataset bias complicate investigation of
underdiagnosis by machine learning algorithms [20.50071537200745]
Seyed-Kalantariらは、3つの胸部X線データセットで訓練されたモデルが偽陽性率の差をもたらすことを発見した。
この研究は、これらのモデルが体系的な下垂体手術を展示し、潜在的に増幅していると結論付けている。
論文 参考訳(メタデータ) (2022-01-19T20:51:38Z) - Towards Group Robustness in the presence of Partial Group Labels [61.33713547766866]
入力サンプルとターゲットラベルの間に 急激な相関関係がある ニューラルネットワークの予測を誤った方向に導く
本稿では,制約セットから最悪のグループ割り当てを最適化するアルゴリズムを提案する。
グループ間で総合的な集計精度を維持しつつ,少数集団のパフォーマンス向上を示す。
論文 参考訳(メタデータ) (2022-01-10T22:04:48Z) - Deep learning-based COVID-19 pneumonia classification using chest CT
images: model generalizability [54.86482395312936]
深層学習(DL)分類モデルは、異なる国の3DCTデータセット上で、COVID-19陽性患者を特定するために訓練された。
我々は、データセットと72%の列車、8%の検証、20%のテストデータを組み合わせたDLベースの9つの同一分類モデルを訓練した。
複数のデータセットでトレーニングされ、トレーニングに使用されるデータセットの1つからテストセットで評価されたモデルは、よりよいパフォーマンスを示した。
論文 参考訳(メタデータ) (2021-02-18T21:14:52Z) - Deep Semi-Supervised Embedded Clustering (DSEC) for Stratification of
Heart Failure Patients [50.48904066814385]
本研究では、深層半教師付き組込みクラスタリングを用いて、心不全のデータ駆動型患者サブグループを決定する。
ヘテロジニアスデータから得られた組込み空間から臨床関連クラスタを見出した。
提案アルゴリズムは、異なる結果を持つ患者の新たな未診断サブグループを見つけることができる。
論文 参考訳(メタデータ) (2020-12-24T12:56:46Z) - Deep Mining External Imperfect Data for Chest X-ray Disease Screening [57.40329813850719]
我々は、外部のCXRデータセットを組み込むことで、不完全なトレーニングデータにつながると論じ、課題を提起する。
本研究は,多ラベル病分類問題を重み付き独立二分課題として分類する。
我々のフレームワークは、ドメインとラベルの相違を同時にモデル化し、対処し、優れた知識マイニング能力を実現する。
論文 参考訳(メタデータ) (2020-06-06T06:48:40Z) - Risk of Training Diagnostic Algorithms on Data with Demographic Bias [0.5599792629509227]
医用画像解析アプリケーションにおけるMICCAI 2018の実践を調査するために,MICCAI 2018の手順を調査した。
意外なことに、診断に焦点を当てた論文では、使用されるデータセットの人口統計がほとんど書かれていないことが判明した。
本研究では,非偏りのある特徴を,対向的な学習環境において,人口統計変数を明示的に使用することにより学習可能であることを示す。
論文 参考訳(メタデータ) (2020-05-20T13:51:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。