論文の概要: Predictive Modeling of ICU Healthcare-Associated Infections from
Imbalanced Data. Using Ensembles and a Clustering-Based Undersampling
Approach
- arxiv url: http://arxiv.org/abs/2005.03582v1
- Date: Thu, 7 May 2020 16:13:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-05 22:38:13.402276
- Title: Predictive Modeling of ICU Healthcare-Associated Infections from
Imbalanced Data. Using Ensembles and a Clustering-Based Undersampling
Approach
- Title(参考訳): 不均衡データによるICU医療関連感染症の予測モデル
アンサンブルとクラスタリングに基づくアンダーサンプリングアプローチ
- Authors: Fernando S\'anchez-Hern\'andez, Juan Carlos Ballesteros-Herr\'aez,
Mohamed S. Kraiem, Mercedes S\'anchez-Barba and Mar\'ia N. Moreno-Garc\'ia
- Abstract要約: 本研究は,集中治療室における危険因子の同定と医療関連感染症の予測に焦点をあてる。
感染発生率の低減に向けた意思決定を支援することを目的とする。
- 参考スコア(独自算出の注目度): 55.41644538483948
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Early detection of patients vulnerable to infections acquired in the hospital
environment is a challenge in current health systems given the impact that such
infections have on patient mortality and healthcare costs. This work is focused
on both the identification of risk factors and the prediction of
healthcare-associated infections in intensive-care units by means of
machine-learning methods. The aim is to support decision making addressed at
reducing the incidence rate of infections. In this field, it is necessary to
deal with the problem of building reliable classifiers from imbalanced
datasets. We propose a clustering-based undersampling strategy to be used in
combination with ensemble classifiers. A comparative study with data from 4616
patients was conducted in order to validate our proposal. We applied several
single and ensemble classifiers both to the original dataset and to data
preprocessed by means of different resampling methods. The results were
analyzed by means of classic and recent metrics specifically designed for
imbalanced data classification. They revealed that the proposal is more
efficient in comparison with other approaches.
- Abstract(参考訳): 病院における感染症の早期発見は,患者の死亡率や医療費に影響を及ぼすため,現在の医療システムでは課題となっている。
本研究は, 集中治療室におけるリスク因子の同定と, 機械学習による医療関連感染症の予測に焦点をあてた。
感染発生率の低減に向けた意思決定を支援することを目的とする。
この分野では、不均衡データセットから信頼できる分類器を構築する問題に対処する必要がある。
本稿では,アンサンブル分類器と組み合わせたクラスタリングに基づくアンダーサンプリング手法を提案する。
4616例のデータを比較検討し,本提案の妥当性を検証した。
元のデータセットと異なる再サンプリング手法を用いて事前処理されたデータの両方に,複数の単一およびアンサンブル分類器を適用した。
その結果、不均衡なデータ分類に特化して設計された古典的および最近の指標を用いて分析した。
彼らはこの提案が他のアプローチよりも効率的であることを明かした。
関連論文リスト
- Enhancing Performance for Highly Imbalanced Medical Data via Data Regularization in a Federated Learning Setting [6.22153888560487]
本手法の目的は,心血管疾患予測のためのモデル性能を向上させることである。
本手法は, 心臓血管疾患予測のための4つのデータセットにまたがって評価され, 異なるクライアントに分散している。
論文 参考訳(メタデータ) (2024-05-30T19:15:38Z) - Few-shot learning for COVID-19 Chest X-Ray Classification with
Imbalanced Data: An Inter vs. Intra Domain Study [49.5374512525016]
医療画像データセットは、コンピュータ支援診断、治療計画、医学研究に使用される訓練モデルに不可欠である。
データ分散のばらつき、データの不足、ジェネリックイメージから事前トレーニングされたモデルを使用する場合の転送学習の問題などである。
本稿では,データ不足と分散不均衡の影響を軽減するために,一連の手法を統合したシームズニューラルネットワークに基づく手法を提案する。
論文 参考訳(メタデータ) (2024-01-18T16:59:27Z) - Counterfactual Data Augmentation with Contrastive Learning [27.28511396131235]
本稿では,選択したサブセットに対して,結果に反する結果をもたらすモデルに依存しないデータ拡張手法を提案する。
我々は、比較学習を用いて表現空間と類似度尺度を学習し、学習された類似度尺度で同定された個人に近い学習空間において、同様の潜在的な結果が得られるようにした。
この性質は、代替治療群から近接した近縁者に対する対実的な結果の信頼性の高い計算を保証する。
論文 参考訳(メタデータ) (2023-11-07T00:36:51Z) - An AI-Guided Data Centric Strategy to Detect and Mitigate Biases in
Healthcare Datasets [32.25265709333831]
我々は、小さなサンプルサイズ(AEquity)で異なるグループをいかに容易に学習するかを調査することによって、データセットバイアスを評価するために、データ中心、モデルに依存しないタスク非依存のアプローチを生成する。
次に、サブポピュレーション全体にわたるAEq値の体系的分析を適用し、医療における2つの既知の事例において、人種的偏見の特定と顕在化を図った。
AEqは、医療データセットのバイアスを診断し、修正することで、エクイティの前進に適用できる、新しく広く適用可能なメトリクスである。
論文 参考訳(メタデータ) (2023-11-06T17:08:41Z) - Density-Aware Personalized Training for Risk Prediction in Imbalanced
Medical Data [89.79617468457393]
不均衡率(クラス密度差)のトレーニングモデルは、最適以下の予測につながる可能性がある。
この不均衡問題に対するモデルトレーニングのためのフレームワークを提案する。
実世界の医療データセットにおけるモデルの性能向上を実証する。
論文 参考訳(メタデータ) (2022-07-23T00:39:53Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Adversarial Sample Enhanced Domain Adaptation: A Case Study on
Predictive Modeling with Electronic Health Records [57.75125067744978]
ドメイン適応を容易にするデータ拡張手法を提案する。
逆生成したサンプルはドメイン適応時に使用される。
その結果,本手法の有効性とタスクの一般性が確認された。
論文 参考訳(メタデータ) (2021-01-13T03:20:20Z) - Mixture Model Framework for Traumatic Brain Injury Prognosis Using
Heterogeneous Clinical and Outcome Data [3.7363119896212478]
TBIに関連する大きな異種データ型をモデル化する手法を開発する。
このモデルは、人口統計、血液ベースのバイオマーカー、画像検出など、さまざまなデータタイプを含むデータセットでトレーニングされます。
教師なしの学習環境で患者を別々のグループに成層するために使用されます。
論文 参考訳(メタデータ) (2020-12-22T19:31:03Z) - On the Importance of Diversity in Re-Sampling for Imbalanced Data and
Rare Events in Mortality Risk Models [0.0]
外科的アウトカムリスクツール(SORT)は、英国の主要な選択的内科手術の期間を通して死亡リスクを予測するために開発されたツールの1つです。
本研究では,データセット内のクラス不均衡に対処することにより,SORT予測モデルの拡張を行う。
提案手法は,共通再サンプリング技術上での多様性に基づく選択の応用について検討する。
論文 参考訳(メタデータ) (2020-12-15T09:45:35Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。