論文の概要: On the Importance of Diversity in Re-Sampling for Imbalanced Data and
Rare Events in Mortality Risk Models
- arxiv url: http://arxiv.org/abs/2012.09645v1
- Date: Tue, 15 Dec 2020 09:45:35 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-08 08:51:20.899427
- Title: On the Importance of Diversity in Re-Sampling for Imbalanced Data and
Rare Events in Mortality Risk Models
- Title(参考訳): 不均衡データと希少事象の再サンプリングにおける多様性の重要性について
- Authors: Yuxuan (Diana) Yang, Hadi Akbarzadeh Khorshidi, Uwe Aickelin, Aditi
Nevgi, Elif Ekinci
- Abstract要約: 外科的アウトカムリスクツール(SORT)は、英国の主要な選択的内科手術の期間を通して死亡リスクを予測するために開発されたツールの1つです。
本研究では,データセット内のクラス不均衡に対処することにより,SORT予測モデルの拡張を行う。
提案手法は,共通再サンプリング技術上での多様性に基づく選択の応用について検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Surgical risk increases significantly when patients present with comorbid
conditions. This has resulted in the creation of numerous risk stratification
tools with the objective of formulating associated surgical risk to assist both
surgeons and patients in decision-making. The Surgical Outcome Risk Tool (SORT)
is one of the tools developed to predict mortality risk throughout the entire
perioperative period for major elective in-patient surgeries in the UK. In this
study, we enhance the original SORT prediction model (UK SORT) by addressing
the class imbalance within the dataset. Our proposed method investigates the
application of diversity-based selection on top of common re-sampling
techniques to enhance the classifier's capability in detecting minority
(mortality) events. Diversity amongst training datasets is an essential factor
in ensuring re-sampled data keeps an accurate depiction of the
minority/majority class region, thereby solving the generalization problem of
mainstream sampling approaches. We incorporate the use of the Solow-Polasky
measure as a drop-in functionality to evaluate diversity, with the addition of
greedy algorithms to identify and discard subsets that share the most
similarity. Additionally, through empirical experiments, we prove that the
performance of the classifier trained over diversity-based dataset outperforms
the original classifier over ten external datasets. Our diversity-based
re-sampling method elevates the performance of the UK SORT algorithm by 1.4$.
- Abstract(参考訳): 合併症のある患者では外科的リスクが著しく増加する。
この結果、外科医と患者の意思決定を支援するために関連する外科的リスクを定式化する目的で、多数のリスク階層化ツールが作られた。
外科的アウトカムリスクツール(英: Surgery Outcome Risk Tool、SORT)は、イギリスにおける主要な外科手術における周術期を通して死亡リスクを予測するために開発されたツールの1つである。
本研究では,データセット内のクラス不均衡に対処することにより,元のSORT予測モデル(UK SORT)を強化する。
提案手法は,マイノリティ(モータリティ)イベントの検出における分類器の能力を高めるために,共通再サンプリング手法を用いた多様性に基づく選択の適用を検討する。
トレーニングデータセット間の多様性は、マイノリティ/マイジョリティクラス領域の正確な描写を維持するために必要不可欠な要素であり、メインストリームサンプリングアプローチの一般化問題を解決する。
多様性を評価するために,Sollow-Polasky測度をドロップイン機能として利用し,最も類似性の高い部分集合を識別・破棄するgreedyアルゴリズムを追加した。
さらに、実証実験により、多様性に基づくデータセットよりも訓練された分類器の性能が10個の外部データセットよりも優れていることを示す。
多様性に基づく再サンプリング手法により,UK SORTアルゴリズムの性能は1.4ドル向上した。
関連論文リスト
- MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Tackling Diverse Minorities in Imbalanced Classification [80.78227787608714]
不均衡データセットは、様々な現実世界のアプリケーションで一般的に見られ、分類器の訓練において重要な課題が提示されている。
マイノリティクラスとマイノリティクラスの両方のデータサンプルを混合することにより、反復的に合成サンプルを生成することを提案する。
提案するフレームワークの有効性を,7つの公開ベンチマークデータセットを用いて広範な実験により実証する。
論文 参考訳(メタデータ) (2023-08-28T18:48:34Z) - Ambiguous Medical Image Segmentation using Diffusion Models [60.378180265885945]
我々は,グループ洞察の分布を学習することで,複数の可算出力を生成する単一拡散モデルに基づくアプローチを提案する。
提案モデルでは,拡散の固有のサンプリングプロセスを利用してセグメンテーションマスクの分布を生成する。
その結果,提案手法は既存の最先端曖昧なセグメンテーションネットワークよりも優れていることがわかった。
論文 参考訳(メタデータ) (2023-04-10T17:58:22Z) - Self-Certifying Classification by Linearized Deep Assignment [65.0100925582087]
そこで我々は,PAC-Bayesリスク認定パラダイム内で,グラフ上のメトリックデータを分類するための新しい深層予測器のクラスを提案する。
PAC-Bayesの最近の文献とデータに依存した先行研究に基づいて、この手法は仮説空間上の後続分布の学習を可能にする。
論文 参考訳(メタデータ) (2022-01-26T19:59:14Z) - A Deep Variational Approach to Clustering Survival Data [5.871238645229228]
変分深層クラスタリングにおけるクラスタサバイバルデータに対する新しい確率的アプローチを提案する。
提案手法は,説明変数と潜在的に検閲された生存時間の両方の分布を明らかにするために,深い生成モデルを用いている。
論文 参考訳(メタデータ) (2021-06-10T14:10:25Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Deep Cox Mixtures for Survival Regression [11.64579638651557]
本稿では,Cox回帰の学習混合物をモデルとした生存分析回帰モデルに対する新しいアプローチについて述べる。
我々は、複数の実世界のデータセットで実験を行い、民族や性別にまたがる患者の死亡率を調べる。
論文 参考訳(メタデータ) (2021-01-16T22:41:22Z) - WRSE -- a non-parametric weighted-resolution ensemble for predicting
individual survival distributions in the ICU [0.251657752676152]
集中治療室(ICU)における死亡リスクの動的評価は、患者を階層化し、治療効果を知らせたり、早期警戒システムの一部として機能したりすることができる。
現状の確率モデルと競合する結果を示すとともに,2~9倍のトレーニング時間を大幅に短縮する。
論文 参考訳(メタデータ) (2020-11-02T10:13:59Z) - Predictive Modeling of ICU Healthcare-Associated Infections from
Imbalanced Data. Using Ensembles and a Clustering-Based Undersampling
Approach [55.41644538483948]
本研究は,集中治療室における危険因子の同定と医療関連感染症の予測に焦点をあてる。
感染発生率の低減に向けた意思決定を支援することを目的とする。
論文 参考訳(メタデータ) (2020-05-07T16:13:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。