論文の概要: Improving Covariance-Regularized Discriminant Analysis for EHR-based
Predictive Analytics of Diseases
- arxiv url: http://arxiv.org/abs/1610.05446v4
- Date: Wed, 8 Mar 2023 08:52:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-26 04:31:57.381439
- Title: Improving Covariance-Regularized Discriminant Analysis for EHR-based
Predictive Analytics of Diseases
- Title(参考訳): EHRに基づく疾患予測分析のための共分散規則化判別分析の改善
- Authors: Sijia Yang, Haoyi Xiong, Kaibo Xu, Licheng Wang, Jiang Bian, Zeyi Sun
- Abstract要約: 任意の分布を持つデータを分類するためのLDAの精度を理解する解析モデルについて検討する。
また、HDLSSデータのために開発された最先端のLDA手法より優れた新しいLDA分類器De-Sparseを提案する。
- 参考スコア(独自算出の注目度): 20.697847129363463
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Linear Discriminant Analysis (LDA) is a well-known technique for feature
extraction and dimension reduction. The performance of classical LDA, however,
significantly degrades on the High Dimension Low Sample Size (HDLSS) data for
the ill-posed inverse problem. Existing approaches for HDLSS data
classification typically assume the data in question are with Gaussian
distribution and deal the HDLSS classification problem with regularization.
However, these assumptions are too strict to hold in many emerging real-life
applications, such as enabling personalized predictive analysis using
Electronic Health Records (EHRs) data collected from an extremely limited
number of patients who have been diagnosed with or without the target disease
for prediction. In this paper, we revised the problem of predictive analysis of
disease using personal EHR data and LDA classifier. To fill the gap, in this
paper, we first studied an analytical model that understands the accuracy of
LDA for classifying data with arbitrary distribution. The model gives a
theoretical upper bound of LDA error rate that is controlled by two factors:
(1) the statistical convergence rate of (inverse) covariance matrix estimators
and (2) the divergence of the training/testing datasets to fitted
distributions. To this end, we could lower the error rate by balancing the two
factors for better classification performance. Hereby, we further proposed a
novel LDA classifier De-Sparse that leverages De-sparsified Graphical Lasso to
improve the estimation of LDA, which outperforms state-of-the-art LDA
approaches developed for HDLSS data. Such advances and effectiveness are
further demonstrated by both theoretical analysis and extensive experiments on
EHR datasets.
- Abstract(参考訳): 線形判別分析(LDA)は特徴抽出と次元減少のためのよく知られた手法である。
しかし,従来のLDAの性能は,逆問題に対するHDLSS(High Dimension Low Sample Size)データで著しく低下する。
既存のHDLSSデータ分類のアプローチでは、問題となっているデータはガウス分布と仮定し、正規化を伴うHDLSS分類問題を扱うのが一般的である。
しかし、これらの仮定は極めて限られた数の患者から収集された電子健康記録(ehrs)データを用いてパーソナライズされた予測分析を可能にし、予測のためにターゲット疾患と診断されたかどうかを判断するなど、多くの新興現実のアプリケーションで保持するには厳しすぎる。
本稿では,個人EHRデータとLDA分類器を用いて,疾患の予測分析の問題を修正した。
このギャップを埋めるため,本稿では,データ分類におけるldaの精度を任意の分布で理解する解析モデルについて検討した。
このモデルでは,(1)(逆)共分散行列推定器の統計的収束率,(2)トレーニング/テストデータセットの適合分布へのばらつきの2つの因子によって制御されるLDA誤差率の理論的上限を与える。
この結果から,2つの要因のバランスを保ち,分類性能を向上させることで誤差率を下げることができた。
そこで本研究では,HDLSSデータのために開発された最先端のLDA手法よりも優れたLDA推定精度を向上させるために,デスパーシファイドグラフラッソを利用した新しいLDA分類器De-Sparseを提案する。
このような進歩と有効性は、理論解析とEHRデータセットに関する広範な実験によってさらに実証される。
関連論文リスト
- Stability and Generalization for Distributed SGDA [70.97400503482353]
分散SGDAのための安定性に基づく一般化分析フレームワークを提案する。
我々は, 安定性の誤差, 一般化ギャップ, 人口リスクの包括的分析を行う。
理論的結果から,一般化ギャップと最適化誤差のトレードオフが明らかになった。
論文 参考訳(メタデータ) (2024-11-14T11:16:32Z) - Directly Handling Missing Data in Linear Discriminant Analysis for Enhancing Classification Accuracy and Interpretability [1.4840867281815378]
重み付き欠失線形判別分析(WLDA)と呼ばれる新しい頑健な分類法を提案する。
WLDAは線形判別分析(LDA)を拡張して、計算不要な値でデータセットを処理する。
我々はWLDAの特性を確立するために詳細な理論解析を行い、その説明可能性について徹底的に評価する。
論文 参考訳(メタデータ) (2024-06-30T14:21:32Z) - Towards Clinician-Preferred Segmentation: Leveraging Human-in-the-Loop for Test Time Adaptation in Medical Image Segmentation [10.65123164779962]
深層学習に基づく医療画像セグメンテーションモデルは、様々な医療センターに展開すると、しばしば性能劣化に直面します。
本稿では,クリニカル修正予測のほとんど見落とされがちな可能性を生かした,新規なHuman-in-the-loop TTAフレームワークを提案する。
我々のフレームワークは、ドメインの格差によって生じる予測のばらつきを減らし、分散損失を想定する。
論文 参考訳(メタデータ) (2024-05-14T02:02:15Z) - An ADRC-Incorporated Stochastic Gradient Descent Algorithm for Latent
Factor Analysis [6.843073158719234]
勾配降下(SGD)に基づく潜在因子分析(LFA)モデルは,HDI行列から貴重な情報を抽出するのに極めて有効である。
標準SGDアルゴリズムは、学習エラーの履歴と将来の状態を考慮せずに、現在の学習誤差のみを計算できる。
本稿では,ADRCを組み込んだSGD(ADS)アルゴリズムを革新的に提案する。
論文 参考訳(メタデータ) (2024-01-13T08:38:54Z) - Minimally Informed Linear Discriminant Analysis: training an LDA model
with unlabelled data [51.673443581397954]
本研究では,LDAモデルからの正確な射影ベクトルを,ラベルのないデータに基づいて計算可能であることを示す。
MILDA投影ベクトルはLDAに匹敵する計算コストで閉じた形で計算可能であることを示す。
論文 参考訳(メタデータ) (2023-10-17T09:50:31Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic
Diffusion Models [69.9178140563928]
大腸内視鏡検査は臨床診断や治療に不可欠である。
注釈付きデータの不足は、既存の手法の有効性と一般化を制限する。
本稿では, 下流作業に有用な大腸内視鏡画像を生成するために, 適応Refinement Semantic Diffusion Model (ArSDM)を提案する。
論文 参考訳(メタデータ) (2023-09-03T07:55:46Z) - BCD Nets: Scalable Variational Approaches for Bayesian Causal Discovery [97.79015388276483]
構造方程式モデル(SEM)は、有向非巡回グラフ(DAG)を介して表される因果関係を推論する効果的な枠組みである。
近年の進歩により、観測データからDAGの有効最大点推定が可能となった。
線形ガウス SEM を特徴付ける DAG 上の分布を推定するための変分フレームワークである BCD Nets を提案する。
論文 参考訳(メタデータ) (2021-12-06T03:35:21Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Efficient Estimation and Evaluation of Prediction Rules in
Semi-Supervised Settings under Stratified Sampling [6.930951733450623]
本稿では,2段階の半教師付き学習(SSL)手法を提案する。
ステップIでは、非ランダムサンプリングを考慮した非線形基底関数による重み付き回帰により、欠落ラベルをインプットする。
ステップIIでは、結果の予測器の整合性を確保するために、初期計算を増強する。
論文 参考訳(メタデータ) (2020-10-19T12:54:45Z) - A Doubly Regularized Linear Discriminant Analysis Classifier with
Automatic Parameter Selection [24.027886914804775]
線形判別分析(LDA)に基づく分類器は、訓練データのサイズが特徴数よりも小さい、あるいは同等であるような多くの実践的な設定で混乱する傾向にある。
R2LDAと表す2つの正規化LDA分類器を提案する。
合成データと実データの両方から得られた結果は,提案したR2LDA手法の一貫性と有効性を示す。
論文 参考訳(メタデータ) (2020-04-28T07:09:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。