論文の概要: Curvature-based Feature Selection with Application in Classifying
Electronic Health Records
- arxiv url: http://arxiv.org/abs/2101.03581v1
- Date: Sun, 10 Jan 2021 16:55:40 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-08 08:23:59.806646
- Title: Curvature-based Feature Selection with Application in Classifying
Electronic Health Records
- Title(参考訳): 電子健康記録の分類に応用した曲率に基づく特徴選択
- Authors: Zheming Zuo, Jie Li, Noura Al Moubayed
- Abstract要約: より正確な診断を支援するための効率的な曲率に基づく特徴選択法を提案する。
4つのベンチマークヘルスケアデータセットで最新のパフォーマンスを実現します。
- 参考スコア(独自算出の注目度): 13.427883408828642
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Electronic Health Records (EHRs) are widely applied in healthcare facilities
nowadays. Due to the inherent heterogeneity, unbalanced, incompleteness, and
high-dimensional nature of EHRs, it is a challenging task to employ machine
learning algorithms to analyse such EHRs for prediction and diagnostics within
the scope of precision medicine. Dimensionality reduction is an efficient data
preprocessing technique for the analysis of high dimensional data that reduces
the number of features while improving the performance of the data analysis,
e.g. classification. In this paper, we propose an efficient curvature-based
feature selection method for supporting more precise diagnosis. The proposed
method is a filter-based feature selection method, which directly utilises the
Menger Curvature for ranking all the attributes in the given data set. We
evaluate the performance of our method against conventional PCA and recent ones
including BPCM, GSAM, WCNN, BLS II, VIBES, 2L-MJFA, RFGA, and VAF. Our method
achieves state-of-the-art performance on four benchmark healthcare data sets
including CCRFDS, BCCDS, BTDS, and DRDDS with impressive 24.73% and 13.93%
improvements respectively on BTDS and CCRFDS, 7.97% improvement on BCCDS, and
3.63% improvement on DRDDS. Our CFS source code is publicly available at
https://github.com/zhemingzuo/CFS.
- Abstract(参考訳): 電子健康記録(ehrs)は現在、医療施設で広く利用されている。
EHRの固有の不均一性、不均衡、不完全性、高次元性のため、精度医学の範囲内での予測と診断のために機械学習アルゴリズムを用いて分析することは難しい課題である。
次元縮小は高次元データ解析のための効率的なデータ前処理手法であり、例えば、データ解析の性能を向上させながら特徴量を削減する。
分類。
本稿では,より正確な診断を支援するための効率的な曲率に基づく特徴選択法を提案する。
提案手法は,Menger Curvatureを直接利用して,与えられたデータセットの属性をすべてランク付けするフィルタに基づく特徴選択手法である。
従来のPCAとBPCM, GSAM, WCNN, BLS II, VIBES, 2L-MJFA, RFGA, VAFを含む最近のPCAとの比較を行った。
本手法は, CCRFDS, BCCDS, BTDS, DRDDSの4つのベンチマーク医療データに対して, BTDSとCCRFDSのそれぞれ24.73%, 13.93%の改善, BCCDSの7.97%, DRDDSの3.63%の改善を行った。
私たちのCFSソースコードはhttps://github.com/zhemingzuo/CFS.comで公開されています。
関連論文リスト
- Differentially Private SGD Without Clipping Bias: An Error-Feedback
Approach [67.7315816158682]
Differentially Private Gradient Descent with gradient clipping (DPSGD-GC)は、ディープラーニングモデルをトレーニングするための強力なツールである。
DPノイズインジェクションと勾配クリッピングによるモデル性能劣化のコストがかかる。
DPSGD-GCに代わる新しいエラーフィードバック(EF)DPアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-11-24T17:56:44Z) - ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic
Diffusion Models [69.9178140563928]
大腸内視鏡検査は臨床診断や治療に不可欠である。
注釈付きデータの不足は、既存の手法の有効性と一般化を制限する。
本稿では, 下流作業に有用な大腸内視鏡画像を生成するために, 適応Refinement Semantic Diffusion Model (ArSDM)を提案する。
論文 参考訳(メタデータ) (2023-09-03T07:55:46Z) - FineEHR: Refine Clinical Note Representations to Improve Mortality
Prediction [3.9026461169566673]
大規模な電子健康記録は、臨床テキストとバイタルサインデータの豊富な機械学習モデルを提供する。
臨床ノート分析のための高度な自然言語処理(NLP)アルゴリズムの出現にもかかわらず、生臨床データに存在する複雑なテキスト構造とノイズは重大な課題となっている。
本稿では,2つの表現学習技術,すなわちメートル法学習と微調整技術を用いて,臨床ノートの埋め込みを洗練させるシステムFINEEHRを提案する。
論文 参考訳(メタデータ) (2023-04-24T02:42:52Z) - Random Data Augmentation based Enhancement: A Generalized Enhancement
Approach for Medical Datasets [8.844562557753399]
本稿では、DLの医療データ品質を改善するために、一般化された、データに依存しない、効率的な拡張手法を開発する。
画質は、画像の明るさとコントラストを改善することで向上する。
新型コロナウイルスの胸部X線、KiTS19、LC25000データセットによるRGB画像の実験が実施されている。
論文 参考訳(メタデータ) (2022-10-03T11:16:22Z) - Auto-FedRL: Federated Hyperparameter Optimization for
Multi-institutional Medical Image Segmentation [48.821062916381685]
Federated Learning(FL)は、明示的なデータ共有を避けながら協調的なモデルトレーニングを可能にする分散機械学習技術である。
本稿では,Auto-FedRLと呼ばれる,効率的な強化学習(RL)に基づくフェデレーションハイパーパラメータ最適化アルゴリズムを提案する。
提案手法の有効性は,CIFAR-10データセットと2つの実世界の医用画像セグメンテーションデータセットの不均一なデータ分割に対して検証される。
論文 参考訳(メタデータ) (2022-03-12T04:11:42Z) - Lung Cancer Lesion Detection in Histopathology Images Using Graph-Based
Sparse PCA Network [93.22587316229954]
ヘマトキシリンとエオシン(H&E)で染色した組織学的肺スライドにおける癌病変の自動検出のためのグラフベーススパース成分分析(GS-PCA)ネットワークを提案する。
我々は,SVM K-rasG12D肺がんモデルから得られたH&Eスライダーの精度・リコール率,Fスコア,谷本係数,レシーバ演算子特性(ROC)の曲線下領域を用いて,提案アルゴリズムの性能評価を行った。
論文 参考訳(メタデータ) (2021-10-27T19:28:36Z) - Identifying Stroke Indicators Using Rough Sets [0.7340017786387767]
そこで本研究では,脳卒中検出における各種EMHレコードの重要性をランキングする手法を提案する。
年齢, 平均血糖値, 心疾患, 高血圧が脳卒中検出の最も重要な要因であった。
論文 参考訳(メタデータ) (2021-10-19T06:04:48Z) - A Profile-Based Binary Feature Extraction Method Using Frequent Itemsets
for Improving Coronary Artery Disease Diagnosis [0.0]
本稿では、プロファイルベースバイナリ特徴抽出(PBBFE)と呼ばれる新しい特徴抽出手法を用いたCAD診断手法を提案する。
数値的な特徴を分割した後、Aprioriアルゴリズムにより頻繁な項目集合を抽出し、CAD診断精度を高めるために特徴として使用する。
提案手法はCAD分野において最もリッチなデータベースであるZ-Alizadeh Saniデータセット上で検証された。
論文 参考訳(メタデータ) (2021-09-22T18:33:45Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - A novel method for Causal Structure Discovery from EHR data, a
demonstration on type-2 diabetes mellitus [3.8171820752218997]
本稿では,新しいデータ変換手法と新しい因果構造探索アルゴリズムを提案する。
提案手法を2型糖尿病に適用した。
論文 参考訳(メタデータ) (2020-11-11T00:50:04Z) - ECG-DelNet: Delineation of Ambulatory Electrocardiograms with Mixed
Quality Labeling Using Neural Networks [69.25956542388653]
ディープラーニング(DL)アルゴリズムは、学術的、産業的にも重くなっている。
セグメンテーションフレームワークにECGの検出とデライン化を組み込むことにより、低解釈タスクにDLをうまく適用できることを実証する。
このモデルは、PhyloNetのQTデータベースを使用して、105個の増幅ECG記録から訓練された。
論文 参考訳(メタデータ) (2020-05-11T16:29:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。