論文の概要: Tree-Guided Rare Feature Selection and Logic Aggregation with Electronic
Health Records Data
- arxiv url: http://arxiv.org/abs/2206.09107v1
- Date: Sat, 18 Jun 2022 03:52:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-22 15:24:04.739227
- Title: Tree-Guided Rare Feature Selection and Logic Aggregation with Electronic
Health Records Data
- Title(参考訳): 電子健康記録データを用いた樹木誘導型希少特徴選択と論理アグリゲーション
- Authors: Jianmin Chen, Robert H. Aseltine, Fei Wang, Kun Chen
- Abstract要約: 希少な二項特徴を持つ大規模回帰のための木誘導的特徴選択と論理集約手法を提案する。
EHRデータを用いた自殺リスクスタディでは、我々のアプローチは、以前のメンタルヘルス診断を選択して集約することができる。
- 参考スコア(独自算出の注目度): 7.076989262260993
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Statistical learning with a large number of rare binary features is commonly
encountered in analyzing electronic health records (EHR) data, especially in
the modeling of disease onset with prior medical diagnoses and procedures.
Dealing with the resulting highly sparse and large-scale binary feature matrix
is notoriously challenging as conventional methods may suffer from a lack of
power in testing and inconsistency in model fitting while machine learning
methods may suffer from the inability of producing interpretable results or
clinically-meaningful risk factors. To improve EHR-based modeling and utilize
the natural hierarchical structure of disease classification, we propose a
tree-guided feature selection and logic aggregation approach for large-scale
regression with rare binary features, in which dimension reduction is achieved
through not only a sparsity pursuit but also an aggregation promoter with the
logic operator of ``or''. We convert the combinatorial problem into a convex
linearly-constrained regularized estimation, which enables scalable computation
with theoretical guarantees. In a suicide risk study with EHR data, our
approach is able to select and aggregate prior mental health diagnoses as
guided by the diagnosis hierarchy of the International Classification of
Diseases. By balancing the rarity and specificity of the EHR diagnosis records,
our strategy improves both prediction and model interpretation. We identify
important higher-level categories and subcategories of mental health conditions
and simultaneously determine the level of specificity needed for each of them
in predicting suicide risk.
- Abstract(参考訳): 電子健康記録(ehr)データの解析において、多くの希少な二進性特徴を持つ統計的学習は、特に先行医療診断と処置を伴う疾患発症のモデリングにおいてよく見られる。
従来の手法はテストの力不足やモデルフィッティングの一貫性の欠如に悩まされる一方で、機械学習の手法では解釈可能な結果や臨床的に意味のあるリスク要因を発生できないという問題もある。
病気分類の自然な階層構造を生かし,EHRに基づくモデリングを改善するために,希少な二分特徴を持つ大規模回帰のための木誘導特徴選択と論理集約手法を提案する。
組合せ問題を線形拘束正規化推定に変換し, 理論的な保証によりスケーラブルな計算が可能となる。
EHRデータを用いた自殺リスクスタディでは,国際疾患分類の診断階層が示すように,従来の精神保健診断を選択・集約することが可能である。
EHR診断記録の希少性と特異性のバランスをとることで,予測とモデル解釈の両方を改善することができる。
自殺リスクの予測において,精神疾患の重要な上位カテゴリーと下位カテゴリを特定し,それぞれに必要な特異度を同時に決定する。
関連論文リスト
- Inference of Dependency Knowledge Graph for Electronic Health Records [13.35941801610195]
動的対数線形トピックモデルに基づくスパース知識グラフの導出フレームワークを提案する。
このモデルでは、経験的ポイントワイド相互情報行列上で特異値分解を行うことにより、KG埋め込みを推定する。
次に、KG低ランク推定器のエントリーワイド正規度を確立し、制御されたI型誤差によるスパースグラフエッジの回復を可能にする。
論文 参考訳(メタデータ) (2023-12-25T04:45:36Z) - An AI-Guided Data Centric Strategy to Detect and Mitigate Biases in
Healthcare Datasets [32.25265709333831]
我々は、小さなサンプルサイズ(AEquity)で異なるグループをいかに容易に学習するかを調査することによって、データセットバイアスを評価するために、データ中心、モデルに依存しないタスク非依存のアプローチを生成する。
次に、サブポピュレーション全体にわたるAEq値の体系的分析を適用し、医療における2つの既知の事例において、人種的偏見の特定と顕在化を図った。
AEqは、医療データセットのバイアスを診断し、修正することで、エクイティの前進に適用できる、新しく広く適用可能なメトリクスである。
論文 参考訳(メタデータ) (2023-11-06T17:08:41Z) - AI Framework for Early Diagnosis of Coronary Artery Disease: An
Integration of Borderline SMOTE, Autoencoders and Convolutional Neural
Networks Approach [0.44998333629984877]
我々は,データのバランスが不均衡でサンプルサイズが小さい場合に,より正確な予測を行うために,データのバランスと拡張のための方法論を開発する。
実験の結果,提案手法の平均精度は95.36であり,ランダムフォレスト(RF),決定木(DT),サポートベクターマシン(SVM),ロジスティック回帰(LR),人工ニューラルネットワーク(ANN)よりも高かった。
論文 参考訳(メタデータ) (2023-08-29T14:33:38Z) - TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - Deep Stable Representation Learning on Electronic Health Records [8.256340233221112]
CHE(Causal Healthcare Embedding)は、診断と処置の依存関係を取り除くことで、突発的な統計的関係を取り除くことを目的としている。
提案手法は,既存の深層学習モデルをEHR上で拡張可能な,フレキシブルなプラグアンドプレイモジュールとして利用できる。
論文 参考訳(メタデータ) (2022-09-03T04:10:45Z) - Analysis of lifelog data using optimal feature selection based
unsupervised logistic regression (OFS-ULR) for chronic disease classification [2.3909933791900326]
慢性疾患分類モデルは現在、より良い医療実践を探求するためにライフログデータの可能性を活用している。
本稿では,慢性疾患の分類に最適な特徴選択に基づく非教師なしロジスティック回帰モデル(OFS-ULR)を構築することを目的とする。
論文 参考訳(メタデータ) (2022-04-04T07:11:26Z) - A multi-stage machine learning model on diagnosis of esophageal
manometry [50.591267188664666]
このフレームワークには、飲み込みレベルにおけるディープラーニングモデルと、学習レベルにおける機能ベースの機械学習モデルが含まれている。
これは、生のマルチスワローデータからHRM研究のCC診断を自動的に予測する最初の人工知能モデルである。
論文 参考訳(メタデータ) (2021-06-25T20:09:23Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Inheritance-guided Hierarchical Assignment for Clinical Automatic
Diagnosis [50.15205065710629]
臨床診断は、臨床ノートに基づいて患者に診断符号を割り当てることを目的としており、臨床意思決定において重要な役割を担っている。
本稿では,臨床自動診断のための継承誘導階層と共起グラフの伝播を組み合わせた新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-01-27T13:16:51Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。