Fugu-MT 論文翻訳(概要): Learning Patient Static Information from Time-series EHR and an Approach for Safeguarding Privacy and Fairness

論文の概要: Learning Patient Static Information from Time-series EHR and an Approach for Safeguarding Privacy and Fairness

arxiv url: http://arxiv.org/abs/2309.11373v1
Date: Wed, 20 Sep 2023 14:54:48 GMT
ステータス: 翻訳完了
システム内更新日: 2023-09-21 12:36:56.751631
Title: Learning Patient Static Information from Time-series EHR and an Approach for Safeguarding Privacy and Fairness
Title（参考訳）: 時系列EHRから患者の静的情報を学ぶと、プライバシと公正を守るためのアプローチ
Authors: Wei Liao, Joel Voldman
Abstract要約: 医療における機械学習の最近の研究は、患者のプライバシとアルゴリズムの公正性に関する懸念を提起している。そこで我々は,患者の静的情報を予測するための時系列電子健康記録データの有用性を体系的に検討した。生の時系列データだけでなく、機械学習モデルから学習した表現も、さまざまな静的情報を予測するためにトレーニングできることがわかった。
参考スコア（独自算出の注目度）: 3.079694232219292
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Recent work in machine learning for healthcare has raised concerns about patient privacy and algorithmic fairness. For example, previous work has shown that patient self-reported race can be predicted from medical data that does not explicitly contain racial information. However, the extent of data identification is unknown, and we lack ways to develop models whose outcomes are minimally affected by such information. Here we systematically investigated the ability of time-series electronic health record data to predict patient static information. We found that not only the raw time-series data, but also learned representations from machine learning models, can be trained to predict a variety of static information with area under the receiver operating characteristic curve as high as 0.851 for biological sex, 0.869 for binarized age and 0.810 for self-reported race. Such high predictive performance can be extended to a wide range of comorbidity factors and exists even when the model was trained for different tasks, using different cohorts, using different model architectures and databases. Given the privacy and fairness concerns these findings pose, we develop a variational autoencoder-based approach that learns a structured latent space to disentangle patient-sensitive attributes from time-series data. Our work thoroughly investigates the ability of machine learning models to encode patient static information from time-series electronic health records and introduces a general approach to protect patient-sensitive attribute information for downstream tasks.
Abstract（参考訳）: 医療のための機械学習の最近の研究は、患者のプライバシーとアルゴリズムの公正性に関する懸念を提起している。例えば、以前の研究では、人種情報を明示的に含まない医療データから患者自己申告人種を予測できることが示されている。しかし、データ識別の程度は不明であり、そのような情報に最小限の影響を受けているモデルを開発する方法がない。そこで我々は,患者の静的情報を予測するための時系列電子健康記録データの有用性を体系的に検討した。その結果, 生の時系列データだけでなく, 機械学習モデルから学習した表現から, 生体性に0.851, 二項化に0.869, 自己報告に0.810の領域で, 様々な静的情報を予測できることがわかった。このような高い予測性能は、幅広い複合性要因に拡張することができ、モデルが異なるタスクのためにトレーニングされた場合でも、異なるコホートを使用して、異なるモデルアーキテクチャとデータベースを使用して存在します。これらの知見が生み出すプライバシーと公平性を考えると、私たちは時系列データから患者に敏感な属性を分離する構造化潜在空間を学ぶ変分オートエンコーダベースのアプローチを開発します。本研究は,患者の静的情報を時系列電子健康記録から符号化する機械学習モデルの能力を徹底的に検討し,下流業務における患者に敏感な属性情報を保護するための一般的なアプローチを提案する。

関連論文リスト

Personalized Counterfactual Framework: Generating Potential Outcomes from Wearable Data [1.7396556690675233]
本稿では,ウェアラブルデータからパーソナライズされた対物モデルを学ぶためのフレームワークを提案する。我々はまず,マルチモーダル類似性分析を用いて,類似患者のデータを用いて個々のデータセットを拡大する。次に、時間的PC(Peter-Clark)アルゴリズムを用いて予測関係を探索する。グラディエントブースティングマシンは、個々の特殊効果を定量化するためにこれらの関係に基づいて訓練されている。
論文参考訳（メタデータ） (2025-08-20T05:04:17Z)
Disparate Model Performance and Stability in Machine Learning Clinical Support for Diabetes and Heart Diseases [2.9247093478805324]
調査により、慢性疾患データセットとその派生した機械学習モデルにおいて、性別と年齢に関連する不等式が広く明らかになった。 25,000人以上の慢性疾患患者のデータを分析したところ、男女差は軽度であり、男性には予測精度が好ましく、若年者には有意な年齢差がみられた。特に高齢患者では、7つのデータセットで矛盾した予測精度を示し、データの複雑さとモデルの性能が低下した。
論文参考訳（メタデータ） (2024-12-27T07:31:14Z)
IGNITE: Individualized GeNeration of Imputations in Time-series Electronic health records [7.451873794596469]
本研究では、患者動態を学習し、個人の人口動態の特徴や治療に合わせたパーソナライズされた値を生成する新しいディープラーニングモデルを提案する。提案モデルであるIGNITEは,2段階の注意を付加した条件付き2変分オートエンコーダを用いて,個人に対して欠落した値を生成する。 IGNITEは,データ再構成の欠如やタスク予測において,最先端の手法よりも優れていることを示す。
論文参考訳（メタデータ） (2024-01-09T07:57:21Z)
MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文参考訳（メタデータ） (2023-10-04T01:36:30Z)
Integrated Convolutional and Recurrent Neural Networks for Health Risk Prediction using Patient Journey Data with Many Missing Values [9.418011774179794]
本稿では,統合畳み込みニューラルネットワークとリカレントニューラルネットワークを用いたEMH患者旅行データモデリングのためのエンドツーエンドアプローチを提案する。本モデルでは,各患者旅行における長期的・短期的時間的パターンを抽出し,インパルスデータ生成を伴わずに,高レベルのEHRデータの欠落を効果的に処理することができる。
論文参考訳（メタデータ） (2022-11-11T07:36:18Z)
Bridging the Gap Between Patient-specific and Patient-independent Seizure Prediction via Knowledge Distillation [7.2666838978096875]
既存のアプローチは通常、てんかんの信号の高度にパーソナライズされた特性のために、患者固有の方法でモデルを訓練する。患者固有のモデルは、蒸留された知識と追加のパーソナライズされたデータによって得られる。提案手法を用いて,CHB-MIT sEEGデータベース上で5つの最先端の発作予測法を訓練する。
論文参考訳（メタデータ） (2022-02-25T10:30:29Z)
Practical Challenges in Differentially-Private Federated Survival Analysis of Medical Data [57.19441629270029]
本稿では,ニューラルネットワークの本質的特性を活用し,生存分析モデルの訓練過程を関連づける。小さな医療データセットと少数のデータセンターの現実的な設定では、このノイズはモデルを収束させるのが難しくなります。 DPFed-post は,私的フェデレート学習方式に後処理の段階を追加する。
論文参考訳（メタデータ） (2022-02-08T10:03:24Z)
Algorithmic encoding of protected characteristics and its implications on disparities across subgroups [17.415882865534638]
機械学習モデルは、患者の人種的アイデンティティと臨床結果の間に望ましくない相関関係を拾うことができる。これらのバイアスがどのようにコード化され、どのように異なるパフォーマンスを減らしたり、取り除いたりするかについては、ほとんど分かっていない。
論文参考訳（メタデータ） (2021-10-27T20:30:57Z)
Self-Supervised Graph Learning with Hyperbolic Embedding for Temporal Health Event Prediction [13.24834156675212]
本稿では,情報フローを組み込んだハイパーボリック埋め込み手法を提案する。我々は、これらの事前学習された表現をグラフニューラルネットワークに組み込んで、疾患の合併症を検出する。本稿では,EHRデータを完全に活用する自己教師付き学習フレームワークに,階層型で強化された履歴予測代行タスクを提案する。
論文参考訳（メタデータ） (2021-06-09T00:42:44Z)
UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。 UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。 UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文参考訳（メタデータ） (2020-10-22T02:28:11Z)
Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文参考訳（メタデータ） (2020-09-02T02:50:30Z)
Temporal Phenotyping using Deep Predictive Clustering of Disease Progression [97.88605060346455]
我々は、時系列データをクラスタリングするためのディープラーニングアプローチを開発し、各クラスタは、同様の将来的な結果を共有する患者から構成される。 2つの実世界のデータセットに対する実験により、我々のモデルは最先端のベンチマークよりも優れたクラスタリング性能が得られることが示された。
論文参考訳（メタデータ） (2020-06-15T20:48:43Z)
Self-Training with Improved Regularization for Sample-Efficient Chest X-Ray Classification [80.00316465793702]
挑戦的なシナリオで堅牢なモデリングを可能にするディープラーニングフレームワークを提案する。その結果,85%のラベル付きデータを用いて,大規模データ設定で学習した分類器の性能に適合する予測モデルを構築することができた。
論文参考訳（メタデータ） (2020-05-03T02:36:00Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。