論文の概要: Why patient data cannot be easily forgotten?
- arxiv url: http://arxiv.org/abs/2206.14541v1
- Date: Wed, 29 Jun 2022 11:36:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-01 00:44:55.382486
- Title: Why patient data cannot be easily forgotten?
- Title(参考訳): なぜ患者データは忘れられないのか?
- Authors: Ruolin Su, Xiao Liu and Sotirios A. Tsaftaris
- Abstract要約: 患者データのモデル性能への影響について検討し, 患者データに対する2つの仮説を定式化する。
そこで我々は,患者を意識した「忘れる」アプローチを提案する。
- 参考スコア(独自算出の注目度): 18.089204090335667
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Rights provisioned within data protection regulations, permit patients to
request that knowledge about their information be eliminated by data holders.
With the advent of AI learned on data, one can imagine that such rights can
extent to requests for forgetting knowledge of patient's data within AI models.
However, forgetting patients' imaging data from AI models, is still an
under-explored problem. In this paper, we study the influence of patient data
on model performance and formulate two hypotheses for a patient's data: either
they are common and similar to other patients or form edge cases, i.e. unique
and rare cases. We show that it is not possible to easily forget patient data.
We propose a targeted forgetting approach to perform patient-wise forgetting.
Extensive experiments on the benchmark Automated Cardiac Diagnosis Challenge
dataset showcase the improved performance of the proposed targeted forgetting
approach as opposed to a state-of-the-art method.
- Abstract(参考訳): データ保護規則に規定された権利は、患者がデータ保有者によって情報に関する知識を排除するよう要求することを許す。
データ上で学んだAIの出現により、そのような権利は、AIモデル内の患者のデータの知識を忘れる要求にまで及ぶことが想像できる。
しかし、AIモデルから患者の画像データを忘れることは、まだ未解決の問題である。
本稿では,患者データがモデル性能に及ぼす影響について検討し,患者データに対する2つの仮説を定式化した。
患者のデータを簡単に忘れることは不可能である。
そこで我々は,患者を意識した「忘れる」アプローチを提案する。
ベンチマーク自動心臓診断チャレンジデータセットに関する広範囲な実験は、最先端の方法ではなく、提案法の性能向上を示している。
関連論文リスト
- Zero-shot and Few-shot Generation Strategies for Artificial Clinical Records [1.338174941551702]
本研究は,Llama 2 LLMが患者情報を正確に反映した合成医療記録を作成する能力を評価するものである。
筆者らは,MIMIC-IVデータセットから得られたデータを用いて,現在史の物語を生成することに重点を置いている。
このチェーン・オブ・シークレットのアプローチにより、ゼロショットモデルが、ルージュのメトリクス評価に基づいて、微調整されたモデルと同等の結果が得られることが示唆された。
論文 参考訳(メタデータ) (2024-03-13T16:17:09Z) - Predict and Interpret Health Risk using EHR through Typical Patients [14.457088774025731]
本稿では,典型的な患者をプロトタイプとして選択するプログレッシブ・プロトタイプ・ネットワーク(PPN)を提案する。
3つの実世界のデータセットの実験は、我々のモデルがすべてのメトリクスを改善することを示した。
論文 参考訳(メタデータ) (2023-12-18T07:00:20Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Learning and DiSentangling Patient Static Information from Time-series
Electronic HEalth Record (STEER) [3.079694232219292]
医療における機械学習の最近の研究は、患者のプライバシとアルゴリズムの公正性に関する懸念を提起している。
そこで我々は,患者の静的情報を予測するための時系列電子健康記録データの有用性を体系的に検討した。
生の時系列データだけでなく、機械学習モデルから学習した表現も、さまざまな静的情報を予測するためにトレーニングできることがわかった。
論文 参考訳(メタデータ) (2023-09-20T14:54:48Z) - Leveraging Generative AI Models for Synthetic Data Generation in
Healthcare: Balancing Research and Privacy [0.0]
GANやVAEといった生成AIモデルは、貴重なデータアクセスと患者のプライバシ保護のバランスをとるための、有望なソリューションを提供する。
本稿では,現実的な匿名化された患者データを作成するための生成AIモデルについて検討する。
論文 参考訳(メタデータ) (2023-05-09T08:12:44Z) - Membership Inference Attacks against Synthetic Data through Overfitting
Detection [84.02632160692995]
我々は、攻撃者が基礎となるデータ分布についてある程度の知識を持っていると仮定する現実的なMIA設定について論じる。
生成モデルの局所的なオーバーフィッティングをターゲットとして,メンバシップを推論することを目的とした密度ベースMIAモデルであるDOMIASを提案する。
論文 参考訳(メタデータ) (2023-02-24T11:27:39Z) - Textual Data Augmentation for Patient Outcomes Prediction [67.72545656557858]
本稿では,患者の電子カルテに人工的な臨床ノートを作成するための新しいデータ拡張手法を提案する。
生成言語モデルGPT-2を微調整し、ラベル付きテキストを元のトレーニングデータで合成する。
今回,最も多い患者,すなわち30日間の寛解率について検討した。
論文 参考訳(メタデータ) (2022-11-13T01:07:23Z) - Advances in Prediction of Readmission Rates Using Long Term Short Term
Memory Networks on Healthcare Insurance Data [1.454498931674109]
30日間の入院は長期にわたる医療問題であり、患者の死亡率や死亡率に影響を与え、年間数十億ドルの費用がかかる。
我々は、簡単に利用可能な保険データを利用できる双方向長短メモリ(LSTM)ネットワークを開発した。
以上の結果から, 機械学習モデルにより, 全患者に対して妥当な精度で入院リスクを予測できることが示唆された。
論文 参考訳(メタデータ) (2022-06-30T19:07:10Z) - Practical Challenges in Differentially-Private Federated Survival
Analysis of Medical Data [57.19441629270029]
本稿では,ニューラルネットワークの本質的特性を活用し,生存分析モデルの訓練過程を関連づける。
小さな医療データセットと少数のデータセンターの現実的な設定では、このノイズはモデルを収束させるのが難しくなります。
DPFed-post は,私的フェデレート学習方式に後処理の段階を追加する。
論文 参考訳(メタデータ) (2022-02-08T10:03:24Z) - FLOP: Federated Learning on Medical Datasets using Partial Networks [84.54663831520853]
新型コロナウイルスの感染拡大で医療資源が不足している。
新型コロナウイルスの診断を緩和するために、さまざまなデータ駆動型ディープラーニングモデルが開発されている。
患者のプライバシー上の懸念から、データそのものはまだ乏しい。
我々は、textbfPartial Networks (FLOP) を用いた、シンプルで効果的な textbfFederated textbfL textbfon Medical データセットを提案する。
論文 参考訳(メタデータ) (2021-02-10T01:56:58Z) - DeepEnroll: Patient-Trial Matching with Deep Embedding and Entailment
Prediction [67.91606509226132]
臨床試験は医薬品開発に不可欠であるが、高価で不正確で不十分な患者募集に苦しむことが多い。
DeepEnrollは、入力基準(タブラリデータ)を一致する推論のための共有潜在空間に共同でエンコードする、クロスモーダル推論学習モデルである。
論文 参考訳(メタデータ) (2020-01-22T17:51:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。