論文の概要: Machine Learning with Electronic Health Records is vulnerable to
Backdoor Trigger Attacks
- arxiv url: http://arxiv.org/abs/2106.07925v1
- Date: Tue, 15 Jun 2021 07:27:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-16 15:31:18.907827
- Title: Machine Learning with Electronic Health Records is vulnerable to
Backdoor Trigger Attacks
- Title(参考訳): 電子健康記録による機械学習は、バックドアトリガー攻撃に弱い
- Authors: Byunggill Joe, Akshay Mehra, Insik Shin, and Jihun Hamm
- Abstract要約: 本研究では,攻撃者がEHRを用いて機械学習予測を容易かつ選択的に操作できることを実証する。
我々は,MIMIC-IIIデータベースによるロジスティック回帰,多層パーセプトロン,長期記憶モデルに対する死亡予測タスクの平均攻撃成功率を97%とする。
- 参考スコア(独自算出の注目度): 11.729565632882721
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Electronic Health Records (EHRs) provide a wealth of information for machine
learning algorithms to predict the patient outcome from the data including
diagnostic information, vital signals, lab tests, drug administration, and
demographic information. Machine learning models can be built, for example, to
evaluate patients based on their predicted mortality or morbidity and to
predict required resources for efficient resource management in hospitals. In
this paper, we demonstrate that an attacker can manipulate the machine learning
predictions with EHRs easily and selectively at test time by backdoor attacks
with the poisoned training data. Furthermore, the poison we create has
statistically similar features to the original data making it hard to detect,
and can also attack multiple machine learning models without any knowledge of
the models. With less than 5% of the raw EHR data poisoned, we achieve average
attack success rates of 97% on mortality prediction tasks with MIMIC-III
database against Logistic Regression, Multilayer Perceptron, and Long
Short-term Memory models simultaneously.
- Abstract(参考訳): EHR(Electronic Health Records)は、診断情報、バイタルシグナル、ラボテスト、薬物管理、人口統計情報を含むデータから患者の結果を予測するための機械学習アルゴリズムのための豊富な情報を提供する。
例えば、予測死亡率や死亡率に基づいて患者を評価し、病院の効率的な資源管理に必要なリソースを予測する機械学習モデルを構築することができる。
本稿では,攻撃者がEHRによる機械学習予測を容易にかつ選択的に操作できることを,有毒なトレーニングデータを用いたバックドアアタックによって実証する。
さらに、私たちが生成する毒は、検出が難しい元のデータと統計的に類似した特徴を持ち、モデルに関する知識のない複数の機械学習モデルを攻撃することもできる。
生のERHデータの5%未満で,MIMIC-IIIデータベースによるロジスティック回帰,多層パーセプトロン,長短期記憶モデルによる死亡予測タスクにおいて,平均97%の攻撃成功率を達成した。
関連論文リスト
- Extracting Training Data from Unconditional Diffusion Models [76.85077961718875]
拡散確率モデル(DPM)は、生成人工知能(AI)の主流モデルとして採用されている。
本研究の目的は,1) 理論解析のための記憶量,2) 情報ラベルとランダムラベルを用いた条件記憶量,3) 記憶量測定のための2つのより良い評価指標を用いて,DPMにおける記憶量の理論的理解を確立することである。
提案手法は,理論解析に基づいて,SIDE (textbfSurrogate condItional Data extract) と呼ばれる新しいデータ抽出手法を提案する。
論文 参考訳(メタデータ) (2024-06-18T16:20:12Z) - Automatic prediction of mortality in patients with mental illness using
electronic health records [0.5957022371135096]
本報告では,精神疾患患者の死亡率を予測するための永続的課題について述べる。
MIMIC-IIIデータセットから精神疾患の診断データを抽出した。
4つの機械学習アルゴリズムを使用し、ランダムフォレストとサポートベクターマシンのモデルが他のモデルよりも優れていたことを示す結果が得られた。
論文 参考訳(メタデータ) (2023-10-18T17:21:01Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Unsupervised Pre-Training on Patient Population Graphs for Patient-Level
Predictions [48.02011627390706]
プレトレーニングは、コンピュータビジョン(CV)、自然言語処理(NLP)、医療画像など、機械学習のさまざまな分野で成功している。
本稿では,患者結果の予測のために,教師なし事前学習を異種マルチモーダルEHRデータに適用する。
提案手法は,人口レベルでのデータモデリングに有効であることがわかった。
論文 参考訳(メタデータ) (2022-03-23T17:59:45Z) - Survival Prediction of Heart Failure Patients using Stacked Ensemble
Machine Learning Algorithm [0.0]
心不全は、我々の時代における主要な健康上の危険問題の1つであり、世界中の死因の1つです。
データマイニングは、医療機関が生成した大量の生データを意味のある情報に変換するプロセスである。
本研究は, 心不全後の生存可能性を予測するためには, 患者から採取した特定の属性のみが必須であることが示唆された。
論文 参考訳(メタデータ) (2021-08-30T16:42:27Z) - Self-Supervised Graph Learning with Hyperbolic Embedding for Temporal
Health Event Prediction [13.24834156675212]
本稿では,情報フローを組み込んだハイパーボリック埋め込み手法を提案する。
我々は、これらの事前学習された表現をグラフニューラルネットワークに組み込んで、疾患の合併症を検出する。
本稿では,EHRデータを完全に活用する自己教師付き学習フレームワークに,階層型で強化された履歴予測代行タスクを提案する。
論文 参考訳(メタデータ) (2021-06-09T00:42:44Z) - Attack-agnostic Adversarial Detection on Medical Data Using Explainable
Machine Learning [0.0]
本論文では,2つのデータセット上での対比サンプルの正確な検出のためのモデル非依存説明性に基づく手法を提案する。
MIMIC-IIIとHenan-Renmin EHRのデータセットでは,縦軸攻撃に対する検出精度は77%であった。
MIMIC-CXRデータセットでは88%の精度を実現し、すべての設定において、両方のデータセットにおける敵検出技術の現状を10%以上改善した。
論文 参考訳(メタデータ) (2021-05-05T10:01:53Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z) - Self-Training with Improved Regularization for Sample-Efficient Chest
X-Ray Classification [80.00316465793702]
挑戦的なシナリオで堅牢なモデリングを可能にするディープラーニングフレームワークを提案する。
その結果,85%のラベル付きデータを用いて,大規模データ設定で学習した分類器の性能に適合する予測モデルを構築することができた。
論文 参考訳(メタデータ) (2020-05-03T02:36:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。