論文の概要: Paradox of De-identification: A Critique of HIPAA Safe Harbour in the Age of LLMs
- arxiv url: http://arxiv.org/abs/2602.08997v1
- Date: Mon, 09 Feb 2026 18:43:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:25.427834
- Title: Paradox of De-identification: A Critique of HIPAA Safe Harbour in the Age of LLMs
- Title(参考訳): 脱識別のパラドックス:LLM時代におけるHIPAAの安全港の批判
- Authors: Lavender Y. Jiang, Xujin Chris Liu, Kyunghyun Cho, Eric K. Oermann,
- Abstract要約: HIPAA Safe Harborでは、患者のプライバシを保護するために臨床メモが非識別化されている。
本論文は, 自己鑑定が本質的に不完全である場合に, 患者の信頼を維持するために, コミュニティとしてどのように振る舞うかという疑問を提起する。
- 参考スコア(独自算出の注目度): 36.69937175022062
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Privacy is a human right that sustains patient-provider trust. Clinical notes capture a patient's private vulnerability and individuality, which are used for care coordination and research. Under HIPAA Safe Harbor, these notes are de-identified to protect patient privacy. However, Safe Harbor was designed for an era of categorical tabular data, focusing on the removal of explicit identifiers while ignoring the latent information found in correlations between identity and quasi-identifiers, which can be captured by modern LLMs. We first formalize these correlations using a causal graph, then validate it empirically through individual re-identification of patients from scrubbed notes. The paradox of de-identification is further shown through a diagnosis ablation: even when all other information is removed, the model can predict the patient's neighborhood based on diagnosis alone. This position paper raises the question of how we can act as a community to uphold patient-provider trust when de-identification is inherently imperfect. We aim to raise awareness and discuss actionable recommendations.
- Abstract(参考訳): プライバシーは患者の信頼を維持する人間の権利である。
臨床ノートは患者の個人的脆弱性と個人性を捉え、ケアコーディネートと研究に使用される。
HIPAA Safe Harborでは、これらのメモは患者のプライバシーを保護するために非識別化されている。
しかし、Safe Harborは分類表データの時代に向けて設計され、明示的な識別子の削除に焦点を合わせながら、現代のLCMによって捉えられる識別と準識別の相関関係にある潜伏情報を無視している。
まず、因果グラフを用いてこれらの相関関係を定式化し、その後、スクラブノートから患者を個別に同定し、実証的に検証する。
解離のパラドックスは、診断アブレーションによってさらに示され、他の全ての情報が削除されたとしても、診断のみに基づいて患者の近辺を予測することができる。
本論文は, 自己鑑定が本質的に不完全である場合に, 患者の信頼を維持するために, コミュニティとしてどのように振る舞うかという疑問を提起する。
我々は意識を高め、行動可能なレコメンデーションについて議論することを目指している。
関連論文リスト
- An Investigation of Memorization Risk in Healthcare Foundation Models [21.94560578418064]
構造化されたEHRデータに基づいてトレーニングされた基礎モデルのプライバシー関連リスクを評価するためのブラックボックス評価テストスイートを導入する。
本フレームワークは, 組込みと生成の両レベルでの記憶の探索方法と, モデル一般化と有害記憶の区別を目的とした。
論文 参考訳(メタデータ) (2025-10-14T19:55:07Z) - VoxGuard: Evaluating User and Attribute Privacy in Speech via Membership Inference Attacks [51.68795949691009]
差分プライバシとメンバシップ推論に基づくフレームワークであるVoxGuardを紹介した。
属性については, 匿名化後も, 性別やアクセントをほぼ完全精度で再現できることが示唆された。
以上の結果から,EERはリークを著しく過小評価し,低FPR評価の必要性を浮き彫りにしている。
論文 参考訳(メタデータ) (2025-09-22T20:57:48Z) - A False Sense of Privacy: Evaluating Textual Data Sanitization Beyond Surface-level Privacy Leakage [77.83757117924995]
我々は、データリリース時の個人のプライバシーリスクを定量化するために、再識別攻撃を評価する新しいフレームワークを提案する。
本手法は, 衛生データから年齢や物質使用履歴などのセンシティブな属性を推測するために, 一見無害な補助情報を利用できることを示す。
論文 参考訳(メタデータ) (2025-04-28T01:16:27Z) - Differentially Private Distributed Inference [2.4401219403555814]
臨床試験に協力する医療センターは、知識共有と機密データ保護のバランスを取る必要がある。
情報漏洩を制御するために差分プライバシー(DP)を用いてこの問題に対処する。
エージェントはログリニアルールを通じて信条統計を更新し、DPノイズは信頼性の高い識別性と厳格な性能保証を提供する。
論文 参考訳(メタデータ) (2024-02-13T01:38:01Z) - DeID-GPT: Zero-shot Medical Text De-Identification by GPT-4 [80.36535668574804]
我々は新しいGPT4対応脱識別フレームワーク(DeID-GPT)を開発した。
開発したDeID-GPTは,非構造化医用テキストからの個人情報のマスキングにおいて,高い精度と信頼性を示した。
本研究は,ChatGPTおよびGPT-4を医療用テキストデータ処理および非識別に利用した最初期の1つである。
論文 参考訳(メタデータ) (2023-03-20T11:34:37Z) - Classifying Cyber-Risky Clinical Notes by Employing Natural Language
Processing [9.77063694539068]
近年、アメリカ合衆国内の一部の州では、患者が臨床ノートに自由にアクセスできるように求めている。
本研究は,臨床ノートにおけるセキュリティ・プライバシリスクの特定方法について検討する。
論文 参考訳(メタデータ) (2022-03-24T00:36:59Z) - Performance of Automatic De-identification Across Different Note Types [0.8399688944263842]
患者のプライバシーと機密性に関する懸念は、研究のための臨床ノートの使用を制限する。
本稿では,ワシントン大学のさまざまなノートに,NeuroNER1と呼ばれる最先端のde-idシステムの性能を示す。
論文 参考訳(メタデータ) (2021-02-17T00:55:40Z) - Towards Causality-Aware Inferring: A Sequential Discriminative Approach
for Medical Diagnosis [142.90770786804507]
医学診断アシスタント(MDA)は、疾患を識別するための症状を逐次調査する対話型診断エージェントを構築することを目的としている。
この研究は、因果図を利用して、MDAにおけるこれらの重要な問題に対処しようとする。
本稿では,他の記録から知識を引き出すことにより,非記録的調査に効果的に答える確率に基づく患者シミュレータを提案する。
論文 参考訳(メタデータ) (2020-03-14T02:05:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。