論文の概要: Privacy-Preserving EHR Data Transformation via Geometric Operators: A Human-AI Co-Design Technical Report
- arxiv url: http://arxiv.org/abs/2603.22954v1
- Date: Tue, 24 Mar 2026 08:49:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-25 19:53:37.388048
- Title: Privacy-Preserving EHR Data Transformation via Geometric Operators: A Human-AI Co-Design Technical Report
- Title(参考訳): 幾何学演算子によるプライバシー保護型EHRデータ変換:人間-AI共同設計技術レポート
- Authors: Maolin Wang, Beining Bao, Gan Yuan, Hongyu Chen, Bingkun Zhao, Baoshuo Kan, Jiming Xu, Qi Shi, Yinggong Zhao, Yao Wang, Wei Ying Ma, Jun Yan,
- Abstract要約: 構造化された臨床記録のプライバシー保護のためのリアルタイムデータ変換フレームワークを提案する。
我々のアプローチは、医学的意味論と主要な統計的性質を保存する数値的な見解を変容させるものである。
- 参考スコア(独自算出の注目度): 16.63231295240052
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Electronic health records (EHRs) and other real-world clinical data are essential for clinical research, medical artificial intelligence, and life science, but their sharing is severely limited by privacy, governance, and interoperability constraints. These barriers create persistent data silos that hinder multi-center studies, large-scale model development, and broader biomedical discovery. Existing privacy-preserving approaches, including multi-party computation and related cryptographic techniques, provide strong protection but often introduce substantial computational overhead, reducing the efficiency of large-scale machine learning and foundation-model training. In addition, many such methods make data usable for restricted computation while leaving them effectively invisible to clinicians and researchers, limiting their value in workflows that still require direct inspection, exploratory analysis, and human interpretation. We propose a real-world-data transformation framework for privacy-preserving sharing of structured clinical records. Instead of converting data into opaque representations, our approach constructs transformed numeric views that preserve medical semantics and major statistical properties while, under a clearly specified threat model, provably breaking direct linkage between those views and protected patient-level attributes. Through collaboration between computer scientists and the AI agent \textbf{SciencePal}, acting as a constrained tool inventor under human guidance, we design three transformation operators that are non-reversible within this threat model, together with an additional mixing strategy for high-risk scenarios, supported by theoretical analysis and empirical evaluation under reconstruction, record linkage, membership inference, and attribute inference attacks.
- Abstract(参考訳): 電子健康記録(EHR)やその他の実世界の臨床データは臨床研究、医療人工知能、生命科学に不可欠であるが、それらの共有はプライバシー、ガバナンス、相互運用性の制約によって著しく制限されている。
これらの障壁は、多施設の研究を妨げる永続的なデータサイロ、大規模なモデル開発、より広範な生物医学的な発見を生み出す。
複数パーティの計算や関連する暗号技術を含む既存のプライバシ保護アプローチは、強力な保護を提供するが、大きな計算オーバーヘッドを伴い、大規模な機械学習と基礎モデルトレーニングの効率を低下させる。
さらに、そのような手法の多くは、データを制限された計算に使用可能にする一方で、臨床医や研究者には効果的に見えず、直接検査、探索分析、人間の解釈を必要とするワークフローにおけるそれらの価値を制限している。
構造化された臨床記録のプライバシー保護のためのリアルタイムデータ変換フレームワークを提案する。
提案手法では,データを不透明な表現に変換する代わりに,医学的意味論と主要な統計特性を保存する数値的なビューを,明確に指定された脅威モデルの下で,それらのビューと保護された患者レベルの属性との直接リンクを確実に破る。
コンピュータ科学者とAIエージェント \textbf{SciencePal} のコラボレーションを通じて、人間の指導の下で制約されたツール発明者として機能し、この脅威モデル内では不可逆な3つの変換演算子を設計し、また、再構成、記録リンク、メンバーシップ推論、属性推論攻撃による理論的分析と経験的評価によって、高リスクシナリオに対する追加の混合戦略を設計する。
関連論文リスト
- Improving Cardiac Risk Prediction Using Data Generation Techniques [37.94487163156369]
本研究は,実世界の観測と整合したリアルな臨床記録の合成のためのアーキテクチャを提案する。
主な目的は、心的リスク予測モデルの性能を高めるため、利用可能なデータセットのサイズと多様性を高めることである。
論文 参考訳(メタデータ) (2025-12-19T10:17:00Z) - Integrating Genomics into Multimodal EHR Foundation Models [56.31910745104141]
本稿では,ポリジェニックリスクスコア(PRS)を基本データモダリティとして統合した,革新的なEHR基盤モデルを提案する。
このフレームワークは、臨床データと遺伝子前置詞の複雑な関係を学習することを目的としている。
このアプローチは、病気の予測、積極的な健康管理、リスク階層化、パーソナライズされた治療戦略に対する新たな洞察を解放するために重要である。
論文 参考訳(メタデータ) (2025-10-24T15:56:40Z) - Adaptable Cardiovascular Disease Risk Prediction from Heterogeneous Data using Large Language Models [70.64969663547703]
AdaCVDは、英国バイオバンクから50万人以上の参加者を対象に、大規模な言語モデルに基づいて構築された適応可能なCVDリスク予測フレームワークである。
包括的かつ可変的な患者情報を柔軟に取り込み、構造化データと非構造化テキストの両方をシームレスに統合し、最小限の追加データを使用して新規患者の集団に迅速に適応する。
論文 参考訳(メタデータ) (2025-05-30T14:42:02Z) - Towards Privacy-aware Mental Health AI Models: Advances, Challenges, and Opportunities [58.61680631581921]
メンタルヘルス障害は、深い個人的・社会的負担を生じさせるが、従来の診断はリソース集約的でアクセシビリティが制限される。
本稿では、これらの課題を考察し、匿名化、合成データ、プライバシー保護トレーニングを含む解決策を提案する。
臨床的な意思決定をサポートし、メンタルヘルスの結果を改善する、信頼できるプライバシを意識したAIツールを進化させることを目標としている。
論文 参考訳(メタデータ) (2025-02-01T15:10:02Z) - Masked Clinical Modelling: A Framework for Synthetic and Augmented Survival Data Generation [1.7769033811751995]
本稿では,マスク付き言語モデリングに触発されたMCM(Masked Clinical Modelling)について紹介する。
MCMはデータ合成と条件付きデータ拡張の両方のために設計されている。
我々は,このプロトタイプをCox Proportional Hazardsモデルを用いてWHAS500データセット上で評価する。
論文 参考訳(メタデータ) (2024-10-22T08:38:46Z) - Building Flexible, Scalable, and Machine Learning-ready Multimodal
Oncology Datasets [17.774341783844026]
本研究は、オンコロジーデータシステム(MINDS)のマルチモーダル統合を提案する。
MINDSはフレキシブルでスケーラブルで費用対効果の高いメタデータフレームワークで、公開ソースから異なるデータを効率的に分離する。
MINDSは、マルチモーダルデータを調和させることで、より分析能力の高い研究者を力づけることを目指している。
論文 参考訳(メタデータ) (2023-09-30T15:44:39Z) - Safe AI for health and beyond -- Monitoring to transform a health
service [51.8524501805308]
機械学習アルゴリズムの出力を監視するために必要なインフラストラクチャを評価する。
モデルのモニタリングと更新の例を示す2つのシナリオを提示します。
論文 参考訳(メタデータ) (2023-03-02T17:27:45Z) - Privacy-preserving medical image analysis [53.4844489668116]
医用画像におけるプライバシ保護機械学習(PPML)のためのソフトウェアフレームワークであるPriMIAを提案する。
集合型学習モデルの分類性能は,未発見データセットの人間専門家と比較して有意に良好である。
グラデーションベースのモデル反転攻撃に対するフレームワークのセキュリティを実証的に評価する。
論文 参考訳(メタデータ) (2020-12-10T13:56:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。