論文の概要: A Utility-preserving De-identification Pipeline for Cross-hospital Radiology Data Sharing
- arxiv url: http://arxiv.org/abs/2604.07128v1
- Date: Wed, 08 Apr 2026 14:21:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.579843
- Title: A Utility-preserving De-identification Pipeline for Cross-hospital Radiology Data Sharing
- Title(参考訳): クロスホスピタルラジオロジーデータ共有のための実用性保存型識別パイプライン
- Authors: Chenhao Liu, Zelin Wen, Yan Tong, Junjie Zhu, Xinyu Tian, Yuchi Liu, Ashu Gupta, Syed M. S. Islam, Tom Gedeon, Yue Yao,
- Abstract要約: 本稿では,病院間放射線学データ共有のためのユーティリティ保存型復号化パイプラインを提案する。
放射線画像には、プライバシフィルタと病理保存保存された元の画像の合成を行う生成的フィルタリング機構を用いる。
胸部X線検査実験により,診断に関連のある病態を保存しながら,プライバシに敏感な情報を効果的に除去できることが示唆された。
- 参考スコア(独自算出の注目度): 26.834444576458623
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large-scale radiology data are critical for developing robust medical AI systems. However, sharing such data across hospitals remains heavily constrained by privacy concerns. Existing de-identification research in radiology mainly focus on removing identifiable information to enable compliant data release. Yet whether de-identified radiology data can still preserve sufficient utility for large-scale vision-language model training and cross-hospital transfer remains underexplored. In this paper, we introduce a utility-preserving de-identification pipeline (UPDP) for cross-hospital radiology data sharing. Specifically, we compile a blacklist of privacy-sensitive terms and a whitelist of pathology-related terms. For radiology images, we use a generative filtering mechanism that synthesis a privacy-filtered and pathology-reserved counterparts of the original images. These synthetic image counterparts, together with ID-filtered reports, can then be securely shared across hospitals for downstream model development and evaluation. Experiments on public chest X-ray benchmarks demonstrate that our method effectively removes privacy-sensitive information while preserving diagnostically relevant pathology cues. Models trained on the de-identified data maintain competitive diagnostic accuracy compared with those trained on the original data, while exhibiting a marked decline in identity-related accuracy, confirming effective privacy protection. In the cross-hospital setting, we further show that de-identified data can be combined with local data to yield better performance.
- Abstract(参考訳): 大規模放射線学データは、堅牢な医療AIシステムの開発に不可欠である。
しかし、これらのデータを病院間で共有することは、プライバシーの懸念に強く制約されている。
放射線学における既存の非識別研究は、主に、適合データのリリースを可能にする識別可能な情報を削除することに焦点を当てている。
しかし、未同定の放射線学データが大規模視覚言語モデルの訓練に十分な有用性を保てるかどうかは未定のままである。
本稿では,病院間無線データ共有のためのユーティリティ保存型識別パイプライン(UPDP)を提案する。
具体的には、プライバシに敏感な用語のブラックリストと、病理に関する用語のホワイトリストをコンパイルする。
放射線画像には、プライバシフィルタと病理保存を併用した生成的フィルタリング機構を用いる。
これらの合成画像は、IDフィルタリングされたレポートとともに、下流モデルの開発と評価のために病院間で安全に共有することができる。
胸部X線検査実験により,診断に関連のある病態を保存しながら,プライバシに敏感な情報を効果的に除去できることが判明した。
未確認データでトレーニングされたモデルは、元のデータでトレーニングされたモデルと比較して、競合する診断精度を維持しながら、アイデンティティ関連の精度が著しく低下し、効果的なプライバシー保護が確認される。
クロスホスピタル設定では、非識別データとローカルデータを組み合わせることで、より良い性能が得られることを示す。
関連論文リスト
- Sensitivity, Specificity, and Consistency: A Tripartite Evaluation of Privacy Filters for Synthetic Data Generation [57.13635002340272]
個人識別可能な情報を含むサンプルを除去するためのポストホックプライバシーフィルタリング技術が提案されている。
本研究は胸部X線合成に適用した濾過パイプラインの厳密な評価を行う。
これらの手法がセンシティブなアプリケーションに確実にデプロイされるためには,フィルタ設計の大幅な進歩が必要であると結論付けている。
論文 参考訳(メタデータ) (2025-10-02T08:32:20Z) - FedDP: Privacy-preserving method based on federated learning for histopathology image segmentation [2.864354559973703]
本稿では,医用画像データの分散特性とプライバシ感受性について,フェデレート学習フレームワークを用いて検討する。
提案手法であるFedDPは,がん画像データのプライバシーを効果的に保護しつつ,モデルの精度に最小限の影響を与える。
論文 参考訳(メタデータ) (2024-11-07T08:02:58Z) - Revisiting Computer-Aided Tuberculosis Diagnosis [56.80999479735375]
結核(TB)は世界的な健康上の脅威であり、毎年何百万人もの死者を出している。
深層学習を用いたコンピュータ支援結核診断 (CTD) は有望であるが, 限られたトレーニングデータによって進行が妨げられている。
結核X線(TBX11K)データセットは11,200個の胸部X線(CXR)画像とそれに対応するTB領域のバウンディングボックスアノテーションを含む。
このデータセットは、高品質なCTDのための洗練された検出器のトレーニングを可能にする。
論文 参考訳(メタデータ) (2023-07-06T08:27:48Z) - Private, fair and accurate: Training large-scale, privacy-preserving AI models in medical imaging [47.99192239793597]
我々は,AIモデルのプライバシ保護トレーニングが,非プライベートトレーニングと比較して精度と公平性に与える影響を評価した。
我々の研究は、実際の臨床データセットの困難な現実的な状況下では、診断深層学習モデルのプライバシー保護トレーニングは、優れた診断精度と公正さで可能であることを示しています。
論文 参考訳(メタデータ) (2023-02-03T09:49:13Z) - Generation of Anonymous Chest Radiographs Using Latent Diffusion Models
for Training Thoracic Abnormality Classification Systems [7.909848251752742]
胸部X線写真における生体認証は、研究目的のためにそのようなデータの公開を妨げている。
この研究は、高品質なクラス条件画像の匿名胸部X線データセットを合成するために潜時拡散モデルを用いている。
論文 参考訳(メタデータ) (2022-11-02T17:43:02Z) - Deep Learning-based Anonymization of Chest Radiographs: A
Utility-preserving Measure for Patient Privacy [7.240611820374677]
従来の匿名化処理は、画像中の個人情報をブラックボックスで隠蔽して行う。
このような単純な測定は、胸部X線写真に生体情報を保持し、リンケージ攻撃によって患者の再同定を可能にする。
胸部X線画像の匿名化を目的とした,初となる深層学習型アプローチ(PriCheXy-Net)を提案する。
論文 参考訳(メタデータ) (2022-09-23T11:36:32Z) - Generative Residual Attention Network for Disease Detection [51.60842580044539]
本稿では, 条件付き生成逆学習を用いたX線疾患発生のための新しいアプローチを提案する。
我々は,患者の身元を保存しながら,対象領域に対応する放射線画像を生成する。
次に、ターゲット領域で生成されたX線画像を用いてトレーニングを増強し、検出性能を向上させる。
論文 参考訳(メタデータ) (2021-10-25T14:15:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。