論文の概要: Medical Image De-Identification Resources: Synthetic DICOM Data and Tools for Validation
- arxiv url: http://arxiv.org/abs/2508.01889v1
- Date: Sun, 03 Aug 2025 18:48:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-05 18:25:22.110091
- Title: Medical Image De-Identification Resources: Synthetic DICOM Data and Tools for Validation
- Title(参考訳): 医用画像復号化資源:合成DICOMデータと検証ツール
- Authors: Michael W. Rutherford, Tracy Nolan, Linmin Pei, Ulrike Wagner, Qinyan Pan, Phillip Farmer, Kirk Smith, Benjamin Kopchick, Laura Opsahl-Ong, Granger Sutton, David Clunie, Keyvan Farahani, Fred Prior,
- Abstract要約: 患者のプライバシーを確保することは、オープンアクセスデータ共有にとって重要な課題である。
Digital Imaging and Communications in Medicine (DICOM)は、重要な臨床メタデータと広範囲に保護された健康情報(PHI)と個人識別可能な情報の両方を符号化する(PII)。
このギャップに対処するために、合成PHI/PIIを取り入れたオープンアクセス型DICOMデータセットと、画像識別のベンチマークを行うための評価フレームワークを開発した。
- 参考スコア(独自算出の注目度): 0.10617782943195009
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Medical imaging research increasingly depends on large-scale data sharing to promote reproducibility and train Artificial Intelligence (AI) models. Ensuring patient privacy remains a significant challenge for open-access data sharing. Digital Imaging and Communications in Medicine (DICOM), the global standard data format for medical imaging, encodes both essential clinical metadata and extensive protected health information (PHI) and personally identifiable information (PII). Effective de-identification must remove identifiers, preserve scientific utility, and maintain DICOM validity. Tools exist to perform de-identification, but few assess its effectiveness, and most rely on subjective reviews, limiting reproducibility and regulatory confidence. To address this gap, we developed an openly accessible DICOM dataset infused with synthetic PHI/PII and an evaluation framework for benchmarking image de-identification workflows. The Medical Image de-identification (MIDI) dataset was built using publicly available de-identified data from The Cancer Imaging Archive (TCIA). It includes 538 subjects (216 for validation, 322 for testing), 605 studies, 708 series, and 53,581 DICOM image instances. These span multiple vendors, imaging modalities, and cancer types. Synthetic PHI and PII were embedded into structured data elements, plain text data elements, and pixel data to simulate real-world identity leaks encountered by TCIA curation teams. Accompanying evaluation tools include a Python script, answer keys (known truth), and mapping files that enable automated comparison of curated data against expected transformations. The framework is aligned with the HIPAA Privacy Rule "Safe Harbor" method, DICOM PS3.15 Confidentiality Profiles, and TCIA best practices. It supports objective, standards-driven evaluation of de-identification workflows, promoting safer and more consistent medical image sharing.
- Abstract(参考訳): 医療画像の研究は、再現可能性を促進し、人工知能(AI)モデルを訓練するために、大規模なデータ共有にますます依存している。
患者のプライバシーを確保することは、オープンアクセスデータ共有にとって重要な課題である。
医療画像の標準規格であるDigital Imaging and Communications in Medicine (DICOM)は、重要な臨床メタデータと広範囲に保護された健康情報(PHI)と個人識別可能な情報(PII)の両方を符号化している。
効果的な非識別は、識別子を削除し、科学的有用性を保ち、DICOMの妥当性を維持する必要がある。
脱識別を行うツールは存在するが、その有効性を評価するものはほとんどなく、ほとんどは主観的なレビューに依存しており、再現性や規制の信頼性を制限している。
このギャップに対処するために、合成PHI/PIIを取り入れたオープンアクセス型DICOMデータセットと、画像識別ワークフローのベンチマークを行うための評価フレームワークを開発した。
Medical Image de-identification (MIDI)データセットは、The Cancer Imaging Archive (TCIA)から公開されている非識別データを用いて構築された。
対象者は538名(検証用216名、テスト用322名、研究用605名、シリーズ708名、DICOMイメージインスタンス53,581名)である。
これらは、複数のベンダー、画像モダリティ、がんタイプにまたがる。
合成PHIとPIIは構造化データ要素、プレーンテキストデータ要素、ピクセルデータに埋め込まれ、TCIAキュレーションチームが遭遇した現実世界のアイデンティティリークをシミュレートした。
評価ツールには、Pythonスクリプト、応答キー(既知の真実)、および期待される変換に対するキュレートされたデータの自動比較を可能にするマッピングファイルが含まれる。
このフレームワークは、HIPAA Privacy Rule "Safe Harbor" メソッド、DICOM PS3.15 Confidentiality Profiles、TCIAベストプラクティスと一致している。
客観的、標準駆動による非識別ワークフローの評価をサポートし、より安全で一貫性のある医用画像共有を促進する。
関連論文リスト
- Deep classification algorithm for De-identification of DICOM medical images [0.0]
DICOMファイルの同定は、医用画像研究において不可欠な要素である。
名前、歴史、個人データ、機関など、最も賢明な情報が認識された。
論文 参考訳(メタデータ) (2025-08-04T08:21:18Z) - DICOM De-Identification via Hybrid AI and Rule-Based Framework for Scalable, Uncertainty-Aware Redaction [0.0]
本稿では,ルールベースとAI駆動技術を組み合わせたハイブリッド・デアイデンティティ・フレームワークを提案する。
我々のソリューションは、医療データの特定における重要な課題に対処し、研究のための画像データのセキュアで倫理的で信頼できるリリースを支援します。
論文 参考訳(メタデータ) (2025-07-31T17:19:38Z) - Medical Image De-Identification Benchmark Challenge [1.491270549044044]
MIDI-B Challengeの目的は、DICOMイメージデIDツールのベンチマークのための標準化されたプラットフォームを提供することであった。
この課題は、PHI/PIIを挿入した、大規模で多様なマルチセンター、マルチモダリティの実際の未同定放射線画像を用いた。
10チームが挑戦のテストフェーズを完了しました。
論文 参考訳(メタデータ) (2025-07-31T14:47:20Z) - UniMed-CLIP: Towards a Unified Image-Text Pretraining Paradigm for Diverse Medical Imaging Modalities [68.12889379702824]
対照的な学習によって訓練された視覚言語モデル(VLM)は、自然画像タスクにおいて顕著な成功を収めた。
UniMedは530万以上の画像テキストペアからなる、大規模でオープンソースのマルチモーダル医療データセットである。
我々は、6つのモダリティのための統一VLMであるUniMed-CLIPを訓練し、ゼロショット評価において顕著な利益を得た。
論文 参考訳(メタデータ) (2024-12-13T18:59:40Z) - Clinical Evaluation of Medical Image Synthesis: A Case Study in Wireless Capsule Endoscopy [63.39037092484374]
人工知能(AI)に基づく合成データ生成は、臨床医学の届け方を変えることができる。
本研究は,無線カプセル内視鏡(WCE)画像を用いた炎症性腸疾患(IBD)の診断における概念実証による医療用SDGの臨床評価に焦点を当てた。
その結果、TIDE-IIは、最先端の生成モデルと比較して品質が向上し、臨床的に可塑性で、非常に現実的なWCE画像を生成することがわかった。
論文 参考訳(メタデータ) (2024-10-31T19:48:50Z) - De-Identification of Medical Imaging Data: A Comprehensive Tool for Ensuring Patient Privacy [4.376648893167674]
オープンソースツールを使用して、DICOMの磁気共鳴画像、コンピュータ画像、スライド画像全体、および磁気共鳴twixの生データを識別することができる。
複数種類の入力のための精巧な匿名化パイプラインを備えており、画像データの非識別に使用される追加ツールの必要性を低減している。
論文 参考訳(メタデータ) (2024-10-16T09:31:24Z) - Radiology Report Generation Using Transformers Conditioned with
Non-imaging Data [55.17268696112258]
本稿では,胸部X線画像と関連する患者の人口統計情報を統合したマルチモーダルトランスフォーマーネットワークを提案する。
提案ネットワークは、畳み込みニューラルネットワークを用いて、CXRから視覚的特徴を抽出し、その視覚的特徴と患者の人口統計情報のセマンティックテキスト埋め込みを組み合わせたトランスフォーマーベースのエンコーダデコーダネットワークである。
論文 参考訳(メタデータ) (2023-11-18T14:52:26Z) - DeID-GPT: Zero-shot Medical Text De-Identification by GPT-4 [80.36535668574804]
我々は新しいGPT4対応脱識別フレームワーク(DeID-GPT)を開発した。
開発したDeID-GPTは,非構造化医用テキストからの個人情報のマスキングにおいて,高い精度と信頼性を示した。
本研究は,ChatGPTおよびGPT-4を医療用テキストデータ処理および非識別に利用した最初期の1つである。
論文 参考訳(メタデータ) (2023-03-20T11:34:37Z) - Report of the Medical Image De-Identification (MIDI) Task Group -- Best Practices and Recommendations [2.0719223149506028]
本報告では,ヒトおよび生体試料の医用画像の識別の技術的側面について述べる。
公開データのみの特定が検討されている。
人工知能(AI)モデル開発のためのフェデレーション学習のような、プライバシに対する別のアプローチは、スコープ外である。
論文 参考訳(メタデータ) (2023-03-18T19:12:38Z) - ConfounderGAN: Protecting Image Data Privacy with Causal Confounder [85.6757153033139]
本稿では,GAN(Generative Adversarial Network)のConfounderGANを提案する。
実験は、3つの自然なオブジェクトデータセットと3つの医療データセットからなる6つの画像分類データセットで実施される。
論文 参考訳(メタデータ) (2022-12-04T08:49:14Z) - Privacy-preserving medical image analysis [53.4844489668116]
医用画像におけるプライバシ保護機械学習(PPML)のためのソフトウェアフレームワークであるPriMIAを提案する。
集合型学習モデルの分類性能は,未発見データセットの人間専門家と比較して有意に良好である。
グラデーションベースのモデル反転攻撃に対するフレームワークのセキュリティを実証的に評価する。
論文 参考訳(メタデータ) (2020-12-10T13:56:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。