論文の概要: Anonymization of Whole Slide Images in Histopathology for Research and
Education
- arxiv url: http://arxiv.org/abs/2211.06103v1
- Date: Fri, 11 Nov 2022 10:15:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-19 12:22:25.863355
- Title: Anonymization of Whole Slide Images in Histopathology for Research and
Education
- Title(参考訳): 研究・教育における全スライド画像の匿名化
- Authors: Tom Bisson, Michael Franz, Isil Dogan O, Daniel Romberg, Christoph
Jansen, Peter Hufnagl, Norman Zerbe
- Abstract要約: 診断組織の病理学では、必然的にベンダー固有のファイルフォーマットに格納される機密データからなる識別データを生成する。
Whole ImagesWSIの配布と外部利用は通常これらのフォーマットで行われる。
この作業により、ネイティブフォーマットを保持しながらWSIを匿名化するためのソフトウェアライブラリが作られる。
- 参考スコア(独自算出の注目度): 6.418411870822658
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Objective: The exchange of health-related data is subject to regional laws
and regulations, such as the General Data Protection Regulation (GDPR) in the
EU or the Health Insurance Portability and Accountability Act (HIPAA) in the
United States, resulting in non-trivial challenges for researchers and
educators when working with these data. In pathology, the digitization of
diagnostic tissue samples inevitably generates identifying data that can
consist of sensitive but also acquisition-related information stored in
vendor-specific file formats. Distribution and off-clinical use of these Whole
Slide Images (WSI) is usually done in these formats, as an industry-wide
standardization such as DICOM is yet only tentatively adopted and slide scanner
vendors currently do not provide anonymization functionality.
Methods: We developed a guideline for the proper handling of
histopathological image data particularly for research and education with
regard to the GDPR. In this context, we evaluated existing anonymization
methods and examined proprietary format specifications to identify all
sensitive information for the most common WSI formats. This work results in a
software library that enables GDPR-compliant anonymization of WSIs while
preserving the native formats.
Results: Based on the analysis of proprietary formats, all occurrences of
sensitive information were identified for file formats frequently used in
clinical routine, and finally, an open-source programming library with an
executable CLI-tool and wrappers for different programming languages was
developed.
Conclusions: Our analysis showed that there is no straightforward software
solution to anonymize WSIs in a GDPR-compliant way while maintaining the data
format. We closed this gap with our extensible open-source library that works
instantaneously and offline.
- Abstract(参考訳): 目的: 健康関連データの交換は、EUの一般データ保護規則(GDPR)や米国の健康保険可搬性会計法(HIPAA)などの地域法や規制の対象となり、その結果、これらのデータを扱う際に研究者や教育者にとって非自明な課題となる。
病理学では、診断組織サンプルのデジタル化は必然的にベンダー固有のファイル形式に格納された機密情報と取得関連情報からなる識別データを生成する。
これらの全スライドイメージ(WSI)の配布と非クリニカル使用は通常これらのフォーマットで行われ、DICOMのような業界全体の標準化はまだ暫定的にのみ採用されており、スライドスキャナーベンダーは現在匿名化機能を提供していない。
方法:我々は,特にGDPRに関する研究・教育のために,病理画像データの適切な取り扱いのためのガイドラインを開発した。
この文脈では、既存の匿名化手法を評価し、最も一般的なwsiフォーマットのすべての機密情報を識別するために、プロプライエタリなフォーマット仕様を調べました。
この作業は、ネイティブフォーマットを保存しながら、GDPR準拠のWSIの匿名化を可能にするソフトウェアライブラリをもたらす。
結果: プロプライエタリなフォーマットの分析から, 臨床ルーチンで頻繁に使用されるファイル形式に対して, センシティブな情報がすべて特定され, そして, 様々なプログラミング言語用のCLIツールとラッパーを備えたオープンソースプログラミングライブラリが開発された。
結論: 分析の結果,データフォーマットを維持しながらgdprに準拠した方法でwsisを匿名化する,直接的なソフトウェアソリューションは存在しなかった。
即時かつオフラインで動作する拡張可能なオープンソースライブラリとのギャップを埋めました。
関連論文リスト
- De-Identification of Medical Imaging Data: A Comprehensive Tool for Ensuring Patient Privacy [4.376648893167674]
オープンソースツールを使用して、DICOMの磁気共鳴画像、コンピュータ画像、スライド画像全体、および磁気共鳴twixの生データを識別することができる。
複数種類の入力のための精巧な匿名化パイプラインを備えており、画像データの非識別に使用される追加ツールの必要性を低減している。
論文 参考訳(メタデータ) (2024-10-16T09:31:24Z) - Multi-Modal Dataset Creation for Federated Learning with DICOM Structured Reports [26.2463670182172]
フェデレーショントレーニングは、多種多様なデータストレージオプション、一貫性のない命名方式、さまざまなアノテーション手順、ラベル品質の相違により、しばしば異種データセットによって妨げられる。
これは、均一なデータ表現とフィルタリングオプションを含むデータセット調和が最重要となる、新興のマルチモーダル学習パラダイムにおいて特に顕著である。
我々は、マルチモーダルデータセットの組み立てプロセスを簡単にする、データ統合と対話型フィルタリング機能のためのオープンプラットフォームを開発した。
論文 参考訳(メタデータ) (2024-07-12T07:34:10Z) - Knowledge-Infused Prompting: Assessing and Advancing Clinical Text Data
Generation with Large Language Models [48.07083163501746]
臨床自然言語処理には、ドメイン固有の課題に対処できる方法が必要である。
我々は,そのプロセスに知識を注入する,革新的で資源効率のよいアプローチであるClinGenを提案する。
7つのNLPタスクと16のデータセットを比較検討した結果,ClinGenはさまざまなタスクのパフォーマンスを継続的に向上させることがわかった。
論文 参考訳(メタデータ) (2023-11-01T04:37:28Z) - PEOPL: Characterizing Privately Encoded Open Datasets with Public Labels [59.66777287810985]
プライバシとユーティリティのための情報理論スコアを導入し、不誠実なユーザの平均パフォーマンスを定量化する。
次に、ランダムなディープニューラルネットワークの使用を動機付ける符号化スキームのファミリーを構築する際のプリミティブを理論的に特徴づける。
論文 参考訳(メタデータ) (2023-03-31T18:03:53Z) - Development and validation of a natural language processing algorithm to
pseudonymize documents in the context of a clinical data warehouse [53.797797404164946]
この研究は、この領域でツールやリソースを共有する際に直面する困難を浮き彫りにしている。
臨床文献のコーパスを12種類に分類した。
私たちは、ディープラーニングモデルと手動ルールの結果をマージして、ハイブリッドシステムを構築します。
論文 参考訳(メタデータ) (2023-03-23T17:17:46Z) - DeID-GPT: Zero-shot Medical Text De-Identification by GPT-4 [80.36535668574804]
我々は新しいGPT4対応脱識別フレームワーク(DeID-GPT)を開発した。
開発したDeID-GPTは,非構造化医用テキストからの個人情報のマスキングにおいて,高い精度と信頼性を示した。
本研究は,ChatGPTおよびGPT-4を医療用テキストデータ処理および非識別に利用した最初期の1つである。
論文 参考訳(メタデータ) (2023-03-20T11:34:37Z) - EBOCA: Evidences for BiOmedical Concepts Association Ontology [55.41644538483948]
本論文は,生物医学領域の概念とそれらの関連性を記述するオントロジーであるEBOCAと,それらの関連性を支持するエビデンスを提案する。
DISNETのサブセットから得られるテストデータとテキストからの自動アソシエーション抽出が変換され、実際のシナリオで使用できる知識グラフが作成されるようになった。
論文 参考訳(メタデータ) (2022-08-01T18:47:03Z) - Classifying Unstructured Clinical Notes via Automatic Weak Supervision [17.45660355026785]
クラスラベル記述のみから学習する、一般的な弱教師付きテキスト分類フレームワークを導入する。
我々は、事前訓練された言語モデルとデータプログラミングフレームワークに格納された言語ドメインの知識を活用して、テキストにコードラベルを割り当てる。
論文 参考訳(メタデータ) (2022-06-24T05:55:49Z) - A Meta-embedding-based Ensemble Approach for ICD Coding Prediction [64.42386426730695]
国際疾病分類 (icd) は、世界中で臨床コーディングに使われているデファクトコードである。
これらのコードにより、医療提供者は償還を請求し、診断情報の効率的な保管と検索を容易にします。
提案手法は,日常的な医学データと科学論文の外部知識を用いて,効果的に単語ベクトルを訓練することにより,神経モデルの性能を高める。
論文 参考訳(メタデータ) (2021-02-26T17:49:58Z) - MASK: A flexible framework to facilitate de-identification of clinical
texts [2.3015324171336378]
本稿では,MASKというソフトウェアパッケージについて紹介する。
ソフトウェアは、最先端技術を使って名前付きエンティティ認識を実行し、認識されたエンティティをマスクまたは修正することができる。
論文 参考訳(メタデータ) (2020-05-24T08:53:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。