論文の概要: Overcoming Barriers to Data Sharing with Medical Image Generation: A
Comprehensive Evaluation
- arxiv url: http://arxiv.org/abs/2012.03769v1
- Date: Sun, 29 Nov 2020 15:41:46 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-07 08:56:23.909288
- Title: Overcoming Barriers to Data Sharing with Medical Image Generation: A
Comprehensive Evaluation
- Title(参考訳): 医用画像生成によるデータ共有の障壁を克服する:包括的評価
- Authors: August DuMont Sch\"utte, J\"urgen Hetzel, Sergios Gatidis, Tobias
Hepp, Benedikt Dietz, Stefan Bauer and Patrick Schwab
- Abstract要約: 我々は、GAN(Generative Adversarial Networks)を用いて、合成患者データからなる医用画像データセットを作成する。
合成画像は、理想的には、ソースデータセットと類似した統計特性を持つが、機密性の高い個人情報は含まない。
合成画像の品質は、合成データセットと実データセットの両方で訓練された予測モデルの性能差によって測定する。
- 参考スコア(独自算出の注目度): 17.983449515155414
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Privacy concerns around sharing personally identifiable information are a
major practical barrier to data sharing in medical research. However, in many
cases, researchers have no interest in a particular individual's information
but rather aim to derive insights at the level of cohorts. Here, we utilize
Generative Adversarial Networks (GANs) to create derived medical imaging
datasets consisting entirely of synthetic patient data. The synthetic images
ideally have, in aggregate, similar statistical properties to those of a source
dataset but do not contain sensitive personal information. We assess the
quality of synthetic data generated by two GAN models for chest radiographs
with 14 different radiology findings and brain computed tomography (CT) scans
with six types of intracranial hemorrhages. We measure the synthetic image
quality by the performance difference of predictive models trained on either
the synthetic or the real dataset. We find that synthetic data performance
disproportionately benefits from a reduced number of unique label combinations
and determine at what number of samples per class overfitting effects start to
dominate GAN training. Our open-source benchmark findings also indicate that
synthetic data generation can benefit from higher levels of spatial resolution.
We additionally conducted a reader study in which trained radiologists do not
perform better than random on discriminating between synthetic and real medical
images for both data modalities to a statistically significant extent. Our
study offers valuable guidelines and outlines practical conditions under which
insights derived from synthetic medical images are similar to those that would
have been derived from real imaging data. Our results indicate that synthetic
data sharing may be an attractive and privacy-preserving alternative to sharing
real patient-level data in the right settings.
- Abstract(参考訳): 個人識別可能な情報の共有に関するプライバシー上の懸念は、医学研究におけるデータ共有の大きな障壁である。
しかし、多くの場合、研究者は特定の個人の情報に興味がなく、むしろコホートレベルでの洞察を導き出そうとしている。
本稿では、GAN(Generative Adversarial Networks)を用いて、合成患者データからなる医用画像データセットを作成する。
合成画像は、理想的には、ソースデータセットと類似した統計特性を持つが、機密性の高い個人情報は含まない。
胸部x線写真における2種類のganモデルによる合成データの品質について検討し,14種類の放射線画像と6種類の頭蓋内出血を伴う脳ctスキャンについて検討した。
合成データと実データの両方で訓練された予測モデルの性能差から合成画像品質を測定する。
合成データの性能は,一意のラベルの組み合わせを減らし,クラスごとの過剰適合効果がGANトレーニングに支配的になるかどうかを判断する。
オープンソースベンチマークの結果は、合成データ生成が空間分解能の高レベルから恩恵を受けることを示唆している。
また,データモダリティを統計的に有意な範囲で合成画像と実際の医用画像の判別において,訓練された放射線技師がランダムに評価しない読者調査を行った。
本研究は, 医用画像から得られた洞察が, 実際の画像データから得られたものと類似しているという実践的条件を概説し, 有用なガイドラインを提供する。
以上の結果から, 人工的データ共有は, 患者レベルのデータを適切な設定で共有するよりも, 魅力的かつプライバシ保護的な手段である可能性が示唆された。
関連論文リスト
- Latent Drifting in Diffusion Models for Counterfactual Medical Image Synthesis [55.959002385347645]
大規模なデータセットのトレーニングによるスケーリングは、画像生成の品質と忠実度を高め、拡散モデルによる操作を可能にすることが示されている。
遅延ドリフトにより、医療画像に対して拡散モデルを条件付けし、反ファクト画像生成の複雑なタスクに適合させることができる。
本研究は,異なる微調整方式と組み合わせた場合,様々なシナリオにおいて顕著な性能向上を示すものである。
論文 参考訳(メタデータ) (2024-12-30T01:59:34Z) - Embryo 2.0: Merging Synthetic and Real Data for Advanced AI Predictions [69.07284335967019]
2つのデータセットを使用して、2つの生成モデルをトレーニングします。
2-cell, 4-cell, 8-cell, morula, blastocyst など, 様々な細胞で合成胚画像を生成する。
これらは実画像と組み合わせて、胚細胞ステージ予測のための分類モデルを訓練した。
論文 参考訳(メタデータ) (2024-12-02T08:24:49Z) - Evaluating Utility of Memory Efficient Medical Image Generation: A Study on Lung Nodule Segmentation [0.0]
本研究は,合成医用画像を生成するためのメモリ効率のパッチワイド拡散確率モデル(DDPM)を提案する。
本手法は, メモリ制約を効率的に管理しながら, 結節分割による高能率合成画像を生成する。
本手法は,合成データのみに基づくセグメンテーションモデルのトレーニングと,合成画像を用いた実世界のトレーニングデータの拡張の2つのシナリオで評価する。
論文 参考訳(メタデータ) (2024-10-16T13:20:57Z) - MediSyn: A Generalist Text-Guided Latent Diffusion Model For Diverse Medical Image Synthesis [4.541407789437896]
MediSynは6つの専門医と10種類の画像から合成画像を生成することができるテキスト誘導潜在拡散モデルである。
合成画像と実画像との直接比較により,本モデルが新規画像の合成を行い,患者のプライバシを重要視する可能性が確認された。
本研究は,一般画像生成モデルが医学におけるアルゴリズム研究と開発を加速する大きな可能性を浮き彫りにした。
論文 参考訳(メタデータ) (2024-05-16T04:28:44Z) - Unconditional Latent Diffusion Models Memorize Patient Imaging Data: Implications for Openly Sharing Synthetic Data [2.04850174048739]
我々は、合成データ生成のためのCT、MR、X線データセット上で潜時拡散モデルを訓練する。
そして,新たな自己教師型コピー検出手法を用いて,記憶したトレーニングデータの量を検出する。
以上の結果から,全データセットにまたがる驚くほど高い患者のデータ記憶が得られた。
論文 参考訳(メタデータ) (2024-02-01T22:58:21Z) - Radiology Report Generation Using Transformers Conditioned with
Non-imaging Data [55.17268696112258]
本稿では,胸部X線画像と関連する患者の人口統計情報を統合したマルチモーダルトランスフォーマーネットワークを提案する。
提案ネットワークは、畳み込みニューラルネットワークを用いて、CXRから視覚的特徴を抽出し、その視覚的特徴と患者の人口統計情報のセマンティックテキスト埋め込みを組み合わせたトランスフォーマーベースのエンコーダデコーダネットワークである。
論文 参考訳(メタデータ) (2023-11-18T14:52:26Z) - Beyond Images: An Integrative Multi-modal Approach to Chest X-Ray Report
Generation [47.250147322130545]
画像からテキストまでの放射線学レポート生成は,医療画像の発見を記述した放射線学レポートを自動生成することを目的としている。
既存の方法の多くは画像データのみに焦点をあてており、他の患者情報は放射線科医に公開されていない。
胸部X線レポートを生成するための多モードディープニューラルネットワークフレームワークを,非構造的臨床ノートとともにバイタルサインや症状などの構造化された患者データを統合することで提案する。
論文 参考訳(メタデータ) (2023-11-18T14:37:53Z) - Augmenting medical image classifiers with synthetic data from latent
diffusion models [12.077733447347592]
我々は,潜伏拡散モデルが皮膚疾患の画像を生成することを実証した。
我々は,複数の生成戦略を用いて生成した458,920個の合成画像の新しいデータセットを生成し,解析する。
論文 参考訳(メタデータ) (2023-08-23T22:34:49Z) - A Deep Learning Approach to Private Data Sharing of Medical Images Using
Conditional GANs [1.2099130772175573]
COSENTYX (secukinumab) Ankylosing Spondylitis の臨床的検討に基づいて合成データセットを生成する方法を提案する。
本稿では, 画像の忠実度, サンプルの多様性, データセットのプライバシーの3つの重要な指標について, 合成データセットを生成し, その特性を詳細に分析する手法を提案する。
論文 参考訳(メタデータ) (2021-06-24T17:24:06Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。