論文の概要: SinGAN-Seg: Synthetic Training Data Generation for Medical Image
Segmentation
- arxiv url: http://arxiv.org/abs/2107.00471v1
- Date: Tue, 29 Jun 2021 19:34:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-02 13:50:09.074285
- Title: SinGAN-Seg: Synthetic Training Data Generation for Medical Image
Segmentation
- Title(参考訳): SinGAN-Seg:医療画像分割のための総合訓練データ生成
- Authors: Vajira Thambawita, Pegah Salehi, Sajad Amouei Sheshkal, Steven A.
Hicks, Hugo L.Hammer, Sravanthi Parasa, Thomas de Lange, P{\aa}l Halvorsen,
Michael A. Riegler
- Abstract要約: 本稿では,SinGAN-Segと呼ばれる新しい合成データ生成パイプラインを提案する。
これらの合成データ生成パイプラインは、プライバシーの懸念をバイパスする代替手段として利用できることを示す。
さらに,SinGAN-Segパイプラインから生成された合成データが,トレーニングデータセットが非常に小さい場合のセグメンテーションアルゴリズムの性能を向上させることを示す。
- 参考スコア(独自算出の注目度): 0.7444812797273735
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Processing medical data to find abnormalities is a time-consuming and costly
task, requiring tremendous efforts from medical experts. Therefore, Ai has
become a popular tool for the automatic processing of medical data, acting as a
supportive tool for doctors. AI tools highly depend on data for training the
models. However, there are several constraints to access to large amounts of
medical data to train machine learning algorithms in the medical domain, e.g.,
due to privacy concerns and the costly, time-consuming medical data annotation
process. To address this, in this paper we present a novel synthetic data
generation pipeline called SinGAN-Seg to produce synthetic medical data with
the corresponding annotated ground truth masks. We show that these synthetic
data generation pipelines can be used as an alternative to bypass privacy
concerns and as an alternative way to produce artificial segmentation datasets
with corresponding ground truth masks to avoid the tedious medical data
annotation process. As a proof of concept, we used an open polyp segmentation
dataset. By training UNet++ using both the real polyp segmentation dataset and
the corresponding synthetic dataset generated from the SinGAN-Seg pipeline, we
show that the synthetic data can achieve a very close performance to the real
data when the real segmentation datasets are large enough. In addition, we show
that synthetic data generated from the SinGAN-Seg pipeline improving the
performance of segmentation algorithms when the training dataset is very small.
Since our SinGAN-Seg pipeline is applicable for any medical dataset, this
pipeline can be used with any other segmentation datasets.
- Abstract(参考訳): 異常を見つけるために医療データを処理することは時間と費用のかかる作業であり、医療専門家の多大な努力を必要とする。
そのため、Aiは医療データの自動処理ツールとして人気があり、医師支援ツールとして機能している。
AIツールはモデルをトレーニングするためのデータに大きく依存する。
しかし、プライバシー上の懸念や時間を要する医療データアノテーションプロセスのために、医療領域で機械学習アルゴリズムを訓練するために大量の医療データにアクセスするにはいくつかの制約がある。
そこで本稿では,SinGAN-Segと呼ばれる新しい合成データ生成パイプラインを提案する。
これらの合成データ生成パイプラインは、プライバシの懸念を回避し、退屈な医療データアノテーションプロセスを避けるために、対応する基底真理マスクを備えた人工的なセグメンテーションデータセットを作成するための代替手段として使用できる。
概念実証として,オープンポリプセグメンテーションデータセットを用いた。
実ポリプセグメンテーションデータセットとSinGAN-Segパイプラインから生成された合成データセットの両方を用いてUNet++をトレーニングすることにより、実セグメンテーションデータセットが十分に大きい場合に、合成データが実データに非常に近い性能が得られることを示す。
さらに,SinGAN-Segパイプラインから生成された合成データが,トレーニングデータセットが非常に小さい場合のセグメンテーションアルゴリズムの性能を向上させることを示す。
SinGAN-Segパイプラインはどんな医療データセットにも適用可能ですので、このパイプラインは他のセグメンテーションデータセットでも使用できます。
関連論文リスト
- EchoNet-Synthetic: Privacy-preserving Video Generation for Safe Medical Data Sharing [5.900946696794718]
本稿では,高忠実度,長大かつアクセス可能な完全データサンプルをほぼリアルタイムに生成するモデルを提案する。
本研究では,拡散モデルに基づく生成手法を開発し,医用ビデオデータセットの匿名化のためのプロトコルを提案する。
完全合成でプライバシに適合したエコー心電図データセットであるEchoNet-Syntheticについて述べる。
論文 参考訳(メタデータ) (2024-06-02T17:18:06Z) - CathFlow: Self-Supervised Segmentation of Catheters in Interventional Ultrasound Using Optical Flow and Transformers [66.15847237150909]
縦型超音波画像におけるカテーテルのセグメンテーションのための自己教師型ディープラーニングアーキテクチャを提案する。
ネットワークアーキテクチャは、Attention in Attentionメカニズムで構築されたセグメンテーショントランスフォーマであるAiAReSeg上に構築されている。
我々は,シリコンオルタファントムから収集した合成データと画像からなる実験データセット上で,我々のモデルを検証した。
論文 参考訳(メタデータ) (2024-03-21T15:13:36Z) - Reimagining Synthetic Tabular Data Generation through Data-Centric AI: A
Comprehensive Benchmark [56.8042116967334]
合成データは、機械学習モデルのトレーニングの代替となる。
合成データが現実世界データの複雑なニュアンスを反映することを保証することは、難しい作業です。
本稿では,データ中心型AI技術の統合による合成データ生成プロセスのガイドの可能性について検討する。
論文 参考訳(メタデータ) (2023-10-25T20:32:02Z) - How Good Are Synthetic Medical Images? An Empirical Study with Lung
Ultrasound [0.3312417881789094]
生成モデルを使用して合成トレーニングデータを追加することで、データの不足に対処するための低コストな方法が提供される。
合成データと実データの両方によるトレーニングは、実データのみによるトレーニングよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-10-05T15:42:53Z) - Generative Adversarial Networks for Data Augmentation [0.0]
GANは、データ拡張、画像生成、ドメイン適応など、さまざまなタスクで医療画像解析に利用されてきた。
GANは利用可能なデータセットを増やすために使用できる合成サンプルを生成することができる。
医用画像におけるGANの使用は, 画像が高品質で, 臨床現場での使用に適していることを保証するために, 依然として研究の活発な領域である点に留意する必要がある。
論文 参考訳(メタデータ) (2023-06-03T06:33:33Z) - Synthetic data, real errors: how (not) to publish and use synthetic data [86.65594304109567]
生成過程が下流MLタスクにどのように影響するかを示す。
本稿では、生成プロセスモデルパラメータの後方分布を近似するために、Deep Generative Ensemble (DGE)を導入する。
論文 参考訳(メタデータ) (2023-05-16T07:30:29Z) - FairGen: Fair Synthetic Data Generation [0.3149883354098941]
本稿では,GANアーキテクチャに依存しないより公平な合成データを生成するパイプラインを提案する。
合成データを生成する場合、ほとんどのGANはトレーニングデータに存在するバイアスを増幅するが、これらのバイアスを誘発するサンプルを除去することで、GANは本質的に真の情報的サンプルに重点を置いている、と我々は主張する。
論文 参考訳(メタデータ) (2022-10-24T08:13:47Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - Ensembles of GANs for synthetic training data generation [7.835101177261939]
トレーニングデータ不足は、ほとんどのディープラーニングプラクティスにとって大きなボトルネックです。
本研究は,gans(generative adversarial networks)が生成した合成画像のトレーニングデータとしての利用について検討する。
論文 参考訳(メタデータ) (2021-04-23T19:38:48Z) - Co-Generation and Segmentation for Generalized Surgical Instrument
Segmentation on Unlabelled Data [49.419268399590045]
正確な機器追跡と拡張現実オーバーレイには、ロボット支援手術のための外科用機器セグメンテーションが必要です。
深層学習法では手術器具のセグメンテーションに最先端のパフォーマンスが示されたが,結果はラベル付きデータに依存する。
本稿では,ロボットによる手術を含むさまざまなデータセット上で,これらの手法の限定的な一般化性を実証する。
論文 参考訳(メタデータ) (2021-03-16T18:41:18Z) - Learning to Segment Human Body Parts with Synthetically Trained Deep
Convolutional Networks [58.0240970093372]
本稿では,合成データのみを用いて学習した深部畳み込みニューラルネットワークに基づく人体部分分割のための新しい枠組みを提案する。
提案手法は,人体部品の実際の注釈付きデータを用いてモデルを訓練することなく,最先端の結果が得られる。
論文 参考訳(メタデータ) (2021-02-02T12:26:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。