論文の概要: NephroNet: A Novel Program for Identifying Renal Cell Carcinoma and
Generating Synthetic Training Images with Convolutional Neural Networks and
Diffusion Models
- arxiv url: http://arxiv.org/abs/2302.05830v1
- Date: Sun, 12 Feb 2023 01:17:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-14 18:15:29.348483
- Title: NephroNet: A Novel Program for Identifying Renal Cell Carcinoma and
Generating Synthetic Training Images with Convolutional Neural Networks and
Diffusion Models
- Title(参考訳): NephroNet: 腎細胞癌を同定し、畳み込みニューラルネットワークと拡散モデルを用いた合成訓練画像を生成する新しいプログラム
- Authors: Yashvir Sabharwal
- Abstract要約: 腎細胞癌(英: Renal cell carcinoma, RCC)は、腎に起源を持つがんの一種で、成人の腎臓がんの中で最も多い。
本研究では,ResNet-18を用いてRCCの異なるサブタイプを分類する人工知能モデルを開発した。
新しい合成画像生成ツールNephroNetは、RCC外科切除スライドの原画像を生成するために使用される拡散モデル上で開発された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Renal cell carcinoma (RCC) is a type of cancer that originates in the kidneys
and is the most common type of kidney cancer in adults. It can be classified
into several subtypes, including clear cell RCC, papillary RCC, and chromophobe
RCC. In this study, an artificial intelligence model was developed and trained
for classifying different subtypes of RCC using ResNet-18, a convolutional
neural network that has been widely used for image classification tasks. The
model was trained on a dataset of RCC histopathology images, which consisted of
digital images of RCC surgical resection slides that were annotated with the
corresponding subtype labels. The performance of the trained model was
evaluated using several metrics, including accuracy, precision, and recall.
Additionally, in this research, a novel synthetic image generation tool,
NephroNet, is developed on diffusion models that are used to generate original
images of RCC surgical resection slides. Diffusion models are a class of
generative models capable of synthesizing high-quality images from noise.
Several diffusers such as Stable Diffusion, Dreambooth Text-to-Image, and
Textual Inversion were trained on a dataset of RCC images and were used to
generate a series of original images that resembled RCC surgical resection
slides, all within the span of fewer than four seconds. The generated images
were visually realistic and could be used for creating new training datasets,
testing the performance of image analysis algorithms, and training medical
professionals. NephroNet is provided as an open-source software package and
contains files for data preprocessing, training, and visualization. Overall,
this study demonstrates the potential of artificial intelligence and diffusion
models for classifying and generating RCC images, respectively. These methods
could be useful for improving the diagnosis and treatment of RCC and more.
- Abstract(参考訳): 腎細胞癌(英: Renal cell carcinoma, RCC)は、腎に起源を持つがんの一種で、成人の腎臓がんの中で最も多い。
いくつかのサブタイプ(clear cell rcc、papillary rcc、chromophobe rcc)に分類される。
本研究では,画像分類タスクに広く用いられている畳み込みニューラルネットワークResNet-18を用いて,RCCの異なるサブタイプを分類するための人工知能モデルを開発した。
このモデルはRCCの病理組織像のデータセットに基づいて訓練され、RCCの外科的切除スライドのデジタル画像とそれに対応するサブタイプラベルをアノテートした。
モデルの性能は、精度、精度、リコールなど、いくつかの指標を用いて評価された。
さらに, 外科的切除スライドの原画像生成に使用される拡散モデルを用いて, 新たな合成画像生成ツールNephroNetを開発した。
拡散モデルは、ノイズから高品質な画像を合成できる生成モデルの一種である。
安定拡散,dreamboothテキストから画像への変換,テキストインバージョンといった複数のディフューザが,rcc画像のデータセット上で訓練され,rcc外科手術スライドに類似した一連のオリジナル画像を生成するために,すべて4秒以内の間隔で使用された。
生成された画像は視覚的に現実的であり、新しいトレーニングデータセットの作成、画像分析アルゴリズムのパフォーマンスのテスト、医療専門家のトレーニングに使用できる。
NephroNetはオープンソースソフトウェアパッケージとして提供されており、データ前処理、トレーニング、視覚化のためのファイルを含んでいる。
本研究では,RCC画像の分類と生成における人工知能と拡散モデルの可能性を示す。
これらの方法はRCCの診断や治療の改善に有用である。
関連論文リスト
- SurgicaL-CD: Generating Surgical Images via Unpaired Image Translation with Latent Consistency Diffusion Models [1.6189876649941652]
現実的な手術画像を生成するために, 連続拡散法であるemphSurgicaL-CDを導入する。
以上の結果から,本手法はGANや拡散に基づく手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-08-19T09:19:25Z) - Learning Low-Rank Feature for Thorax Disease Classification [7.447448767095787]
本稿では胸部疾患分類について検討する。
疾患領域の特徴の効果的な抽出は, 放射線画像上の疾患分類に不可欠である。
本稿では,Low-Rank Feature Learning (LRFL)法を提案する。
論文 参考訳(メタデータ) (2024-02-14T15:35:56Z) - Improving Classification of Retinal Fundus Image Using Flow Dynamics
Optimized Deep Learning Methods [0.0]
糖尿病網膜症(英: Diabetic Retinopathy, DR)は、糖尿病において網膜に存在する血管網を損傷する障害である。
経験豊富な臨床医は、疾患の特定に使用される画像中の腫瘍を識別する必要があるため、カラー・ファンドス画像を用いてDR診断を行うのにしばらく時間がかかる可能性がある。
論文 参考訳(メタデータ) (2023-04-29T16:11:34Z) - Performance of GAN-based augmentation for deep learning COVID-19 image
classification [57.1795052451257]
ディープラーニングを医療分野に適用する上で最大の課題は、トレーニングデータの提供である。
データ拡張は、限られたデータセットに直面した時に機械学習で使用される典型的な方法論である。
本研究は, 新型コロナウイルスの胸部X線画像セットを限定して, StyleGAN2-ADAモデルを用いて訓練するものである。
論文 参考訳(メタデータ) (2023-04-18T15:39:58Z) - Cross-modulated Few-shot Image Generation for Colorectal Tissue
Classification [58.147396879490124]
XM-GANと名づけられた少数ショット生成法は,1塩基と1対の参照組織像を入力とし,高品質で多様な画像を生成する。
我々の知る限りでは、大腸組織像の少数ショット生成を最初に調査した人物である。
論文 参考訳(メタデータ) (2023-04-04T17:50:30Z) - Traditional Classification Neural Networks are Good Generators: They are
Competitive with DDPMs and GANs [104.72108627191041]
従来のニューラルネットワーク分類器は、最先端の生成モデルに匹敵する高品質な画像を生成することができることを示す。
マスクをベースとした再構成モジュールを提案し, 意味的勾配を意識し, 可視画像の合成を行う。
また,本手法は,画像テキスト基盤モデルに関して,テキスト・画像生成にも適用可能であることを示す。
論文 参考訳(メタデータ) (2022-11-27T11:25:35Z) - RoentGen: Vision-Language Foundation Model for Chest X-ray Generation [7.618389245539657]
我々は,胸部X線のコーパスに事前学習した潜伏拡散モデルを適用することで,大きな自然医学的分布変化を克服する戦略を開発する。
テキストプロンプトに条件付された高忠実で多様な合成CXRを生成するモデルの能力について検討する。
得られたモデル(RoentGen)が視覚的に説得力があり多様な合成CXR画像を生成することができることを示す。
論文 参考訳(メタデータ) (2022-11-23T06:58:09Z) - Generative Adversarial U-Net for Domain-free Medical Image Augmentation [49.72048151146307]
注釈付き医用画像の不足は、医用画像コンピューティングの分野における最大の課題の1つだ。
本稿では,生成逆U-Netという新しい生成手法を提案する。
当社の新しいモデルは、ドメインフリーで、さまざまな医療画像に汎用性があります。
論文 参考訳(メタデータ) (2021-01-12T23:02:26Z) - SAG-GAN: Semi-Supervised Attention-Guided GANs for Data Augmentation on
Medical Images [47.35184075381965]
本稿では,GAN(Cycle-Consistency Generative Adversarial Networks)を用いた医用画像生成のためのデータ拡張手法を提案する。
提案モデルでは,正常画像から腫瘍画像を生成することができ,腫瘍画像から正常画像を生成することもできる。
本研究では,従来のデータ拡張手法と合成画像を用いた分類モデルを用いて,実画像を用いた分類モデルを訓練する。
論文 参考訳(メタデータ) (2020-11-15T14:01:24Z) - Classification of COVID-19 in CT Scans using Multi-Source Transfer
Learning [91.3755431537592]
我々は,従来のトランスファー学習の改良にマルチソース・トランスファー・ラーニングを応用して,CTスキャンによる新型コロナウイルスの分類を提案する。
マルチソースファインチューニングアプローチでは、ImageNetで微調整されたベースラインモデルよりも優れています。
我々の最高のパフォーマンスモデルは、0.893の精度と0.897のリコールスコアを達成でき、ベースラインのリコールスコアを9.3%上回った。
論文 参考訳(メタデータ) (2020-09-22T11:53:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。