論文の概要: Aiding Medical Diagnosis through Image Synthesis and Classification
- arxiv url: http://arxiv.org/abs/2506.00786v1
- Date: Sun, 01 Jun 2025 02:25:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:33.589648
- Title: Aiding Medical Diagnosis through Image Synthesis and Classification
- Title(参考訳): 画像合成と分類による診断支援
- Authors: Kanishk Choudhary,
- Abstract要約: 本稿では,テキスト記述からリアルな医用画像を生成するシステムを提案する。
PathMNISTデータセット上で,Low-Rank Adaptation (LoRA) を用いて事前訓練した安定拡散モデルを微調整した。
ResNet-18の分類モデルは同じデータセットで訓練され、正確なラベルを検出する精度は99.76%に達した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Medical professionals, especially those in training, often depend on visual reference materials to support an accurate diagnosis and develop pattern recognition skills. However, existing resources may lack the diversity and accessibility needed for broad and effective clinical learning. This paper presents a system designed to generate realistic medical images from textual descriptions and validate their accuracy through a classification model. A pretrained stable diffusion model was fine-tuned using Low-Rank Adaptation (LoRA) on the PathMNIST dataset, consisting of nine colorectal histopathology tissue types. The generative model was trained multiple times using different training parameter configurations, guided by domain-specific prompts to capture meaningful features. To ensure quality control, a ResNet-18 classification model was trained on the same dataset, achieving 99.76% accuracy in detecting the correct label of a colorectal histopathological medical image. Generated images were then filtered using the trained classifier and an iterative process, where inaccurate outputs were discarded and regenerated until they were correctly classified. The highest performing version of the generative model from experimentation achieved an F1 score of 0.6727, with precision and recall scores of 0.6817 and 0.7111, respectively. Some types of tissue, such as adipose tissue and lymphocytes, reached perfect classification scores, while others proved more challenging due to structural complexity. The self-validating approach created demonstrates a reliable method for synthesizing domain-specific medical images because of high accuracy in both the generation and classification portions of the system, with potential applications in both diagnostic support and clinical education. Future work includes improving prompt-specific accuracy and extending the system to other areas of medical imaging.
- Abstract(参考訳): 医療専門家、特に訓練中の専門家は、正確な診断を支援し、パターン認識スキルを開発するために、しばしば視覚基準資料に依存する。
しかし、既存のリソースは、広範かつ効果的な臨床学習に必要な多様性とアクセシビリティを欠いている可能性がある。
本稿では,テキスト記述からリアルな医用画像を生成し,その精度を分類モデルを用いて検証するシステムを提案する。
大腸病理組織型9種からなるPathMNISTデータセット上で,低ランク適応(LoRA)を用いて,事前訓練した安定拡散モデルを微調整した。
生成モデルは、意味のある特徴をキャプチャするためのドメイン固有のプロンプトによってガイドされる、異なるトレーニングパラメータ設定を使用して、何度もトレーニングされた。
品質管理を確保するため、ResNet-18分類モデルは同じデータセット上で訓練され、大腸癌の病理組織学的画像の正確なラベルを検出する精度99.76%を達成した。
生成した画像は、トレーニングされた分類器と反復処理を用いてフィルタリングされ、不正確な出力が破棄され、正しく分類されるまで再生される。
実験による生成モデルの最高性能はF1スコアが0.6727、精度とリコールスコアが0.6817と0.7111である。
脂肪組織やリンパ球など一部の組織は完全な分類基準に達したが、他の組織は構造的な複雑さのためにより困難であった。
自己検証手法は、システムの生成と分類の両方において高い精度で、診断支援と臨床教育の両方に潜在的に応用できるため、ドメイン固有の医療画像を合成する信頼性の高い方法を示す。
今後の作業には、迅速な特定精度の向上と、他の医療画像領域へのシステム拡張が含まれる。
関連論文リスト
- Causal Disentanglement for Robust Long-tail Medical Image Generation [80.15257897500578]
そこで本研究では,病的特徴と構造的特徴を独立に生成する新しい医用画像生成フレームワークを提案する。
本稿では,病理所見から導かれる拡散モデルを用いて病理像をモデル化し,種々の対物画像の生成を可能にする。
論文 参考訳(メタデータ) (2025-04-20T01:54:18Z) - Trustworthy image-to-image translation: evaluating uncertainty calibration in unpaired training scenarios [0.0]
マンモグラフィスクリーニングは乳がんの検出に有効な方法であり、早期診断を容易にする。
ディープニューラルネットワークはいくつかの研究で有効であることが示されているが、その傾向は一般化と誤診のリスクをかなり残している。
汎用性を向上させるために、未ペア型ニューラルスタイル転送モデルに基づくデータ拡張スキームが提案されている。
3つのオープンアクセスマンモグラフィーデータセットと1つの非医療画像データセットから解析した画像パッチを用いて、それらの性能を評価する。
論文 参考訳(メタデータ) (2025-01-29T11:09:50Z) - Reconstruction of Patient-Specific Confounders in AI-based Radiologic
Image Interpretation using Generative Pretraining [12.656718786788758]
本稿では,DiffChestと呼ばれる自己条件拡散モデルを提案し,胸部X線画像のデータセット上で訓練する。
DiffChest氏は、患者固有のレベルでの分類を説明し、モデルを誤解させる可能性のある要因を視覚化する。
本研究は,医用画像分類における拡散モデルに基づく事前訓練の可能性を明らかにするものである。
論文 参考訳(メタデータ) (2023-09-29T10:38:08Z) - MedFMC: A Real-world Dataset and Benchmark For Foundation Model
Adaptation in Medical Image Classification [41.16626194300303]
ファンデーションモデルは、多くの場合、大規模なデータで事前訓練されているが、様々なビジョンや言語アプリケーションのジャンプ開始において、最も成功している。
最近の進歩により、下流タスクにおける基礎モデルの適応は、少数のトレーニングサンプルだけで効率的に行えるようになった。
しかし, 医用画像解析におけるそのような学習パラダイムの適用は, 一般に公開されているデータやベンチマークが不足しているため, 依然として少ない。
論文 参考訳(メタデータ) (2023-06-16T01:46:07Z) - Significantly improving zero-shot X-ray pathology classification via fine-tuning pre-trained image-text encoders [50.689585476660554]
本稿では,正対損失緩和とランダムな文サンプリングを含む新たな微調整手法を提案する。
提案手法は,胸部X線データセットと3つの事前訓練モデル間のゼロショット病理分類を一貫して改善する。
論文 参考訳(メタデータ) (2022-12-14T06:04:18Z) - Fluorescence angiography classification in colorectal surgery -- A
preliminary report [8.075715438276244]
本研究の目的は, 大腸組織を蛍光血管造影データに基づいて "perfused" あるいは "not perfused" と分類する人工知能アルゴリズムを開発することである。
アルゴリズムをデプロイするWebベースのアプリが利用可能になった。
論文 参考訳(メタデータ) (2022-06-13T07:10:59Z) - Application of Transfer Learning and Ensemble Learning in Image-level
Classification for Breast Histopathology [9.037868656840736]
CAD(Computer-Aided Diagnosis)では、従来の分類モデルでは、主に1つのネットワークを使って特徴を抽出する。
本稿では良性病変と悪性病変のバイナリ分類のための画像レベルラベルに基づく深層アンサンブルモデルを提案する。
結果: アンサンブルネットワークモデルにおいて、画像レベルのバイナリ分類は9,8.90%の精度を達成する。
論文 参考訳(メタデータ) (2022-04-18T13:31:53Z) - Harmonizing Pathological and Normal Pixels for Pseudo-healthy Synthesis [68.5287824124996]
そこで本研究では,新しいタイプの識別器であるセグメンタを提案し,病変の正確な特定と擬似健康画像の視覚的品質の向上を図っている。
医用画像強調に生成画像を適用し,低コントラスト問題に対処するために拡張結果を利用する。
BraTSのT2モダリティに関する総合的な実験により、提案手法は最先端の手法よりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2022-03-29T08:41:17Z) - Variational Knowledge Distillation for Disease Classification in Chest
X-Rays [102.04931207504173]
我々は,X線に基づく疾患分類のための新しい確率的推論フレームワークである反復的知識蒸留(VKD)を提案する。
提案手法の有効性を,X線画像とEHRを用いた3つの公開ベンチマークデータセットに示す。
論文 参考訳(メタデータ) (2021-03-19T14:13:56Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。