論文の概要: Doctor Approved: Generating Medically Accurate Skin Disease Images through AI-Expert Feedback
- arxiv url: http://arxiv.org/abs/2506.12323v1
- Date: Sat, 14 Jun 2025 03:15:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-17 17:28:45.79994
- Title: Doctor Approved: Generating Medically Accurate Skin Disease Images through AI-Expert Feedback
- Title(参考訳): 医師承認:AI-Expertのフィードバックで正確な皮膚疾患の画像を生成する
- Authors: Janet Wang, Yunbei Zhang, Zhengming Ding, Jihun Hamm,
- Abstract要約: 本稿では,データ拡張のための臨床的精度の高い皮膚疾患像を合成する新しいフレームワークMAGICを提案する。
提案手法は,専門家定義基準を,DM画像合成のための実用的なフィードバックに創造的に変換する。
- 参考スコア(独自算出の注目度): 43.1078084014722
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Paucity of medical data severely limits the generalizability of diagnostic ML models, as the full spectrum of disease variability can not be represented by a small clinical dataset. To address this, diffusion models (DMs) have been considered as a promising avenue for synthetic image generation and augmentation. However, they frequently produce medically inaccurate images, deteriorating the model performance. Expert domain knowledge is critical for synthesizing images that correctly encode clinical information, especially when data is scarce and quality outweighs quantity. Existing approaches for incorporating human feedback, such as reinforcement learning (RL) and Direct Preference Optimization (DPO), rely on robust reward functions or demand labor-intensive expert evaluations. Recent progress in Multimodal Large Language Models (MLLMs) reveals their strong visual reasoning capabilities, making them adept candidates as evaluators. In this work, we propose a novel framework, coined MAGIC (Medically Accurate Generation of Images through AI-Expert Collaboration), that synthesizes clinically accurate skin disease images for data augmentation. Our method creatively translates expert-defined criteria into actionable feedback for image synthesis of DMs, significantly improving clinical accuracy while reducing the direct human workload. Experiments demonstrate that our method greatly improves the clinical quality of synthesized skin disease images, with outputs aligning with dermatologist assessments. Additionally, augmenting training data with these synthesized images improves diagnostic accuracy by +9.02% on a challenging 20-condition skin disease classification task, and by +13.89% in the few-shot setting.
- Abstract(参考訳): 医学データの正確さは、診断MLモデルの一般化可能性を大幅に制限するが、病気の多様性の完全なスペクトルは、小さな臨床データセットでは表現できない。
これを解決するために、拡散モデル(DM)は、合成画像の生成と拡張のための有望な道として考えられてきた。
しかし、彼らはしばしば医療的に不正確な画像を生成し、モデルの性能を劣化させる。
専門分野の知識は臨床情報を正しくエンコードする画像の合成に不可欠であり、特にデータ不足や品質が量を上回っている場合である。
強化学習(RL)や直接選好最適化(DPO)といった、人間のフィードバックを取り入れるための既存のアプローチは、堅牢な報酬機能や労働集約的な専門家評価に依存している。
MLLM(Multimodal Large Language Models)の最近の進歩は、その強力な視覚的推論能力を示し、候補を評価対象にしている。
本研究では,臨床的に正確な皮膚疾患画像の合成を行うMAGIC(Medically Accurate Generation of Images through AI-Expert Collaboration)を提案する。
提案手法は,専門家定義基準をDM画像合成のための実用的なフィードバックに創造的に変換し,直接作業負荷を低減しつつ,臨床精度を大幅に向上させる。
本手法は皮膚疾患画像の臨床的品質を大幅に改善し,皮膚科医による評価と一致した出力が得られた。
さらに、これらの合成画像を用いてトレーニングデータを増強することで、困難な20条件の皮膚疾患分類タスクにおいて、診断精度が+9.02%向上し、また、+13.89%向上する。
関連論文リスト
- Eyes Tell the Truth: GazeVal Highlights Shortcomings of Generative AI in Medical Imaging [6.9112781921075195]
本稿では,専門的な視線追跡データと直接放射線学的評価を併用して,合成医用画像の品質評価を行うフレームワークであるGazeValを紹介する。
16人の放射線学者による実験により、生成された画像の96.6%が偽物であることが判明した。
論文 参考訳(メタデータ) (2025-03-26T20:11:07Z) - Latent Drifting in Diffusion Models for Counterfactual Medical Image Synthesis [55.959002385347645]
遅延ドリフトにより、医療画像に対して拡散モデルを条件付けし、反ファクト画像生成の複雑なタスクに適合させることができる。
我々は,脳MRIと胸部X線による3つの時系列的ベンチマークデータセットを用いて,対物画像生成法について検討した。
論文 参考訳(メタデータ) (2024-12-30T01:59:34Z) - Clinical Evaluation of Medical Image Synthesis: A Case Study in Wireless Capsule Endoscopy [63.39037092484374]
人工知能(AI)に基づく合成データ生成は、臨床医学の届け方を変えることができる。
本研究は,無線カプセル内視鏡(WCE)画像を用いた炎症性腸疾患(IBD)の診断における概念実証による医療用SDGの臨床評価に焦点を当てた。
その結果、TIDE-IIは、最先端の生成モデルと比較して品質が向上し、臨床的に可塑性で、非常に現実的なWCE画像を生成することがわかった。
論文 参考訳(メタデータ) (2024-10-31T19:48:50Z) - Radiology Report Generation Using Transformers Conditioned with
Non-imaging Data [55.17268696112258]
本稿では,胸部X線画像と関連する患者の人口統計情報を統合したマルチモーダルトランスフォーマーネットワークを提案する。
提案ネットワークは、畳み込みニューラルネットワークを用いて、CXRから視覚的特徴を抽出し、その視覚的特徴と患者の人口統計情報のセマンティックテキスト埋め込みを組み合わせたトランスフォーマーベースのエンコーダデコーダネットワークである。
論文 参考訳(メタデータ) (2023-11-18T14:52:26Z) - Revamping AI Models in Dermatology: Overcoming Critical Challenges for
Enhanced Skin Lesion Diagnosis [8.430482797862926]
我々は、分散-textbfClinical TriageモデルのオールインワンのtextbfHierarchical-textbfOutを示す。
臨床画像では,階層的予測,アウト・オブ・ディストリビューション画像の警告,皮膚内視鏡の推奨の3つの出力を生成する。
我々の汎用モデルは、病変診断のための貴重な意思決定支援を提供し、医療AI応用の有望な先例を定めている。
論文 参考訳(メタデータ) (2023-11-02T06:08:49Z) - DiffBoost: Enhancing Medical Image Segmentation via Text-Guided Diffusion Model [3.890243179348094]
医療応用のための堅牢で成功したディープラーニングモデルを開発するためには、大規模で大きな変動のある高品質なデータが不可欠である。
本稿では,DiffBoostと呼ばれる医用画像合成のための制御可能な拡散モデルを提案する。
近年の拡散確率モデルを利用して、現実的で多様な合成医用画像データを生成する。
論文 参考訳(メタデータ) (2023-10-19T16:18:02Z) - Augmenting medical image classifiers with synthetic data from latent
diffusion models [12.077733447347592]
我々は,潜伏拡散モデルが皮膚疾患の画像を生成することを実証した。
我々は,複数の生成戦略を用いて生成した458,920個の合成画像の新しいデータセットを生成し,解析する。
論文 参考訳(メタデータ) (2023-08-23T22:34:49Z) - Aligning Synthetic Medical Images with Clinical Knowledge using Human
Feedback [22.390670838355295]
本稿では,臨床応用可能な合成医用画像を作成するための病理医用ループフレームワークを提案する。
人間のフィードバックは, 画像の忠実度, 多様性, 下流での実用性, 信頼性を, 専門家によって評価され, 画像の質を著しく向上させることを示した。
論文 参考訳(メタデータ) (2023-06-16T21:54:20Z) - Variational Knowledge Distillation for Disease Classification in Chest
X-Rays [102.04931207504173]
我々は,X線に基づく疾患分類のための新しい確率的推論フレームワークである反復的知識蒸留(VKD)を提案する。
提案手法の有効性を,X線画像とEHRを用いた3つの公開ベンチマークデータセットに示す。
論文 参考訳(メタデータ) (2021-03-19T14:13:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。