論文の概要: A WDLoRA-Based Multimodal Generative Framework for Clinically Guided Corneal Confocal Microscopy Image Synthesis in Diabetic Neuropathy
- arxiv url: http://arxiv.org/abs/2602.13693v1
- Date: Sat, 14 Feb 2026 09:32:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-17 14:17:28.346787
- Title: A WDLoRA-Based Multimodal Generative Framework for Clinically Guided Corneal Confocal Microscopy Image Synthesis in Diabetic Neuropathy
- Title(参考訳): WDLoRAを用いた糖尿病性ニューロパチーにおける角膜共焦点顕微鏡画像合成のための多モード生成フレームワーク
- Authors: Xin Zhang, Liangxiu Han, Yue Shi, Yalin Zheng, Uazman Alam, Maryam Ferdousi, Rayaz Malik,
- Abstract要約: 糖尿病性末梢神経障害(DPN)における角膜共焦点顕微鏡による小線維損傷の評価
強靭で自動的なディープラーニングに基づく診断モデルの開発は、角膜神経形態学におけるラベル付きデータの不足ときめ細かい変化によって制限される。
臨床誘導CCM画像合成のためのWDLoRAに基づくマルチモーダル生成フレームワークを提案する。
- 参考スコア(独自算出の注目度): 8.701084151107652
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Corneal Confocal Microscopy (CCM) is a sensitive tool for assessing small-fiber damage in Diabetic Peripheral Neuropathy (DPN), yet the development of robust, automated deep learning-based diagnostic models is limited by scarce labelled data and fine-grained variability in corneal nerve morphology. Although Artificial Intelligence (AI)-driven foundation generative models excel at natural image synthesis, they often struggle in medical imaging due to limited domain-specific training, compromising the anatomical fidelity required for clinical analysis. To overcome these limitations, we propose a Weight-Decomposed Low-Rank Adaptation (WDLoRA)-based multimodal generative framework for clinically guided CCM image synthesis. WDLoRA is a parameter-efficient fine-tuning (PEFT) mechanism that decouples magnitude and directional weight updates, enabling foundation generative models to independently learn the orientation (nerve topology) and intensity (stromal contrast) required for medical realism. By jointly conditioning on nerve segmentation masks and disease-specific clinical prompts, the model synthesises anatomically coherent images across the DPN spectrum (Control, T1NoDPN, T1DPN). A comprehensive three-pillar evaluation demonstrates that the proposed framework achieves state-of-the-art visual fidelity (Fréchet Inception Distance (FID): 5.18) and structural integrity (Structural Similarity Index Measure (SSIM): 0.630), significantly outperforming GAN and standard diffusion baselines. Crucially, the synthetic images preserve gold-standard clinical biomarkers and are statistically equivalent to real patient data. When used to train automated diagnostic models, the synthetic dataset improves downstream diagnostic accuracy by 2.1% and segmentation performance by 2.2%, validating the framework's potential to alleviate data bottlenecks in medical AI.
- Abstract(参考訳): 角膜共焦点顕微鏡(CCM)は、糖尿病性末梢神経障害(DPN)の微小線維損傷を評価するための敏感なツールである。
人工知能(AI)による基礎生成モデルは、自然な画像合成において優れているが、ドメイン固有の訓練が限られており、臨床分析に必要な解剖学的忠実さを損なうため、しばしば医療画像に苦しむ。
これらの制約を克服するため,臨床誘導型CCM画像合成のためのWDLoRAに基づくマルチモーダル生成フレームワークを提案する。
WDLoRAは、パラメータ効率の良い微調整(PEFT)機構で、大きさと方向の重量の更新を分離し、基礎生成モデルが医療リアリズムに必要な方向(神経トポロジー)と強度(ストロームコントラスト)を独立に学習できるようにする。
神経セグメント化マスクと疾患特異的な臨床プロンプトを併用することにより、DPNスペクトル(Control, T1NoDPN, T1DPN)の解剖学的コヒーレントな画像を合成する。
総合的な3ピラー評価により,提案手法は現状の視覚的忠実度(Fréchet Inception Distance (FID): 5.18)と構造的整合性(Structural similarity Index Measure (SSIM): 0.630)を実現し,GANと標準拡散ベースラインを大きく上回った。
重要なことに、合成画像は金標準臨床バイオマーカーを保持し、実際の患者データと統計的に等価である。
自動診断モデルのトレーニングに使用すると、合成データセットは下流の診断精度を2.1%改善し、セグメンテーション性能を2.2%向上させる。
関連論文リスト
- Beyond CLIP: Knowledge-Enhanced Multimodal Transformers for Cross-Modal Alignment in Diabetic Retinopathy Diagnosis [7.945705180020063]
本稿では,網膜基底像,臨床テキスト,構造化された患者データを統合する知識強化型関節埋め込みフレームワークを提案する。
このフレームワークはRecall@1の99.94%でほぼ完璧なテキスト・ツー・イメージ検索性能を実現している。
論文 参考訳(メタデータ) (2025-12-22T18:41:45Z) - A Semantically Enhanced Generative Foundation Model Improves Pathological Image Synthesis [82.01597026329158]
本稿では,組織合成のための相関調整フレームワーク(CRAFTS)について紹介する。
CRAFTSは、生物学的精度を確保するためにセマンティックドリフトを抑制する新しいアライメント機構を組み込んでいる。
本モデルは,30種類の癌にまたがる多彩な病理像を生成する。
論文 参考訳(メタデータ) (2025-12-15T10:22:43Z) - Automated Labeling of Intracranial Arteries with Uncertainty Quantification Using Deep Learning [2.6279333406008476]
3D Time-of-light Magnetic Resonance Angiography (3D ToF-MRA) を用いたディープラーニングによる自動動脈ラベル作成フレームワークを提案する。
我々のフレームワークは、自動脳血管ラベリングのためのスケーラブルで正確で不確実なソリューションを提供し、下流血行動態解析をサポートし、臨床統合を容易にする。
論文 参考訳(メタデータ) (2025-09-22T12:57:21Z) - Clinically-guided Data Synthesis for Laryngeal Lesion Detection [2.573786844054239]
そこで本研究では,Lyngeal endoscopic image-annotation pairを生成するために,Latent Diffusion Model(LDM)とControlNetアダプタを併用した新しいアプローチを提案する。
提案手法はCADx/eモデルのトレーニングデータセットの拡張に有効であり,喉頭科学における評価プロセスの強化に有効である。
論文 参考訳(メタデータ) (2025-08-08T09:55:54Z) - RadFabric: Agentic AI System with Reasoning Capability for Radiology [61.25593938175618]
RadFabricは、総合的なCXR解釈のための視覚的およびテキスト分析を統合するマルチエージェント、マルチモーダル推論フレームワークである。
システムは、病理診断に特殊なCXRエージェント、正確な解剖学的構造に視覚所見をマッピングする解剖学的解釈エージェント、および視覚的、解剖学的、臨床データを透明かつ証拠に基づく診断に合成する大規模なマルチモーダル推論モデルを利用した推論エージェントを使用する。
論文 参考訳(メタデータ) (2025-06-17T03:10:33Z) - Clinical Evaluation of Medical Image Synthesis: A Case Study in Wireless Capsule Endoscopy [63.39037092484374]
人工知能(AI)に基づく合成データ生成は、臨床医学の届け方を変えることができる。
本研究は,無線カプセル内視鏡(WCE)画像を用いた炎症性腸疾患(IBD)の診断における概念実証による医療用SDGの臨床評価に焦点を当てた。
その結果、TIDE-IIは、最先端の生成モデルと比較して品質が向上し、臨床的に可塑性で、非常に現実的なWCE画像を生成することがわかった。
論文 参考訳(メタデータ) (2024-10-31T19:48:50Z) - Confidence-guided Lesion Mask-based Simultaneous Synthesis of Anatomic
and Molecular MR Images in Patients with Post-treatment Malignant Gliomas [65.64363834322333]
信頼性ガイドSAMR(CG-SAMR)は、病変情報からマルチモーダル解剖学的配列にデータを合成する。
モジュールは中間結果に対する信頼度測定に基づいて合成をガイドする。
実際の臨床データを用いた実験により,提案モデルが最先端の合成法よりも優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2020-08-06T20:20:22Z) - Lesion Mask-based Simultaneous Synthesis of Anatomic and MolecularMR
Images using a GAN [59.60954255038335]
提案するフレームワークは,ストレッチアウトアップサンプリングモジュール,ブレインアトラスエンコーダ,セグメンテーション一貫性モジュール,マルチスケールラベルワイド識別器から構成される。
実際の臨床データを用いた実験により,提案モデルが最先端の合成法よりも優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2020-06-26T02:50:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。