論文の概要: Pathology-Aware Prototype Evolution via LLM-Driven Semantic Disambiguation for Multicenter Diabetic Retinopathy Diagnosis
- arxiv url: http://arxiv.org/abs/2511.22033v1
- Date: Thu, 27 Nov 2025 02:35:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-01 19:47:55.360736
- Title: Pathology-Aware Prototype Evolution via LLM-Driven Semantic Disambiguation for Multicenter Diabetic Retinopathy Diagnosis
- Title(参考訳): マルチセンター糖尿病網膜症診断におけるLCMによるセマンティック・アンビグレーションによる病態認識型プロトタイプ進化
- Authors: Chunzheng Zhu, Yangfang Lin, Jialin Shao, Jianxin Lin, Yijun Wang,
- Abstract要約: 糖尿病網膜症のグレーディングを容易にするための階層型アンカープロトタイプ変調(HAPM)フレームワークを提案する。
まず、領域不変な病理パターンを保存する分散スペクトル駆動型アンカープロトタイプライブラリを紹介する。
さらに、LVLMおよびLLMソースから識別的意味的プロンプトを動的に選択する階層的微分プロンプトゲーティング機構を用いる。
- 参考スコア(独自算出の注目度): 9.502494574447253
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diabetic retinopathy (DR) grading plays a critical role in early clinical intervention and vision preservation. Recent explorations predominantly focus on visual lesion feature extraction through data processing and domain decoupling strategies. However, they generally overlook domain-invariant pathological patterns and underutilize the rich contextual knowledge of foundation models, relying solely on visual information, which is insufficient for distinguishing subtle pathological variations. Therefore, we propose integrating fine-grained pathological descriptions to complement prototypes with additional context, thereby resolving ambiguities in borderline cases. Specifically, we propose a Hierarchical Anchor Prototype Modulation (HAPM) framework to facilitate DR grading. First, we introduce a variance spectrum-driven anchor prototype library that preserves domain-invariant pathological patterns. We further employ a hierarchical differential prompt gating mechanism, dynamically selecting discriminative semantic prompts from both LVLM and LLM sources to address semantic confusion between adjacent DR grades. Finally, we utilize a two-stage prototype modulation strategy that progressively integrates clinical knowledge into visual prototypes through a Pathological Semantic Injector (PSI) and a Discriminative Prototype Enhancer (DPE). Extensive experiments across eight public datasets demonstrate that our approach achieves pathology-guided prototype evolution while outperforming state-of-the-art methods. The code is available at https://github.com/zhcz328/HAPM.
- Abstract(参考訳): 糖尿病網膜症(DR)グレーディングは早期臨床介入と視力維持において重要な役割を担っている。
最近の調査は、主にデータ処理とドメインデカップリング戦略による視覚障害の特徴抽出に焦点を当てている。
しかし、それらは一般的にドメイン不変の病理パターンを見落とし、視覚情報のみに頼って基礎モデルの豊富な文脈知識を過小評価し、微妙な病理学的変異を区別するには不十分である。
そこで本稿では,プロトタイプを補うために詳細な病理記述を統合することを提案し,境界線の場合の曖昧さを解消する。
具体的には、DRグレーディングを容易にする階層型アンカープロトタイプ変調(HAPM)フレームワークを提案する。
まず、領域不変な病理パターンを保存する分散スペクトル駆動型アンカープロトタイプライブラリを紹介する。
さらに、LVLMとLLMの両方の音源から識別的意味的プロンプトを動的に選択し、隣接するDRグレード間の意味的混乱に対処する階層的微分的プロンプトゲーティング機構を用いる。
最後に,臨床知識を段階的に視覚的プロトタイプに統合する2段階のプロトタイプを,病的セマンティックインジェクタ (PSI) と識別的プロトタイプエンハンサー (DPE) によって活用する。
8つの公開データセットにまたがる大規模な実験により、我々のアプローチは、最先端の手法を上回りながら、病理誘導されたプロトタイプの進化を実現することを示した。
コードはhttps://github.com/zhcz328/HAPMで公開されている。
関連論文リスト
- PathMR: Multimodal Visual Reasoning for Interpretable Pathology Diagnosis [9.728322291979564]
病理画像解析のための細胞レベルでのマルチモーダルビジュアル推論フレームワークであるPathMRを提案する。
PathMRは、テキスト生成品質、セグメンテーション精度、モーダルアライメントにおいて、最先端の視覚的推論手法よりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2025-08-28T14:46:24Z) - PathSegDiff: Pathology Segmentation using Diffusion model representations [63.20694440934692]
そこで我々は,Latent Diffusion Models (LDMs) を事前学習した特徴抽出器として活用する,病理組織像分割の新しい手法であるPathSegDiffを提案する。
本手法は,H&E染色組織像から多彩な意味情報を抽出するために,自己教師型エンコーダによって誘導される病理特異的LCMを用いる。
本実験は,BCSSおよびGlaSデータセットにおける従来の手法よりも大幅に改善されたことを示す。
論文 参考訳(メタデータ) (2025-04-09T14:58:21Z) - MIRROR: Multi-Modal Pathological Self-Supervised Representation Learning via Modality Alignment and Retention [57.044719143401664]
病理組織学と転写学は、腫瘍学の基本的なモダリティであり、疾患の形態学的および分子的側面を包含している。
モーダルアライメントと保持を両立させる新しいマルチモーダル表現学習法であるMIRRORを提案する。
がんの亜型化と生存分析のためのTCGAコホートに関する広範囲な評価は,MIRRORの優れた性能を浮き彫りにしている。
論文 参考訳(メタデータ) (2025-03-01T07:02:30Z) - Generalizing to Unseen Domains in Diabetic Retinopathy Classification [8.59772105902647]
糖尿病網膜症分類における分布や領域の特定にモデルを一般化する問題について検討した。
本稿では、視覚変換器の自己蒸留を実現するための、シンプルで効果的な領域一般化(DG)手法を提案する。
本稿では,オープンソースのDR分類データセット上での最先端DG手法の性能について報告する。
論文 参考訳(メタデータ) (2023-10-26T09:11:55Z) - Distribution Aligned Diffusion and Prototype-guided network for
Unsupervised Domain Adaptive Segmentation [19.043268288432156]
教師なしドメイン適応セグメンテーションのための拡散型およびプロトタイプ誘導型ネットワーク(DP-Net)を提案する。
提案手法の性能は信頼性が高く,最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-03-22T05:03:14Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。