論文の概要: Knowledge-Driven Vision-Language Model for Plexus Detection in Hirschsprung's Disease
- arxiv url: http://arxiv.org/abs/2510.21083v1
- Date: Fri, 24 Oct 2025 01:42:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 09:00:15.35201
- Title: Knowledge-Driven Vision-Language Model for Plexus Detection in Hirschsprung's Disease
- Title(参考訳): Hirschsprung病におけるプレクサ検出のための知識駆動型視覚言語モデル
- Authors: Youssef Megahed, Atallah Madi, Dina El Demellawy, Adrian D. C. Chan,
- Abstract要約: ヒルシュスプルング病(ヒルシュスプルングかん、Hirschsprung's disease)は、大腸のいくつかの部分にあるガングリオン細胞の先天性欠失である。
畳み込みニューラルネットワークのようなディープラーニングアプローチはこのタスクで非常にうまく機能している。
本稿では,専門家由来のテキスト概念を視覚言語モデルに統合し,複雑な分類を導く新しいフレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Hirschsprung's disease is defined as the congenital absence of ganglion cells in some segment(s) of the colon. The muscle cannot make coordinated movements to propel stool in that section, most commonly leading to obstruction. The diagnosis and treatment for this disease require a clear identification of different region(s) of the myenteric plexus, where ganglion cells should be present, on the microscopic view of the tissue slide. While deep learning approaches, such as Convolutional Neural Networks, have performed very well in this task, they are often treated as black boxes, with minimal understanding gained from them, and may not conform to how a physician makes decisions. In this study, we propose a novel framework that integrates expert-derived textual concepts into a Contrastive Language-Image Pre-training-based vision-language model to guide plexus classification. Using prompts derived from expert sources (e.g., medical textbooks and papers) generated by large language models and reviewed by our team before being encoded with QuiltNet, our approach aligns clinically relevant semantic cues with visual features. Experimental results show that the proposed model demonstrated superior discriminative capability across different classification metrics as it outperformed CNN-based models, including VGG-19, ResNet-18, and ResNet-50; achieving an accuracy of 83.9%, a precision of 86.6%, and a specificity of 87.6%. These findings highlight the potential of multi-modal learning in histopathology and underscore the value of incorporating expert knowledge for more clinically relevant model outputs.
- Abstract(参考訳): ヒルシュスプルング病は、結腸の一部分節におけるガングリオン細胞の先天性欠如として定義される。
筋肉は、その部分でスツールをプロペラするために協調的な動きをすることができず、最も一般的には閉塞につながる。
この疾患の診断と治療には、組織スライドの顕微鏡的観察から、神経節細胞の存在が求められる腸間膜叢の異なる領域の明確な同定が必要である。
畳み込みニューラルネットワークのようなディープラーニングアプローチは、このタスクで非常にうまく機能しているが、それらはブラックボックスとして扱われることが多く、医師の意思決定方法に従わない可能性がある。
本研究では,専門家由来のテキスト概念をコントラスト言語-画像事前学習に基づく視覚言語モデルに統合し,複雑な分類を導く新しいフレームワークを提案する。
QuiltNetで符号化される前に、大規模な言語モデルによって生成され、我々のチームによってレビューされた専門家(例えば、医学教科書や論文)から派生したプロンプトを用いて、我々のアプローチは、臨床的に関連する意味的手がかりと視覚的特徴とを一致させる。
実験の結果,提案モデルは,VGG-19,ResNet-18,ResNet-50などのCNNモデルよりも優れた識別能力を示し,精度は83.9%,精度は86.6%,特異性は87.6%であった。
これらの知見は、病理学におけるマルチモーダルラーニングの可能性を強調し、より臨床的に関係のあるモデルアウトプットに専門知識を取り入れることの価値を強調した。
関連論文リスト
- Fusion-Based Brain Tumor Classification Using Deep Learning and Explainable AI, and Rule-Based Reasoning [0.0]
本研究では,MobileNetV2とDenseNet121畳み込みニューラルネットワーク(CNN)を組み合わせたアンサンブルに基づくディープラーニングフレームワークを提案する。
モデルは、階層化された5倍のクロスバリデーションプロトコルを使用して、Figshareデータセット上でトレーニングされ、評価された。
このアンサンブルは個々のCNNよりも優れた性能を示し、精度は91.7%、精度は91.9%、リコールは91.7%、F1スコアは91.6%だった。
論文 参考訳(メタデータ) (2025-08-09T08:46:36Z) - Comparison of ConvNeXt and Vision-Language Models for Breast Density Assessment in Screening Mammography [39.58317527488534]
本研究では,BI-RADSシステムを用いた自動分類のためのマルチモーダル法とCNN法の比較を行った。
ゼロショット分類は、微調整されたConvNeXtモデルがBioMedCLIP線形プローブよりも優れた性能を示した。
これらの結果から, マルチモーダル学習の約束にもかかわらず, エンドツーエンドの微調整を施したCNNモデルの方が, 医用画像の特化に有効であることが示唆された。
論文 参考訳(メタデータ) (2025-06-16T20:14:37Z) - Aiding Medical Diagnosis through Image Synthesis and Classification [0.0]
本稿では,テキスト記述からリアルな医用画像を生成するシステムを提案する。
PathMNISTデータセット上で,Low-Rank Adaptation (LoRA) を用いて事前訓練した安定拡散モデルを微調整した。
ResNet-18の分類モデルは同じデータセットで訓練され、正確なラベルを検出する精度は99.76%に達した。
論文 参考訳(メタデータ) (2025-06-01T02:25:43Z) - A Knowledge-enhanced Pathology Vision-language Foundation Model for Cancer Diagnosis [58.85247337449624]
本稿では,疾患知識を階層型セマンティックグループ内のアライメントに組み込む知識強化型視覚言語事前学習手法を提案する。
KEEPはゼロショット癌診断タスクにおいて最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-12-17T17:45:21Z) - Robust and Interpretable Medical Image Classifiers via Concept
Bottleneck Models [49.95603725998561]
本稿では,自然言語の概念を用いた堅牢で解釈可能な医用画像分類器を構築するための新しいパラダイムを提案する。
具体的には、まず臨床概念をGPT-4から検索し、次に視覚言語モデルを用いて潜在画像の特徴を明示的な概念に変換する。
論文 参考訳(メタデータ) (2023-10-04T21:57:09Z) - Medulloblastoma Tumor Classification using Deep Transfer Learning with
Multi-Scale EfficientNets [63.62764375279861]
本稿では,エンド・ツー・エンドのMB腫瘍分類を提案し,様々な入力サイズとネットワーク次元の一致した移動学習を提案する。
161ケースのデータセットを用いて、より大規模な入力解像度を持つ事前学習されたEfficientNetが、大幅な性能改善をもたらすことを実証した。
論文 参考訳(メタデータ) (2021-09-10T13:07:11Z) - Acute Lymphoblastic Leukemia Detection from Microscopic Images Using
Weighted Ensemble of Convolutional Neural Networks [4.095759108304108]
本稿では,深層畳み込みニューラルネットワーク(cnns)を用いた顕微鏡細胞画像からの全検出タスクを自動化した。
ネットワークのより優れた一般化を達成するために、様々なデータ拡張と前処理が組み込まれている。
提案する重み付きアンサンブルモデルでは, アンサンブル候補のカッパ値を重みとして, 重み付きF1スコア88.6 %, バランス付き精度86.2 %, 予備試験セットのAUC0.941を出力した。
論文 参考訳(メタデータ) (2021-05-09T18:58:48Z) - Relational Subsets Knowledge Distillation for Long-tailed Retinal
Diseases Recognition [65.77962788209103]
本研究では,長尾データを知識に基づいて複数のクラスサブセットに分割し,クラスサブセット学習を提案する。
モデルがサブセット固有の知識の学習に集中するように強制する。
提案手法は長期網膜疾患認識タスクに有効であることが判明した。
論文 参考訳(メタデータ) (2021-04-22T13:39:33Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Weakly supervised multiple instance learning histopathological tumor
segmentation [51.085268272912415]
スライド画像全体のセグメント化のための弱教師付きフレームワークを提案する。
トレーニングモデルに複数のインスタンス学習スキームを利用する。
提案するフレームワークは,The Cancer Genome AtlasとPatchCamelyonデータセットのマルチロケーションとマルチ中心公開データに基づいて評価されている。
論文 参考訳(メタデータ) (2020-04-10T13:12:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。