論文の概要: Retrieval-Augmented VLMs for Multimodal Melanoma Diagnosis
- arxiv url: http://arxiv.org/abs/2509.08338v1
- Date: Wed, 10 Sep 2025 07:23:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-11 15:16:52.338523
- Title: Retrieval-Augmented VLMs for Multimodal Melanoma Diagnosis
- Title(参考訳): マルチモーダルメラノーマ診断のための検索用VLM
- Authors: Jihyun Moon, Charmgil Hong,
- Abstract要約: 視覚言語モデル(VLM)はマルチモーダルな代替手段を提供するが、一般的なドメインデータで訓練されたときに臨床特異性を捉えるのに苦労する。
本稿では, 意味論的に類似した症例を診断プロンプトに組み込んだ検索拡張VLMフレームワークを提案する。
- 参考スコア(独自算出の注目度): 1.2031796234206136
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate and early diagnosis of malignant melanoma is critical for improving patient outcomes. While convolutional neural networks (CNNs) have shown promise in dermoscopic image analysis, they often neglect clinical metadata and require extensive preprocessing. Vision-language models (VLMs) offer a multimodal alternative but struggle to capture clinical specificity when trained on general-domain data. To address this, we propose a retrieval-augmented VLM framework that incorporates semantically similar patient cases into the diagnostic prompt. Our method enables informed predictions without fine-tuning and significantly improves classification accuracy and error correction over conventional baselines. These results demonstrate that retrieval-augmented prompting provides a robust strategy for clinical decision support.
- Abstract(参考訳): 悪性黒色腫の正確な早期診断は,患者の予後改善に重要である。
畳み込みニューラルネットワーク(CNN)は、皮膚内視鏡画像解析において有望であるが、臨床メタデータを無視し、広範囲の事前処理を必要とすることが多い。
視覚言語モデル(VLM)はマルチモーダルな代替手段を提供するが、一般的なドメインデータで訓練されたときに臨床特異性を捉えるのに苦労する。
そこで本研究では,意味論的に類似した症例を診断プロンプトに組み込んだ検索拡張VLMフレームワークを提案する。
提案手法は,微調整をせずに情報予測が可能であり,従来のベースラインに対する分類精度と誤り訂正を大幅に改善する。
これらの結果は,検索強化プロンプトが臨床意思決定支援の堅牢な戦略であることを示している。
関連論文リスト
- Lightweight Joint Optimization of General-Purpose Vision-Language Models and Retrievers for Medical Diagnosis [9.248806116103605]
マルチモーダルレトリバーとLVLMを併用した医用診断モデルを開発した。
汎用バックボーンのみを用いて、軽量な微調整だけで、我々のモデルは競争的な結果を得ることができることを示す。
論文 参考訳(メタデータ) (2025-08-24T15:06:20Z) - KERAP: A Knowledge-Enhanced Reasoning Approach for Accurate Zero-shot Diagnosis Prediction Using Multi-agent LLMs [39.47350988195002]
大きな言語モデル(LLM)は、診断予測に言語能力と生物医学的知識を活用することを約束している。
我々は,知識グラフ(KG)を用いた多エージェントアーキテクチャによるLLMに基づく診断予測を改善する推論手法であるKERAPを提案する。
本フレームワークは, マッピング用リンクエージェント, 構造化知識抽出用検索エージェント, 診断予測を反復的に洗練する予測エージェントから構成される。
論文 参考訳(メタデータ) (2025-07-03T16:35:11Z) - Test-Time-Scaling for Zero-Shot Diagnosis with Visual-Language Reasoning [37.37330596550283]
視覚言語モデルを用いた信頼性のある医用画像診断のためのフレームワークを提案する。
テストタイムスケーリング戦略は、複数の候補出力を信頼性のある最終診断に集約する。
様々な医用画像モダリティにまたがるアプローチを評価する。
論文 参考訳(メタデータ) (2025-06-11T22:23:38Z) - Structured Outputs Enable General-Purpose LLMs to be Medical Experts [50.02627258858336]
大規模言語モデル(LLM)は、しばしばオープンエンドの医学的問題に苦しむ。
本稿では,構造化医療推論を利用した新しいアプローチを提案する。
我々の手法は85.8のファクチュアリティスコアを達成し、微調整されたモデルを上回る。
論文 参考訳(メタデータ) (2025-03-05T05:24:55Z) - Insight: A Multi-Modal Diagnostic Pipeline using LLMs for Ocular Surface Disease Diagnosis [17.970320199904084]
眼表面疾患の診断に大規模言語モデル(LLM)を用いた,革新的なマルチモーダル診断パイプライン(MDPipe)を導入する。
これらの課題に対処するために,眼表面疾患の診断に大規模言語モデル(LLM)を用いることで,革新的なマルチモーダル診断パイプライン(MDPipe)を導入する。
論文 参考訳(メタデータ) (2024-10-01T00:23:05Z) - MAGDA: Multi-agent guideline-driven diagnostic assistance [43.15066219293877]
救急部門、地方病院、または未開発地域の診療所では、臨床医は訓練された放射線技師による高速な画像分析を欠いていることが多い。
本研究では,ゼロショットガイドライン駆動意思決定支援のための新しいアプローチを提案する。
我々は、患者診断に到達するために協調する、対照的な視覚言語モデルで強化された複数のLLMエージェントのシステムをモデル化する。
論文 参考訳(メタデータ) (2024-09-10T09:10:30Z) - Improving Multiple Sclerosis Lesion Segmentation Across Clinical Sites:
A Federated Learning Approach with Noise-Resilient Training [75.40980802817349]
深層学習モデルは、自動的にMS病変を分節する約束を示しているが、正確な注釈付きデータの不足は、この分野の進歩を妨げている。
我々は,MS病変の不均衡分布とファジィ境界を考慮したDecoupled Hard Label Correction(DHLC)戦略を導入する。
また,集約型中央モデルを利用したCELC(Centrally Enhanced Label Correction)戦略も導入した。
論文 参考訳(メタデータ) (2023-08-31T00:36:10Z) - A Transformer-based representation-learning model with unified
processing of multimodal input for clinical diagnostics [63.106382317917344]
本稿では,マルチモーダル入力を統一的に処理する臨床診断支援として,トランスフォーマーを用いた表現学習モデルについて報告する。
統一モデルは, 肺疾患の同定において, 画像のみのモデル, 非統一型マルチモーダル診断モデルより優れていた。
論文 参考訳(メタデータ) (2023-06-01T16:23:47Z) - Inheritance-guided Hierarchical Assignment for Clinical Automatic
Diagnosis [50.15205065710629]
臨床診断は、臨床ノートに基づいて患者に診断符号を割り当てることを目的としており、臨床意思決定において重要な役割を担っている。
本稿では,臨床自動診断のための継承誘導階層と共起グラフの伝播を組み合わせた新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-01-27T13:16:51Z) - Explaining Clinical Decision Support Systems in Medical Imaging using
Cycle-Consistent Activation Maximization [112.2628296775395]
ディープニューラルネットワークを用いた臨床意思決定支援は、着実に関心が高まりつつあるトピックとなっている。
臨床医は、その根底にある意思決定プロセスが不透明で理解しにくいため、この技術の採用をためらうことが多い。
そこで我々は,より小さなデータセットであっても,分類器決定の高品質な可視化を生成するCycleGANアクティベーションに基づく,新たな意思決定手法を提案する。
論文 参考訳(メタデータ) (2020-10-09T14:39:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。