論文の概要: When LLMs Analyze Scars: From Images to Clinically-Meaningful Features
- arxiv url: http://arxiv.org/abs/2606.18063v1
- Date: Tue, 16 Jun 2026 15:38:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-17 17:15:32.518086
- Title: When LLMs Analyze Scars: From Images to Clinically-Meaningful Features
- Title(参考訳): LLMがスカーズを解析する:画像から臨床的に意味のある特徴へ
- Authors: Ruman Wang, Hangting Ye,
- Abstract要約: 本稿では,大規模言語モデル(LLM)を知識駆動型機能エンジニアとして再配置する新しいパラダイムを提案する。
我々の重要な洞察は、LLMは、実行可能な特徴抽出コードとして外部化できる豊富な医療知識をエンコードしているということです。
提案手法は,(1)データ効率,限られたトレーニングサンプルによる堅牢なパフォーマンスの実現,(2)生画像が外部のLCMに晒されることなく局所的に処理されるプライバシー保護,(3)臨床理由に基づく明示的な特徴による解釈可能性,の3つの利点を提供する。
- 参考スコア(独自算出の注目度): 2.9744591948837615
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Medical image classification faces a fundamental dilemma: while deep learning models achieve remarkable performance at scale, real-world clinical scenarios often suffer from severe data scarcity due to annotation costs, privacy constraints, and disease rarity. This challenge is particularly pronounced in pathological scar classification, where differentiating keloids from hypertrophic scars requires subtle expert knowledge and labeled images are extremely limited. We propose a novel paradigm that repositions large language models (LLMs) as knowledge-driven feature engineers rather than end-to-end classifiers. We call this framework ScaFE (Scar Feature Engineering). Our key insight is that LLMs encode rich medical knowledge that can be externalized as executable feature extraction code, enabling the transformation of high-dimensional images into low-dimensional, clinically interpretable representations. Specifically, we prompt an LLM with established scar assessment criteria to generate deterministic Python code that extracts features aligned with clinical scoring systems such as the Vancouver Scar Scale. Our approach offers three key advantages: (1) data efficiency, achieving robust performance with limited training samples by decoupling knowledge acquisition from statistical learning; (2) privacy preservation, as raw images are processed locally without exposure to external LLMs; and (3) interpretability, through explicit features grounded in clinical reasoning. Extensive experiments on scar classification demonstrate that our method consistently outperforms end-to-end deep learning baselines or using LLMs as black-box classifiers under limited data conditions, establishing a promising direction for integrating LLMs into data-efficient and clinically transparent medical AI systems.
- Abstract(参考訳): 深層学習モデルは大規模なパフォーマンスを達成する一方で、実際の臨床シナリオは、アノテーションコスト、プライバシーの制約、病気の希少性によって深刻なデータ不足に悩まされることが多い。
この課題は、特に、高栄養な傷からケロイドを区別するためには、微妙な専門知識が必要であり、ラベル付き画像が極めて限られている、病理的傷跡分類において顕著である。
本稿では,大規模言語モデル(LLM)をエンド・ツー・エンドの分類器ではなく,知識駆動型機能エンジニアとして再配置する新しいパラダイムを提案する。
私たちはこのフレームワークをScaFE(Scar Feature Engineering)と呼んでいます。
我々の重要な洞察は、LCMは、実行可能な特徴抽出コードとして外部化できる豊富な医療知識を符号化し、高次元画像の低次元、臨床的に解釈可能な表現への変換を可能にすることである。
具体的には, バンクーバー・スカースケールなどの臨床評価システムに適合する特徴を抽出する決定論的Pythonコードを生成するために, 傷跡評価基準が確立されたLCMを誘導する。
提案手法は,(1)知識獲得を統計的学習から切り離し,限られたトレーニングサンプルで頑健なパフォーマンスを実現すること,(2)生画像が外部のLCMに晒されることなく局所的に処理されること,(3)臨床的理由に基づく明示的な特徴による解釈可能性,の3つの利点を提供する。
傷跡分類に関する広範囲な実験により,本手法は,データ条件が限られた場合において,エンド・ツー・エンドの深層学習ベースラインやLCMをブラックボックス分類器として使用することにより,LCMをデータ効率・臨床的に透過的な医療AIシステムに統合するための有望な方向性を確立した。
関連論文リスト
- Artificial Intolerance: Stigmatizing Language in Clinical Documentation Skews Large Language Model Decision-Making [13.79732306725696]
大規模言語モデル(LLM)は、臨床上の意思決定支援や医療ドキュメントなど、高度な領域にますます展開されている。
臨床テキストの処理において、フロンティアLSMが人間のバイアスを継承し、伝播するかどうかを検討する。
論文 参考訳(メタデータ) (2026-05-17T02:28:25Z) - Lost in the Hype: Revealing and Dissecting the Performance Degradation of Medical Multimodal Large Language Models in Image Classification [14.247959730104085]
マルチモーダル大言語モデル(MLLM)は、医療画像解析の分野で前例のない応用の波を引き起こしている。
しかし、医学画像分類では、最先端の医療MLLMは従来のディープラーニングモデルと比べて一貫して性能が劣っている。
本稿では、3つの代表的な画像分類データセットにまたがる14のオープンソース医療MLLMについて広範な実験を行った。
論文 参考訳(メタデータ) (2026-04-09T15:07:26Z) - LLaVA-RadZ: Can Multimodal Large Language Models Effectively Tackle Zero-shot Radiology Recognition? [59.81732629438753]
LLaVA-RadZは、既存のMLLM機能を利用して、ゼロショットの医療疾患認識のための、シンプルで効果的なフレームワークである。
具体的には、MLLMデコーダアーキテクチャの特性を活用するために、DFAT(Decoding-Side Feature Alignment Training)と呼ばれるエンドツーエンドのトレーニング戦略を設計する。
また,大規模モデルの本質的な医学的知識を活用するために,DKAM(Domain Knowledge Anchoring Module)を導入する。
論文 参考訳(メタデータ) (2025-03-10T16:05:40Z) - Fake It Till You Make It: Using Synthetic Data and Domain Knowledge for Improved Text-Based Learning for LGE Detection [11.532639713283226]
臨床報告からテキストを用いてLGE検出のモデルを訓練するために,ドメイン知識に根ざした戦略を用いる。
我々は、画像の向きを解剖学的に表現した方法で標準化し、空間的特徴とテキスト的特徴のより優れたアライメントを可能にする。
モデル全体の性能に対する各デザインコンポーネントの貢献を明らかにするためのアブレーション研究が実施されている。
論文 参考訳(メタデータ) (2025-02-18T15:30:48Z) - Mitigating Hallucinations of Large Language Models in Medical Information Extraction via Contrastive Decoding [92.32881381717594]
医療情報抽出タスクにおける幻覚の問題を解決するために,ALCD(ALternate Contrastive Decoding)を導入する。
ALCDは, 従来の復号法に比べて幻覚の解消に有意な改善が見られた。
論文 参考訳(メタデータ) (2024-10-21T07:19:19Z) - OTCXR: Rethinking Self-supervised Alignment using Optimal Transport for Chest X-ray Analysis [6.4136876268620115]
自己教師付き学習(SSL)は,X線などの医学的モダリティを解析するための有望な手法として登場した。
我々は,OTCXRを提案する。OTCXRは最適なトランスポート(OT)を利用して,密接なセマンティック不変性を学習する新しいSSLフレームワークである。
我々はOTCXRの有効性を3つの公開胸部X線データセットの総合的な実験により検証した。
論文 参考訳(メタデータ) (2024-04-18T02:59:48Z) - Self-Verification Improves Few-Shot Clinical Information Extraction [73.6905567014859]
大規模言語モデル (LLMs) は、数発のテキスト内学習を通じて臨床キュレーションを加速する可能性を示している。
正確性や解釈可能性に関する問題、特に健康のようなミッションクリティカルな領域ではまだ苦戦している。
本稿では,自己検証を用いた汎用的な緩和フレームワークについて検討する。このフレームワークはLLMを利用して,自己抽出のための証明を提供し,その出力をチェックする。
論文 参考訳(メタデータ) (2023-05-30T22:05:11Z) - Cross-modal Clinical Graph Transformer for Ophthalmic Report Generation [116.87918100031153]
眼科報告生成(ORG)のためのクロスモーダルな臨床グラフ変換器(CGT)を提案する。
CGTは、デコード手順を駆動する事前知識として、臨床関係を視覚特徴に注入する。
大規模FFA-IRベンチマークの実験は、提案したCGTが従来のベンチマーク手法より優れていることを示した。
論文 参考訳(メタデータ) (2022-06-04T13:16:30Z) - Assessing glaucoma in retinal fundus photographs using Deep Feature
Consistent Variational Autoencoders [63.391402501241195]
緑内障は症状が重くなるまで無症状のままでいるため、検出が困難である。
緑内障の早期診断は機能的,構造的,臨床的評価に基づいて行われることが多い。
ディープラーニング手法はこのジレンマを、マーカー識別段階をバイパスし、ハイレベルな情報を分析してデータを分類することで部分的に解決している。
論文 参考訳(メタデータ) (2021-10-04T16:06:49Z) - Uncovering the structure of clinical EEG signals with self-supervised
learning [64.4754948595556]
教師付き学習パラダイムは、しばしば利用可能なラベル付きデータの量によって制限される。
この現象は脳波(EEG)などの臨床関連データに特に問題となる。
ラベルのないデータから情報を抽出することで、ディープニューラルネットワークとの競合性能に到達することができるかもしれない。
論文 参考訳(メタデータ) (2020-07-31T14:34:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。