論文の概要: Infection-Reasoner: A Compact Vision-Language Model for Wound Infection Classification with Evidence-Grounded Clinical Reasoning
- arxiv url: http://arxiv.org/abs/2604.19937v1
- Date: Tue, 21 Apr 2026 19:28:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-23 15:36:10.762389
- Title: Infection-Reasoner: A Compact Vision-Language Model for Wound Infection Classification with Evidence-Grounded Clinical Reasoning
- Title(参考訳): Evidence-Grounded Clinical Reasoning を用いた感染診断用小型ビジョンランゲージモデル
- Authors: Palawat Busaranuvong, Reza Saadati Fard, Emmanuel Agu, Deepak Kumar, Shefalika Gautam, Bengisu Tulu, Diane Strong,
- Abstract要約: infection-Reasonerは、慢性的な創傷感染分類と合理性発生のためのコンパクトな推論的視覚言語モデルである。
86.8%の精度、86.4%の感度、87.1%の不均一な創傷データセットの特異性を達成している。
- 参考スコア(独自算出の注目度): 2.5133340839715443
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Assessing chronic wound infection from photographs is challenging because visual appearance varies across wound etiologies, anatomical locations, and imaging conditions. Prior image-based deep learning methods have mainly focused on classification with limited interpretability, despite the need for evidence-grounded explanations to support point-of-care decision making. We present Infection-Reasoner, a compact 4B-parameter reasoning vision-language model for chronic wound infection classification and rationale generation. To address the scarcity of expert-labeled wound images with reasoning annotations, Infection-Reasoner is trained using a two-stage pipeline: (1) reasoning distillation, in which GPT-5.1 generates chain-of-thought rationales for unlabeled wound images to initialize wound-specific reasoning in a smaller student model (Qwen3-VL-4B-Thinking), and (2) reinforcement learning post-training with Group Relative Policy Optimization on a small labeled infection dataset to refine classification reasoning. On a held-out heterogeneous wound dataset, Infection-Reasoner achieved 86.8\% accuracy, 86.4\% sensitivity, and 87.1\% specificity, outperforming several strong baselines, including GPT-5.1. Rationale quality was further evaluated using both multimodal large language model (MLLM) judges and wound expert review. Across four MLLM judges, visual-support agreement scores ranged from 0.722 to 0.903, while expert review rated 61.8\% of rationales as Correct and 32.4\% as Partially Correct.
- Abstract(参考訳): 画像から慢性の創傷感染を評価することは、傷の病因、解剖学的位置、画像条件によって視覚的外観が異なるため困難である。
従来の画像に基づく深層学習手法は主に、ポイント・オブ・ケアの意思決定を支援するための根拠に基づく説明が必要であるにもかかわらず、解釈可能性に制限のある分類に焦点を当ててきた。
慢性の創傷感染分類と合理性発生のための4Bパラメトリック推論視覚言語モデルであるImpacter-Reasonerを提案する。
1)GPT-5.1は、未ラベルの創傷画像に対するチェーン・オブ・シークエンスを発生させ、より小さな学生モデル(Qwen3-VL-4B-シンキング)における創傷特異的推論を初期化する蒸留、(2)グループ相対政策最適化による強化学習による分類推論の洗練、という2段階のパイプラインを用いて、専門家ラベル付き創傷画像の不足に対処する。
ヘテロジニアスな創傷データセットでは、IC-Reasonerは86.8\%の精度、86.4\%の感度、87.1\%の特異性を達成し、GPT-5.1を含むいくつかの強いベースラインを上回った。
マルチモーダル大言語モデル (MLLM) の判定と創傷専門家のレビューによる評価を行った。
MLLMの審査員4名中、視覚支援協定のスコアは0.722から0.903であり、専門家の評定では61.8\%が正解、32.4\%が部分的正当と評価された。
関連論文リスト
- Improving Automated Wound Assessment Using Joint Boundary Segmentation and Multi-Class Classification Models [1.1432909951914676]
本研究は, 創境界セグメンテーション (WBS) と創分類 (WC) を同時に行う YOLOv11 に基づく深層学習モデルを提案する。
その結果、複雑な背景に対するモデルの堅牢性とクラス内変動性が高いことが確認できた。
論文 参考訳(メタデータ) (2026-03-28T16:11:31Z) - Surg-R1: A Hierarchical Reasoning Foundation Model for Scalable and Interpretable Surgical Decision Support with Multi-Center Clinical Validation [51.897472694590356]
Surg-R1は4段階のパイプラインで訓練された階層的推論によってギャップに対処する手術的視覚言語モデルである。
提案手法では,(1)知覚的根拠,関係理解,文脈的推論に外科的解釈を分解する3段階の推論階層,(2)320,000の推論ペアを持つ最大の外科的チェーン・オブ・シークエンス・データセット,の3つの重要な貢献を紹介する。
論文 参考訳(メタデータ) (2026-03-12T20:26:28Z) - Beyond Calibration: Confounding Pathology Limits Foundation Model Specificity in Abdominal Trauma CT [8.050646314390763]
基礎モデルを臨床実践に翻訳するには、複合分布シフト下での性能を評価する必要がある。
基礎モデルの特異性欠陥が負のクラスにおける不均一性と関連しているかどうかを検討した。
論文 参考訳(メタデータ) (2026-02-10T23:08:06Z) - Scaling Down to Scale Up: Towards Operationally-Efficient and Deployable Clinical Models via Cross-Modal Low-Rank Adaptation for Medical Vision-Language Models [0.30586855806896035]
視覚言語による事前訓練によってトレーニングされた基礎モデルは、多様な画像領域にまたがる強力なゼロショット機能を示している。
MedCT-VLM(MedCT-VLM: Medical CT Vision-Language Model)を紹介する。
胸部疾患18例のゼロショット分類について検討し,CT埋め込みと未確認のテキストプロンプトを,タスク固有の訓練を伴わない推論で一致させなければならないことを示した。
論文 参考訳(メタデータ) (2025-11-29T19:03:25Z) - Diagnosing Hallucination Risk in AI Surgical Decision-Support: A Sequential Framework for Sequential Validation [5.469454486414467]
大言語モデル (LLMs) は脊椎手術における臨床的決定支援の転換的可能性を提供する。
LLMは幻覚を通じて重大なリスクを引き起こすが、これは事実的に矛盾しているか、文脈的に不一致な出力である。
本研究は, 診断精度, 推奨品質, 推理堅牢性, 出力コヒーレンス, 知識アライメントを評価することによって, 幻覚リスクを定量化するための臨床中心の枠組みを提案する。
論文 参考訳(メタデータ) (2025-11-01T15:25:55Z) - EchoBench: Benchmarking Sycophancy in Medical Large Vision-Language Models [82.43729208063468]
医療用LVLM(Large Vision-Language Models)の最近のベンチマークでは、信頼性と安全性を見越して、リーダボードの精度を強調している。
ユーザが提供した情報を非批判的に反響させる傾向のモデルについて検討する。
医療用LVLMの梅毒を系統的に評価するベンチマークであるEchoBenchを紹介する。
論文 参考訳(メタデータ) (2025-09-24T14:09:55Z) - Guided Conditional Diffusion Classifier (ConDiff) for Enhanced Prediction of Infection in Diabetic Foot Ulcers [2.4548085068515286]
ConDiffは、ガイド画像合成と条件付き認知拡散モデルと距離に基づく分類を組み合わせた、新しいディープラーニング感染検出モデルである。
ConDiffは83%、F1スコア0.858の精度で優れた性能を示し、最先端モデルよりも少なくとも3%高い性能を示した。
論文 参考訳(メタデータ) (2024-05-01T20:47:06Z) - Learning to diagnose cirrhosis from radiological and histological labels
with joint self and weakly-supervised pretraining strategies [62.840338941861134]
そこで本稿では, 放射線学者が注釈付けした大規模データセットからの転写学習を活用して, 小さい付加データセットで利用できる組織学的スコアを予測することを提案する。
我々は,肝硬変の予測を改善するために,異なる事前訓練法,すなわち弱い指導法と自己指導法を比較した。
この方法は、METAVIRスコアのベースライン分類を上回り、AUCが0.84、バランスの取れた精度が0.75に達する。
論文 参考訳(メタデータ) (2023-02-16T17:06:23Z) - Significantly improving zero-shot X-ray pathology classification via fine-tuning pre-trained image-text encoders [50.689585476660554]
本稿では,正対損失緩和とランダムな文サンプリングを含む新たな微調整手法を提案する。
提案手法は,胸部X線データセットと3つの事前訓練モデル間のゼロショット病理分類を一貫して改善する。
論文 参考訳(メタデータ) (2022-12-14T06:04:18Z) - Vision Transformers for femur fracture classification [59.99241204074268]
Vision Transformer (ViT) はテスト画像の83%を正確に予測することができた。
史上最大かつ最もリッチなデータセットを持つサブフラクチャーで良い結果が得られた。
論文 参考訳(メタデータ) (2021-08-07T10:12:42Z) - Malignancy Prediction and Lesion Identification from Clinical
Dermatological Images [65.1629311281062]
臨床皮膚画像から機械学習に基づく悪性度予測と病変の同定を検討する。
まず, サブタイプや悪性度に関わらず画像に存在するすべての病変を同定し, その悪性度を推定し, 凝集により, 画像レベルの悪性度も生成する。
論文 参考訳(メタデータ) (2021-04-02T20:52:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。