論文の概要: Translating Inference-Time Control to Radiology Vision-Language Models: Activation Steering for Pneumonia Classification on Chest X-rays
- arxiv url: http://arxiv.org/abs/2606.20852v1
- Date: Thu, 18 Jun 2026 18:36:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-26 12:33:36.008094
- Title: Translating Inference-Time Control to Radiology Vision-Language Models: Activation Steering for Pneumonia Classification on Chest X-rays
- Title(参考訳): 放射線ビジョン言語モデルへの推論時間制御:胸部X線上の肺炎分類のための活性化ステアリング
- Authors: Eduardo Moreno Judice de Mattos Farina, Mateus A. Esmeraldo, Felipe Akio Matsuoka, Paulo Eduardo de Aguiar Kuriki, Felipe Campos Kitamura,
- Abstract要約: 造影活性付加(CAA)は胸部X線写真VLMの肺炎分類をモデル重量を更新することなく改善することができる。
3本の凍結胸部X線写真がKermany 肺炎検体で評価された。
CAAは微調整なしで予測スコア分布と動作特性を実質的に変化させた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Inference-time engineering can alter model behavior without fine-tuning. However, its utility for improving diagnostic performance in medical vision-language models (VLMs) remains unclear. We aim to evaluate whether Contrastive Activation Addition (CAA) can improve pneumonia classification in chest radiograph VLMs without updating model weights. Three frozen chest radiograph VLMs (MedGemma-4B-IT, NV-Reason-CXR-3B, and CheXOne-3B) were evaluated on the public Kermany pneumonia test set. Classification was based on the logits of the tokens Yes and No under a binary prompt. Steering vectors included a 30-pair answer-bias control, a 30-pair pneumonia text contrast, and an image-conditioned contrast derived from 30 pneumonia and 30 normal development images. A deterministic 200-image development set was used for layer and scale selection (100 images) and threshold calibration (100 images). Performance was assessed using ROC-AUC, PR-AUC, F1 score, threshold analyses, reverse-vector controls, random-vector controls, and conditional bootstrap confidence intervals. Fixed-threshold F1 improvements were frequently observed but did not consistently indicate improved diagnostic performance. For MedGemma-4B-IT. NV-Reason-CXR-3B showed the strongest benefit: calibrated F1 improved from 0.7692 in the zero-shot setting to 0.8619 with pneumonia-text steering and to 0.8727 with image-conditioned steering. For CheXOne-3B, pneumonia-text steering increased calibrated F1 from 0.8528 to 0.8666, although the confidence interval crossed zero. On this public pneumonia benchmark, CAA substantially altered prediction score distributions and operating characteristics without fine-tuning. Meaningful performance gains were observed in one of three evaluated VLMs, suggesting that activation steering may serve as a lightweight approach for adapting medical VLM behavior.
- Abstract(参考訳): 推論時のエンジニアリングは微調整なしでモデルの振る舞いを変えることができる。
しかし、医用視覚言語モデル(VLM)の診断性能を向上させるための実用性は未だ不明である。
本研究の目的は, 胸部X線写真VLMにおいて, モデル重量を更新することなく, コントラスト活性付加(CAA)が肺炎の分類を改善できるかどうかを評価することである。
3種類の凍結胸部X線写真 (MedGemma-4B-IT, NV-Reason-CXR-3B, CheXOne-3B) をKermany 肺炎検体で評価した。
分類はトークンのロジットに基づいており、YesとNoはバイナリプロンプトの下に置かれる。
ステアリングベクターには、30対の回答バイアスコントロール、30対の肺炎テキストコントラスト、30対の肺炎および30対の正常な発達画像から得られる画像条件コントラストが含まれていた。
階層化とスケール選択(100画像)としきい値のキャリブレーション(100画像)には,決定論的200イメージの開発セットが使用された。
ROC-AUC,PR-AUC,F1スコア,しきい値解析,リバースベクター制御,ランダムベクター制御,条件付きブートストラップ信頼区間を用いて評価を行った。
固定閾値F1の改善はよく見られたが, 常に診断成績は改善しなかった。
MedGemma-4B-IT用。
NV-Reason-CXR-3Bは、ゼロショット設定で0.7692から0.8619に改善され、肺炎テキストステアリングで0.8727に改善された。
CheXOne-3Bでは、信頼区間は0.8528から0.8666に変化したが、肺炎のテキストステアリングは校正されたF1を0.8528から0.8666に増加させた。
この公的肺炎ベンチマークでは,CAAは微調整なしで予測スコア分布と手術特性を著しく変化させた。
3つの評価されたVLMのうちの1つに有意な性能向上が観察され、活性化ステアリングが医療用VLMの動作に適応するための軽量なアプローチである可能性が示唆された。
関連論文リスト
- Explainable Deep Learning for Pediatric Pneumonia Detection in Chest X-Ray Images [0.0]
肺炎は世界中で小児の致死率と死亡率の主要な原因となっている。
本研究は,小児肺炎の自動検出のための2つの最先端畳み込みニューラルネットワーク(CNN)アーキテクチャを比較した。
論文 参考訳(メタデータ) (2026-01-14T19:21:32Z) - Weakly Supervised Pneumonia Localization from Chest X-Rays Using Deep Neural Network and Grad-CAM Explanations [0.0]
本研究は,胸部X線からの肺炎の分類と局在化のための弱教師付き深層学習フレームワークを提案する。
コストのかかるピクセルレベルのアノテーションの代わりに,画像レベルのラベルを用いて臨床的に意味のあるヒートマップを生成する。
論文 参考訳(メタデータ) (2025-11-01T08:44:24Z) - LightPneumoNet: Lightweight Pneumonia Classifier [0.0]
この研究では、スクラッチから構築された効率的で軽量な畳み込みニューラルネットワーク(CNN)であるLightPneumoNetを紹介した。
胸部X線画像5,856枚を用いて実験を行った。
独立テストセットでは,本モデルが優れた性能を示し,総合精度0.942,精度0.92,F1スコア0.96を実現した。
論文 参考訳(メタデータ) (2025-10-13T10:14:17Z) - Does Bigger Mean Better? Comparitive Analysis of CNNs and Biomedical Vision Language Modles in Medical Diagnosis [7.41395379449452]
本稿では、教師付き軽量畳み込みニューラルネットワーク(CNN)とゼロショット医療ビジョンランゲージモデル(VLM)の比較分析を行う。
両症例とも,CNNは競争力の高いベースラインとして機能している。
検証セットの分類閾値を最適化することにより、両方のデータセット間でBiomedCLIPの性能が著しく向上する。
論文 参考訳(メタデータ) (2025-10-01T01:46:09Z) - MOZART: Ensembling Approach for COVID-19 Detection using Chest X-Ray Imagery [0.0]
新型コロナウイルス(COVID-19)が世界的なパンデミックを引き起こし、医療システムに悪影響を及ぼした。
従来の畳み込みニューラルネットワーク(CNN)は印象的な精度を実現している。
ウイルス検出を強化するアンサンブル学習手法であるMOZARTフレームワークを導入する。
論文 参考訳(メタデータ) (2024-10-11T21:02:58Z) - Brain Tumor Classification on MRI in Light of Molecular Markers [56.99710477905796]
1p/19q遺伝子の同時欠失は、低グレードグリオーマの臨床成績と関連している。
本研究の目的は,MRIを用いた畳み込みニューラルネットワークを脳がん検出に活用することである。
論文 参考訳(メタデータ) (2024-09-29T07:04:26Z) - A Federated Learning Framework for Stenosis Detection [70.27581181445329]
本研究は,冠動脈造影画像(CA)の狭窄検出におけるFL(Federated Learning)の使用について検討した。
アンコナのOspedale Riuniti(イタリア)で取得した200人の患者1219枚の画像を含む2施設の異種データセットについて検討した。
データセット2には、文献で利用可能な90人の患者からの7492のシーケンシャルな画像が含まれている。
論文 参考訳(メタデータ) (2023-10-30T11:13:40Z) - Attention-based Saliency Maps Improve Interpretability of Pneumothorax
Classification [52.77024349608834]
視覚変換器(ViT)の胸部X線撮影(CXR)分類性能と注意ベース唾液の解釈可能性について検討する。
ViTは、CheXpert、Chest X-Ray 14、MIMIC CXR、VinBigDataの4つの公開データセットを用いて、肺疾患分類のために微調整された。
ViTsは最先端のCNNと比べてCXR分類AUCに匹敵するものであった。
論文 参考訳(メタデータ) (2023-03-03T12:05:41Z) - Predicting COVID-19 Pneumonia Severity on Chest X-ray with Deep Learning [57.00601760750389]
前頭部胸部X線画像の重症度予測モデルを提案する。
このようなツールは、エスカレーションやケアの非エスカレーションに使用できる新型コロナウイルスの肺感染症の重症度を測定することができる。
論文 参考訳(メタデータ) (2020-05-24T23:13:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。