論文の概要: When Minor Edits Matter: LLM-Driven Prompt Attack for Medical VLM Robustness in Ultrasound
- arxiv url: http://arxiv.org/abs/2603.21047v1
- Date: Sun, 22 Mar 2026 03:58:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:39.208199
- Title: When Minor Edits Matter: LLM-Driven Prompt Attack for Medical VLM Robustness in Ultrasound
- Title(参考訳): 超音波の医療用VLMロバスト性に対するLDM駆動型プロンプトアタック
- Authors: Yasamin Medghalchi, Milad Yazdani, Amirhossein Dabiriaghdam, Moein Heidari, Mojan Izadkhah, Zahra Kavian, Giuseppe Carenini, Lele Wang, Dena Shahriari, Ilker Hacihaliloglu,
- Abstract要約: 超音波を含む医用画像解析において,視覚言語モデル(VLM)は強いマルチモーダル推論能力と競合性能を示した。
Med-VLMは自然言語による命令で動作し、プロンプトの定式化を現実的で実用的に悪用可能な脆弱性点にしている。
本稿では,大規模言語モデル(LLM)を応用したスケーラブルな対数評価フレームワークを提案する。
- 参考スコア(独自算出の注目度): 17.261506344527195
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Ultrasound is widely used in clinical practice due to its portability, cost-effectiveness, safety, and real-time imaging capabilities. However, image acquisition and interpretation remain highly operator dependent, motivating the development of robust AI-assisted analysis methods. Vision-language models (VLMs) have recently demonstrated strong multimodal reasoning capabilities and competitive performance in medical image analysis, including ultrasound. However, emerging evidence highlights significant concerns about their trustworthiness. In particular, adversarial robustness is critical because Med-VLMs operate via natural-language instructions, rendering prompt formulation a realistic and practically exploitable point of vulnerability. Small variations (typos, shorthand, underspecified requests, or ambiguous wording) can meaningfully shift model outputs. We propose a scalable adversarial evaluation framework that leverages a large language model (LLM) to generate clinically plausible adversarial prompt variants via "humanized" rewrites and minimal edits that mimic routine clinical communication. Using ultrasound multiple-choice question answering benchmarks, we systematically assess the vulnerability of SOTA Med-VLMs to these attacks, examine how attacker LLM capacity influences attack success, analyze the relationship between attack success and model confidence, and identify consistent failure patterns across models. Our results highlight realistic robustness gaps that must be addressed for safe clinical translation. Code will be released publicly following the review process.
- Abstract(参考訳): 超音波は移植性、費用対効果、安全性、リアルタイムイメージング能力のために臨床で広く用いられている。
しかし、画像の取得と解釈は依然として演算子に依存しており、堅牢なAI支援分析手法の開発を動機付けている。
超音波を含む医用画像解析において,視覚言語モデル(VLM)は強いマルチモーダル推論能力と競合性能を示した。
しかし、新たな証拠は彼らの信頼性に関する重要な懸念を浮き彫りにしている。
特に、Med-VLMは自然言語命令を介して動作し、プロンプトの定式化は現実的で実用的に悪用可能な脆弱性点である。
小さなバリエーション (typos, shorthand, under specificified request, ambiguous wording) は、モデルの出力を有意にシフトすることができる。
本稿では, 大規模言語モデル(LLM)を活用して, 「人為的」リライトや, 日常的な臨床コミュニケーションを模倣する最小限の編集によって, 臨床的に妥当な逆算式を生成する, スケーラブルな逆算式評価フレームワークを提案する。
超音波多重選択質問応答ベンチマークを用いて、攻撃に対するSOTA Med-VLMの脆弱性を体系的に評価し、攻撃者のLSM能力が攻撃成功に与える影響を調べ、攻撃成功とモデル信頼性の関係を分析し、モデル間の一貫した障害パターンを同定する。
本結果は,安全な臨床翻訳のために対処する必要がある現実的な頑健さのギャップを浮き彫りにするものである。
コードはレビュープロセスの後に公開される。
関連論文リスト
- FT-ARM: Fine-Tuned Agentic Reflection Multimodal Language Model for Pressure Ulcer Severity Classification with Reasoning [2.4095540924689405]
圧力潰瘍(PUs)は重篤かつ一般的な医療上の問題である。
PU重症度(Stages I-IV)の正確な分類は適切な治療に不可欠である。
PU重度分類のためのエージェント自己回帰機構を備えた細調整多モード大言語モデル(MLLM)であるFT-ARMを提案する。
論文 参考訳(メタデータ) (2025-10-28T21:23:32Z) - Exploring Membership Inference Vulnerabilities in Clinical Large Language Models [42.52690697965999]
臨床大言語モデル(LLM)におけるメンバーシップ推論脆弱性の探索的研究について述べる。
最新の臨床質問応答モデルであるLlemrを用いて、標準的損失に基づく攻撃とドメインを動機としたパラフレージングに基づく摂動戦略の両方を評価する。
その結果は、コンテキスト認識、ドメイン固有のプライバシ評価、防衛の継続的な開発を動機付けている。
論文 参考訳(メタデータ) (2025-10-21T14:27:48Z) - Shallow Robustness, Deep Vulnerabilities: Multi-Turn Evaluation of Medical LLMs [9.291589998223696]
MedQA-Followupは,医療質問応答におけるマルチターンロバスト性を評価するためのフレームワークである。
MedQAデータセットの制御介入を用いて、5つの最先端LCMを評価する。
モデルは浅瀬の摂動下では合理的に良好に機能するが、マルチターン設定では深刻な脆弱性が現れる。
論文 参考訳(メタデータ) (2025-10-14T08:04:18Z) - Benchmarking and Mitigate Sycophancy in Medical Vision-Language Models [21.353225217216252]
視覚言語モデルは、しばしば、証拠に基づく推論よりも、社会的手がかりや認識された権威を記述したユーザーとの整合性に優先順位を付ける、幻想的行動を示す。
本研究は, 新規な臨床評価基準を用いて, 医用視覚質問応答における臨床症状について検討した。
論文 参考訳(メタデータ) (2025-09-26T07:02:22Z) - Beyond Benchmarks: Dynamic, Automatic And Systematic Red-Teaming Agents For Trustworthy Medical Language Models [87.66870367661342]
大規模言語モデル(LLM)は、医療におけるAIアプリケーションで使用される。
LLMを継続的にストレステストするレッドチームフレームワークは、4つのセーフティクリティカルなドメインで重大な弱点を明らかにすることができる。
敵エージェントのスイートは、自律的に変化するテストケースに適用され、安全でないトリガー戦略を特定し、評価する。
私たちのフレームワークは、進化可能でスケーラブルで信頼性の高い、次世代の医療AIのセーフガードを提供します。
論文 参考訳(メタデータ) (2025-07-30T08:44:22Z) - Uncertainty-Driven Expert Control: Enhancing the Reliability of Medical Vision-Language Models [52.2001050216955]
既存の方法は、モデル構造を調整したり、高品質なデータで微調整したり、好みの微調整によって、医療ビジョン言語モデル(MedVLM)の性能を向上させることを目的としている。
我々は,MedVLMと臨床専門知識の連携を図るために,Expert-Controlled-Free Guidance (Expert-CFG) という,ループ内のエキスパート・イン・ザ・ループフレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-12T09:03:30Z) - Structured Outputs Enable General-Purpose LLMs to be Medical Experts [50.02627258858336]
大規模言語モデル(LLM)は、しばしばオープンエンドの医学的問題に苦しむ。
本稿では,構造化医療推論を利用した新しいアプローチを提案する。
我々の手法は85.8のファクチュアリティスコアを達成し、微調整されたモデルを上回る。
論文 参考訳(メタデータ) (2025-03-05T05:24:55Z) - LlaMADRS: Prompting Large Language Models for Interview-Based Depression Assessment [75.44934940580112]
LlaMADRSは、オープンソースのLarge Language Models(LLM)を利用して、うつ病の重症度評価を自動化する新しいフレームワークである。
本研究は,クリニカルインタヴューの解釈・スコアリングにおけるモデル指導のために,慎重に設計された手がかりを用いたゼロショットプロンプト戦略を用いている。
実世界における236件のインタビューを対象とし,臨床評価と強い相関性を示した。
論文 参考訳(メタデータ) (2025-01-07T08:49:04Z) - Dr-LLaVA: Visual Instruction Tuning with Symbolic Clinical Grounding [53.629132242389716]
VLM(Vision-Language Models)は、医用画像を分析し、自然言語の相互作用に関与することによって、臨床医を支援する。
VLMはしばしば「幻覚的」な振る舞いを示し、文脈的マルチモーダル情報に基づかないテキスト出力を生成する。
本稿では,臨床推論の象徴的表現を用いて医療知識にVLMを基盤とする新たなアライメントアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-05-29T23:19:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。